澜舟科技李京梅:大模型面向B端落地要与服务企业共同探求平衡

598次阅读
没有评论

澜舟科技李京梅:大模型面向B端落地要与服务企业共同探求平衡2023年10月26日,界面新闻“2023界面 REAL 科技大会”在北京成功举行。澜舟科技合伙人&首席产品官李京梅受邀参加AGI 时代,如何连接科学技术商业》主题圆桌。光源资本董事总经理娄洋受邀出席并主持,与绿洲资本创始合伙人张津剑、趣丸网络副总裁庄明浩、清华大学航天航空学院副教授眭亚楠一起,探讨 AGI 时代创业者和投资人如何熨平技术与商业之间的褶皱以及新技术浪潮带来何种新机遇的热点问题澜舟科技李京梅:大模型面向B端落地要与服务企业共同探求平衡澜舟科技李京梅:大模型面向B端落地要与服务企业共同探求平衡澜舟科技李京梅:大模型面向B端落地要与服务企业共同探求平衡

以下内容根据圆桌对话整理:
澜舟科技李京梅:大模型面向B端落地要与服务企业共同探求平衡由大模型引领的 AGI 浪潮才刚刚开始,各位认为这一技术革命将会为社会经济、企业经营管理、个人生活带来哪些影响?它在人类社会发展会扮演着多重要的作用?它与之前的 AI 又有什么不同?

澜舟科技李京梅:大模型面向B端落地要与服务企业共同探求平衡上一次 AI 浪潮到来的时候,它能够下棋、能够自动驾驶等等,但这个世界上并不是所有人都是专业的棋手,所以我们的对它的认知是它很厉害。但这一次 AI 浪潮来临的时候,大家发现它可以写文件、写邮件、做 PPT、给出营销方案、总结会议记录,它开始进入到普通人每天的工作生活场景,所以自然而然地引发了更广泛的关注跟讨论,这是过去这段时间 AGI 能够引发浪潮的原因。
澜舟科技李京梅:大模型面向B端落地要与服务企业共同探求平衡我觉得 AGI 的想象空间很大,大家对 AGI 可以改变的事情还是低估了。瓦特是在1763年接到改良蒸汽机的订单,他其实用了整整27年的时间到1790年才完成,蒸汽机才能真正地被大规模使用,在之后的150年改变了人类文明的历史,成为整个工业革命的开端。不仅仅是在特定的产业,工业革命重塑了社会结构,才有了生产力、商品、流通、消费品等等概念。
如今 AI 大模型所提供的通用化和泛化的能力,有可能在很短的时间内完成人类通过脑力完成的工作。那这一次革命可带来的影响会远远大于工业革命。今天我们在 AI 和 AI 技术的发展里面看到了这样一丝可能性,所以我们非常积极,我们也期待有更多的人一起参与和探讨,来推动它方方面面的发展。因为未来 AI 会成为我们生活中每一个人都必须要面对和交流的一项技术,就像今天的人与机器一样,所以这是我们积极推动的一个最原始的动力。
澜舟科技李京梅:大模型面向B端落地要与服务企业共同探求平衡首先这个时代我觉得是非常令人兴奋的,我在两年前选择创业加入到澜舟,专门选择了 NLP 自然语言这个领域,也被称为人工智能领域的皇冠上的明珠,来加入一家 AI 原生公司。从最早的信息化和数据化到今天的智能化,从原生这个角度有过数字原生、云原生再到 AI 原生或者智能原生这样的概念。在今天 AI 原生指的就是以 AI 人工智能为核心来提供技术、产品、服务或者应用的公司。从 NLP 的角度来看,今天不管是普通用户还是像澜舟这样的 To B 大模型企业,人和信息、数据或者人工智能系统都是用自然语言去交互的,这是大模型时代与之前特别不同的一个标志。人与大模型可以用对话和文字交流的方式来沟通,这是一个非常大的一个改变。
澜舟科技李京梅:大模型面向B端落地要与服务企业共同探求平衡其实大语言模型的发展速度还是很令我意外的。GPT 3 已经可以完成像智能客服、简单编程等一些处理工作,但在语言的高级理解和信息处理上还存在着不小的差距。去年11月份发布了 ChatGPT,随着语言处理基础方法、强化学习、人给予的反馈等等因素一起作用,它的高等级理解判断能力和交互能力实现了飞跃式的提升。
从学术研究的角度上来讲,它未来的发展速度有多快是很难预估的,但至少从 GPT 3 到 ChatGPT 的提升以及 ChatGPT 表现出的可用性来讲已经很大程度上超越了我们此前的预期。今天来看,自然语言处理领域的研究者,在2021、2022年以前可能很少会用强化学习来作为自然语言处理的一个重要因素乃至核心因素。但现在强化学习开始成为自然语言处理大模型里面的一个重要组成部分,新技术加入也会使得大语言模型能力进一步飞跃。
澜舟科技李京梅:大模型面向B端落地要与服务企业共同探求平衡感谢各位的分享。我们看到绿洲在本轮 AGI 热潮中的布局是非常积极乃至激进的,想请张总分享下这背后的投资理念是什么?特别是在当前全球资本市场相对较差这样的大环境下积极出手的考量是什么?
澜舟科技李京梅:大模型面向B端落地要与服务企业共同探求平衡就 AI 本身来讲,我们现在在进入一个新的算力平台竞争的阶段。从个人电脑时代开始 CPU 是核心的算力组成部分,随着算力需求的提升出现了云服务,把所有的算力集合起来再对外提供。GPU 作为算力核心并没有形成新一代的算力平台。但2018年 Transformer 结构让大家突然意识到我们需要更多算力,在今天所有人在探讨的问题是算力不够,有越来越多的人把 GPU 结合在一起变成新的终端服务。所以我们认为今天正在推动的是一个新生态的建设,这个新生态的底层算力平台已经发生了根本性的改变,在这之中无论是更底层的 Infra,还是更上游的 agent,我们今天都在积极去布局。我们认为只要在这个生态中能够活过十年的公司都会成为一个伟大的公司。
2006年到2018年的12年间,投资互联网公司的回报率中位数是40倍,而今天凡是有能力的公司都在买显卡、建立自己的云化平台。接下来 GPU 云化核心的12年甚至6年时间,这些公司的投资回报率中位数一定会超过40倍。所以在这个大的算力平台浪潮中应运而生的应用和 Infra 产品就会创造超额的回报,这是我们积极参与的原因。
澜舟科技李京梅:大模型面向B端落地要与服务企业共同探求平衡谢谢张总。新的算力平台革命成为下一代浪潮的起点,所以我们迎来了一个“元年”。我们知道算力是影响大模型发展非常重要的一个因素。现在有观点认为,随着大模型参数规模增加,其边际收益会不断收窄。越大的模型、越大的参数需要消耗更大的算力。想请李总来分享一下澜舟在商业化落地过程中是怎么考量模型的规模、功能和成本平衡最优解的?
澜舟科技李京梅:大模型面向B端落地要与服务企业共同探求平衡从 To B 领域的聚焦点来,企业需要的能力比较集中,比如阅读理解、各类写作、多轮对话、代码生成等等,跟 To C 相比更聚焦,从大模型的参数量来看大部分会对应落在百亿到千亿参数量之间。从澜舟的经验来看,如果小于百亿参数量,在 To B 场景很多时候能力还是会略显不足。如果参数量过大到千亿以上,能力一定是更强,但就要抛开成本来讲。
ChatGPT 和 GPT 4 是很明显的大参数量、强能力的代表。但 To B 企业从投入产出比来看,百亿和千亿参数量是比较具备落地性价比的空间。在未来随着 GPU 硬件的发展和大模型训练技术的发展,也就是算力本身和算力资源利用效率的提升,这个合理的模型参数量区间也会总体上变大。面向 B 端落地还是秉承务实理念,在合理区间内和服务企业共同来探求平衡。
澜舟科技李京梅:大模型面向B端落地要与服务企业共同探求平衡好的谢谢。下一个问题是关于趣丸的,我们刚刚聊了 To B 的话题,趣丸也是在大家熟知的游戏、社交的 To C 领域,想问一下庄总目前 AI 技术的进展和落地应用结合情况是怎样的?
澜舟科技李京梅:大模型面向B端落地要与服务企业共同探求平衡首先在 To C 版块可以分为两个细分市场,也就是面向创作者和面向个人用户。创作,可能就是我们常见。面向个人用户的用户是大家期待最高的一个方向。无论是社交还是游戏,回看几十年来的科技发展,这些都是新技术最先被商业化落地的重要场景。但是经过这一年的一些尝试,我认为几乎所有人高估了大模型本身的商业能力,又低估了大模型落地的工程实践过程。
如果我们把大模型比喻成太阳,它提供了绝对强能量的光和热,但是我们不能直接使用,需要建立一个导管把它的能量引导到我们需要的点位。过去一年纯 To C 端的公司大部分的工作是在探索这根导管,比如供给端的游戏美术相关的物料生产、社交方面的广告素材生成等,还有需求端的 AI native 游戏等内部生产环节。但真正意义上供给用户的功能实践,或多或少地在模仿美国公司,目前国内有不少于20家公司在探索社交方向的应用。
从 AI 板块的总体上来看,其实目前都还集中在 To C 应用层,尤其社交游戏这样的娱乐版块,它的运营思路、节奏、打法相对来说是明牌。过去互联网时代中涌现出很多大型公司做出了我们没有想到的场景,这是暗牌,至于能把AI做到我们想不到的体量的那些暗牌,我们还是在持续的观察和摸索。
澜舟科技李京梅:大模型面向B端落地要与服务企业共同探求平衡具身智能也是今年非常火热的概念,一方面想要解决机器人的认知问题和交互问题,另一方面大模型在场景理解、推理等方面展现出的泛化性和通用性越来越强,这些能力在机器人领域也会有应用的场景。想请眭教授分享一下在大模型与机器人结合的过程有什么样的趋势?
澜舟科技李京梅:大模型面向B端落地要与服务企业共同探求平衡我们的研究方向集中在具身智能中如何理解与构建人类神经-肌肉-骨骼动力系统、如何与机器人系统交互、如何具备优良的运动能力等方向。大语言模型和具身智能是有关联、互补性比较强的两个领域。具身智能 Embodied Intelligence 的概念最早来自于哲学思考,认为智能的产生本身是需要一个客体作为智能的承载,然后与环境进行交互,在这个过程中进行学习和提高,进而发展智能。这个概念从哲学领域发展到心理学领域再到认知科学领域,近些年更多地在人工智能领域被认为是一个可行的路线。
现在 AI 从技术层面上已经接近从哲学、心理、认知等等层面上的人的学习过程。大语言模型在帮助解决越来越多的感知问题,现在感知仍然是具身智能研究和转化的前沿。早期的机器人领域感知大量地来自于视觉,所以最近的5到10年间,由于视觉技术的快速提升,机器人领域视觉相关的感知能力也在快速地提升。在接下来的时间里,我们将看到随着语言能力的提升,机器人的控制能力、规划能力也会快速地提升。同时由于大语言模型以及多模态大模型的引入,感知能力会更往上走,那么感知能力的提升结合已有的比较好的一些控制和规划的技术,会看到一些非常有意思的、非常实用的技术产生。
今天我们在自动化工厂里已经实现了非常好的标准化操作,当高层级的感知和规划能够做好的时候,最终机器人的执行一定可以做得很好。所以随着大模型技术和相应的机器人技术、建模技术的发展,机器人实现感知端、控制端、规划端的联合,就可能迎来具身智能从学术界的研究真正变为产业界巨大的新的增长力。
澜舟科技李京梅:大模型面向B端落地要与服务企业共同探求平衡我们见证了大语言模型技术作为源动力之一推动了本轮 AGI 的热潮。有人说语言是人类文明的入口和钥匙,所以 AGI 革命围绕语言技术的创新驱动来展开是非常符合逻辑的。如果我们展开畅想,通向最终的 AGI 通用智能时代还有什么样的引爆点?
澜舟科技李京梅:大模型面向B端落地要与服务企业共同探求平衡从具身智能的领域出发,最近这一年我们看到很多视觉、语言等等技术的发展。从生物进化的角度讲,我们最开始是视觉还有基础的运动能力,然后进化出和环境交互的能力也就是 manipulation,能够操纵使用一些工具来变化环境,在这个之上是语言 language。所以之前很多人认为机器人和环境交互来操纵控制的能力发展会先于语言能力的发展,会率先在学术界和产业界实现好的落地。现在看来语言模型又向前走了一步,那接下来如果操纵的层面能够再往前走的话可能会是一个新增长点。
澜舟科技李京梅:大模型面向B端落地要与服务企业共同探求平衡我觉得可能是多模态大模型。我们的第一觉知是眼睛,我们认为眼见为实。今天的大模型还没有展现出多模态能力,它对视频的阅读和生成能力还有不足。如果在很快的时间里,大模型对视频的理解能力上升一个等级的话,它对这个世界的理解就有了时间维度上的理解,它的常识会进一步的提高。那时我们再谈论 AGI 的时候会发现它的能力提升得非常多,这可能是下一个引爆点。
澜舟科技李京梅:大模型面向B端落地要与服务企业共同探求平衡针对 To B 领域来讲,从技术到真正产生价值不是一个一蹴而就的过程,也难有像 To C 应用领域的某些现象级的超级应用。大模型技术在 To B 端的业务场景中真正产生价值还需要一些时间,我想最早到明年上半年才有可能迎来这个时间点,这要靠技术和应用两端的“双向奔赴”。
澜舟科技李京梅:大模型面向B端落地要与服务企业共同探求平衡感谢各位嘉宾的精彩分享!|可点击“阅读原文”查看原文
澜舟科技李京梅:大模型面向B端落地要与服务企业共同探求平衡

孟子大模型是由澜舟科技研发,面向生成场景的可控大语言模型,能够通过多轮的方式帮助用户完成特定场景中的多种工作任务。

体验网址:https://www.langboat.com/portal/mengzi-gpt

澜舟智会是一款基于孟子大模型面向企业用户的端到端会议内容分析平台产品,可以对用户上传的会议音频和视频进行文字转录和深度智能分析。

体验网址:https://www.langboat.com/portal/minutes

澜舟科技李京梅:大模型面向B端落地要与服务企业共同探求平衡

澜舟科技官方网站

https://langboat.com

获奖与新闻

澜舟科技加入中国信通院可信开源大模型产业推进方阵

澜舟科技成功举办孟子大模型系列及澜舟智会产品发布会

澜舟科技完成Pre-A+轮融资

HICOOL 2021 创业大赛一等奖 | 周明博士专访

最新合作携手新华智云 | 携手潞晨科技携手华夏基金 | 携手同花顺携手中文在线 携手数说故事 

技术专栏一览

辅助创作引擎 | 搜索引擎技术

自动摘要生成 | 机器翻译技术

孟子模型开源 | 孟子技术解读

认知智能平台 | 熊猫小说家



长期招贤纳士(含实习)

工程岗  |  研究算法岗  |  产品岗


孟子开源社区微信群澜舟科技李京梅:大模型面向B端落地要与服务企业共同探求平衡

开源项目地址

https://s.langboat.com/mengzi

期待您的关注与加入 :)

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy