甲子光年专访|澜舟科技周明:我不追求AGI,我追求ROI

1,646次阅读
没有评论

甲子光年专访|澜舟科技周明:我不追求AGI,我追求ROI

大模型创业,可不可以小而美?

作者|赵健


GPT-4发布一年后,做“中国版的OpenAI”,已经成为头部大模型创业公司不成文的主流叙事。

这套叙事逻辑中的AI公司往往以AGI作为愿景,在Scaling Law的指引下追求千亿乃至万亿参数的大模型,并以此撬动AI时代的to C生态。这些公司也吸引了绝大多数的投资、人才与聚光灯。

但也有大模型公司尝试“四两拨千斤”,提出一套“反OpenAI”的叙事。澜舟科技就是其中的代表。

澜舟科技创始人兼CEO周明告诉「甲子光年」:“澜舟科技不追求AGI,也不追求超越GPT-4,而是把大模型如何更好地服务客户放在首位,并且计算好ROI。”

在今天追赶OpenAI的氛围下,澜舟科技似乎成为了少数派。

成立于2021年6月的澜舟科技是中国最早做大模型创业的公司之一。那时候,大模型在AI圈都是一个冷门词汇。

澜舟科技创始人兼CEO周明是世界自然语言处理(NLP)领域的领军人物,曾任国际计算语言学学会(ACL)主席、微软亚洲研究院副院长、中国计算机学会副理事长。今年年初,周明当选“2023年度ACL Fellow”,这是NLP领域的最高荣誉。

2020年底,在见证了OpenAI发布的GPT-3惊人的“智力”后,周明判断一个属于AI的大时代要来了。他选择从工作了21年的微软辞职,毅然踏上AI创业之旅。半年之后,在创新工场的塔尖孵化下,澜舟科技正式成立。

凭借周明博士的资深履历,去年硅谷科技媒体The Information也将其领军的澜舟科技评为五家“最有可能成为中国OpenAI的公司”之一。

但澜舟科技并没有对外界讲述一个打造中国版OpenAI的故事,而是选择小而美的“小参数大模型(SLLM,Small LLM)”路线。澜舟科技本周刚刚发布的澜舟孟子GPT大模型,最高参数只有400亿。

澜舟科技并没有着眼于开启AI时代新的互联网革命的to C市场,而是选择了更加非标准化的to B市场。周明坦言,在中国做to B很难,但不得不做难而正确的事。

因为要做to B,大模型成本与客户预期必须找到平衡。如果超出客户预期,一味追求大参数并没有意义。为此,周明还提出了“周明曲线”,将最佳的模型参数范围定在了100亿到1000亿之间。

甲子光年专访|澜舟科技周明:我不追求AGI,我追求ROI

去年,在调研了102家企业之后,澜舟科技找到了“周明曲线”的最佳临界值——400亿。周明认为,400亿大模型能很好地兼顾技术领先性与低成本的需求。

周明认为,大模型有两大流派,一是好奇心驱动的技术信仰派,最终目标是追赶OpenAI,实现AGI;二是以大模型落地与商业化为首要目标的市场信仰派,技术是否领先并不那么重要。

科学家出身的周明也认同Scaling Law,但在落地的时候,并不会一味追求它。因此,周明将澜舟科技定位为技术与应用双轮驱动的“融合派”。

周明判断2024年是大模型落地元年。在他看来,大模型落地过程中,“互联网的七字法则仍然适用:专注、极致、口碑和快,还要再加上成本,形成大模型落地九字法则”。

周明认为,作为创业公司,找到商业模式最重要,而不是一定要追求做出最牛的技术。周明坦言,放眼市场,可能只有他说这一点说得比较多了。

人人都想做OpenAI,但澜舟科技主动选择了“小而美”。这套大模型路线能否成立?

对此,「甲子光年」专访澜舟科技创始人兼CEO周明,来揭秘澜舟科技过去一年大模型的落地探索与背后的思考。

1.谈派别:技术与商业之间的融合派

甲子光年专访|澜舟科技周明:我不追求AGI,我追求ROI

甲子光年:去年被问到为什么中国没有做出ChatGPT,你回答“贫穷限制了想象力”。现在ChatGPT发布一年多,新的技术与产品层出不穷,澜舟科技的想象力有没有变大?

周明:我们去年也比较冷静。去年大模型一出来,我就知道大模型还会出现改良,但突飞猛进会比较难。因为从2017年到去年,也就冒出一个GPT。从去年到现在,虽然有一些改良,但都不是革命性的,Transformer、Multi-head attention(多头注意力机制)架构没有发生变化。

最大的变化是数据,数据量与质量提升,模型层次增加,围绕Scaling Law做工作。我去年也预感到,Scaling Law应该follow,数据更大、模型更大、算力更大,性能就会更好,我们也遵循了。

但我们也考虑了落地。落地的时候不能无限追Scaling Law,因为要考虑成本问题。在to B场景,大模型到底需要多大?我将其总结为“周明曲线”。

我们调研了102家企业后发现,400亿模型就足够了。对于工业界来讲,它能解决80%的应用产品环境。虽然我也可以不计成本把它变成千亿、万亿模型,水平当然会更高,但ROI就小了。既然做公司,那就要算ROI。

甲子光年:你在技术上信仰Scaling Law,但在商业上会更克制?

周明:主要考虑公司的运营成本。大型模型有两种流派——第一种是纯粹的技术派,由好奇心驱动,不计成本。模型参数接近人脑神经元个数,数据更大、算力更大,一点点逼近AGI,再把多模态加进去。这种通常由科学院或者比较有实力的大公司进行。

第二种是实用派,他们使用现有的模型,如开源模型,来解决实际问题,注重实用性和落地性。

甲子光年:澜舟科技是哪一派?

周明:澜舟科技是两者结合派,技术加应用双轮驱动。我们既了解大模型的技术发展趋势,也知道如何在适当的时机应用大模型,并能够利用大型模型的优势来弥补其短期的不足,而不是盲目地使用。当我们在实际应用场景中得到反馈时,这些信息可以帮助我们在下一代模型训练中做得更好。

例如,大型模型的可解释性比较弱,而原先是没有人讨论RAG(Retrieval-Augmented Generation)的,许多本地数据和用户数据无法被纳入模型中。这些都是那些真正从事过模型落地工作的人才会有的深刻体会。

我不排除要去做Scaling Law,但我不会永远做下去。我觉得自己算是理论与实践结合比较准的,但也不能说别人不结合。

甲子光年:目前市场上的公司,技术派、落地派、融合派,哪个更多?

周明:大家关注比较多的肯定是第一类,融资比较多的公司,他们给人的印象是追求大模型的前瞻性能力,或者说追赶OpenAI,解决人类的AGI问题。但更多的人是第二类,只是很少有人关注,有数以千万的人基于开源模型做很多有趣的应用。

把大模型跟实际应用巧妙结合起来,大概国内说的比较多的人就是我了。因为我做过大模型,也做过应用。前者需要持续投入,还可以再投十年,但只要你停下脚步,三个月之内就会从王者跌落神坛,马上有人超越你。

作为一个初创公司,在投资力度有限的情况下,是要非常谨慎的。但如果天天做应用,而不知道未来技术发展轨迹的话,可能会失去一些前进的动力。所以,两者都需要去关注。

2.谈愿景:我们不把AGI当做愿景

甲子光年专访|澜舟科技周明:我不追求AGI,我追求ROI

甲子光年:现在一些大模型公司把AGI当做公司愿景。澜舟科技的愿景是什么?

周明:我们不把AGI当愿景,这是我的性格使然。我个人认为AGI是人类长远的目标,过去人工智能有多少次起伏?每次有点起来的时候,都说AGI越来越近了,比如当年机器翻译刚刚做出点成果,马上有人说,人类不再需要翻译,搞得大家挺恐慌。每次只要科技有点进步,就有人说“人类工作被消灭了”“人类要寻找新的生存空间了”“硅基智能与碳基智能谁更厉害?”等等诸如此类的问题,但每次事情都没有那么大。

甲子光年:是因为“狼来了”的故事听太多了吗?

周明:我的岁数稍微大一点,见过几个人工智能的冬天。但人工智能每次进步,确实离AGI更近了。第一,要乐观看待技术进步,市场离AGI越来越近,就会产生巨大的机会;第二,要冷静一点,我们离真正解决AGI的问题还有很长的路要走,包括杨立昆、张钹院士他们都有这种观点,我也赞同。现在的语言模型、“世界模拟器”Sora,都是用数据驱动的方式向AGI更近了一步,很多人工智能的原理,包括人类智能的原理,还不是很清楚,需要进一步研究。

甲子光年:如果说AGI还是一个长期愿景的话,那澜舟的短期目标是追赶GPT-4吗?

周明:我们也不把什么GPT-4当做目标,我就是站在客户和公益的角度。比如我要做to B,那to B要解决哪些场景?哪些是大模型解决得很好的,哪些是解决不好的?解决不好的如果不是核心场景,我就先容忍;如果是必须跨越的一步,我就着力去解决。做来做去,我这个模型有的地方比GPT-4厉害,有的地方远远不如,但是客户所期待的。我是走这种从实际中倒逼模型发展的路线

甲子光年:总结一下,澜舟科技的目标是什么?

周明:用AI解决千行百业中遇到的一些核心问题,不是零碎的问题。有些问题正好是GPT-4的研发方向,有一些是GPT-4根本没有考虑到的问题,就需要我们加入并提出解决方案。我是以解决问题出发,不会说问题都不看,GPT做啥我就做啥。国内的投资人也好,创业者也好,有的是这么做的(follow GPT),那也没错,也能教育受众。但是我在微软经历过这些事情,我不会被表面的现象所迷惑。

甲子光年:解决这些行业核心问题的本质是什么,降本增效?

周明:一个是解决降本增效,这是已有问题;还有一个是创造一个前所未有的增量市场,原先没有这样的技术,大家觉得这件事没法做。但现在有了这样的技术,我们带着这种技术了解客户需求,创造出所谓的大模型原生应用。这是革命性的变化。再次强调,要想带来大模型与大模型原生应用,技术与用户场景两个必须都懂。

3.谈融资:不担心估值比同行低

甲子光年专访|澜舟科技周明:我不追求AGI,我追求ROI

甲子光年:去年大模型火了之后,你最开始做to B的想法有动摇过吗?融资、投入可不可以更激进一点?

周明:从我的本心来说没有动摇。融资上不同的公司会有不同的表述。有的人明明不信任OpenAI,但他就宣称自己是中国的OpenAI。我们一直坚持说理论与实践结合,坚持to B为主,to C为辅,我认为这比较符合中国目前的国情,但不排除有人追赶OpenAI,也是一个非常重要的努力;或者有人就拿开源模型做应用,也有意义。创业各有千秋,取决于你自己的判断

甲子光年:去年The Information也评价澜舟科技是5家“最有可能成为中国OpenAI的公司”之一。

周明:受宠若惊。我们做的也没那么好,其他上榜的也不一定能走多远,大家属于刚刚开始。

甲子光年:如果澜舟科技融资了很多钱,现在会做出不一样的决策吗?比如会不会做Sora那样的视频模型?

周明:我会有轻重一些。比如大模型的一些短板,我会尽早布局,而不一定等OpenAI做出来我们再做。但投资额度小的话,会更多地先了解别人,会用就行。看你的投资额度,每个公司都应该有自己的判断。

初创型的公司肯定是有聚焦的。我们只聚焦在语言理解,而多模态涉及的则相对较少,多模态领域原来做视频和图像的涉及会比较多。我们就是做语言模型,以及提升语言模型能力的Long context(长文本)、RAG等技术。我们的“一横N纵”的“N纵”,就是各种语言模型的能力,包括信息抽取、信息检索、翻译、问答、写作等。

甲子光年:从融资的角度来说,澜舟科技不在第一梯队,还没到独角兽的级别。怎么看待这件事?

周明:首先恭喜融资比较多的大模型公司,他们做了不错的努力。我们这边因为讲究大模型的落地,融资的需求会从实际出发。另外,我本人的创业理念就是不喜欢去套热钱,融资的节奏和力度要跟公司现在的发展和未来一两年的发展匹配,否则会背上一个很大的包袱。

融资多和少是需要理性判断的,如果未来做大需要快速复制,就需要很大的投资。每个人有不同的判断,切忌盲目抬高估值。

甲子光年:你担心在投资人心中,澜舟科技的想象空间更小吗?

周明:的确会这样,但我正是有意而为之。我们不是随波逐流的,而是以终为始,坚持客户与市场的需求。

甲子光年:现在的融资节奏符合你的预期吗?

周明:我们的融资节奏很清晰。去年年初融资了一个亿左右,对于我们这样的团队,足以支撑我们几年的发展。我们自己又有落地项目,还有一些收入。我希望我们的造血能力能够发展起来。我们融资时刻都是开放的,讲究的是小步快跑,不讲究非要融多少多少钱。

我们融资的目的很清晰,就是支撑一些新的业务发展,比如我们的商业化元年,要组建商业化团队,需要资本来支撑一些事。我们有一些新的技术,比如客户对大模型的期待,比如可解释性、大模型的评测,从分析到生成的能力,RAG如何做的更好等,这需要投入一些研发资源。

甲子光年:融资更多才会有资源来投入一些最前沿技术的研发。

周明:世界上最头部的科研问题,应该由创业公司来做?还是应该由科学院或学校来做?我对此有不同意见。我认为,创业公司最重要的事情,是把商业模式做出来,而不发明一个最牛的技术。从历史上看,施乐发明了很多东西,没一个能落地的,但微软把那些技术很好地用来起才成就了微软。

所以我觉得以终为始,从客户和社会需求角度,把现有东西能够最好地巧妙用起来,不排除你可以去收购或合作,也不排除自己成立一些研究部门,但一开始不要轻易地把所有压力都压在核心技术开发,才成立一个伟大的公司,这可能有难度。

甲子光年:OpenAI也是创业公司,它在引领这一轮AI浪潮。

周明:现在这一轮AI竞争还没有结束,未来是什么样也不好说。未来我觉得一个有资源、有场景和应用、商业模式清晰、把大模型跟自己的业务结合的非常好的公司,最后赢得可能性会更高。OpenAI是因为跟微软结合,等于微软弥补了很大的短板。

甲子光年:现在很多AI人才会奔着瞄向AGI的大模型公司,澜舟科技在人才方面,会不会相对缺乏吸引力?

周明:人才也各种各样。有想做AGI的,有想解决问题的。如果你是想做AGI的,想推数学公式,那我们肯定不是这个方向,也不是我的初衷。我在微软亚洲研究院担任副院长的时候是这样的,但现在做AI to B的创业,我们更吸引那种拿最新的技术来解决人类问题的人才,而不是说非要发明新的技术。

4.谈落地:今年才是大模型落地元年

甲子光年专访|澜舟科技周明:我不追求AGI,我追求ROI

甲子光年:你一开始创业为什么想做to B,而不是to C?

周明:第一是我对中国的理解。中国过去几十年企业的智能化水平相对来说比较薄弱,之前国家号召大家去做大数据平台、数字化等方向,但智能化的水平在各行各业都还比较薄弱。我认为站在国家的方向上看,to B会比较有机会。

第二,在经过20多年互联网高速发展后的今天,大模型to C的机会我认为很少。To C在没有大模型的时候都有王者了,有了大模型,这些公司不会掉以轻心,把大模型拿过来就到位了。

现在的问题是,你有没有本事创造新的to C问题,但to C在国家跟国家、民族跟民族各地都相似,非常难创造出一个别人没想到你想到的新的to C场景,有很多的用户基础非常重要。再加上中国to C的付费意愿都比较低,未来大厂对你会有碾压的可能性。假设你费了很大的劲做了一个to C应用,大厂也不会闲着,它有技术、有能力、有资金,很快就免费把它做出来。

至少对我来讲,to C的创业机会是很小的。To B既然符合国家长期战略,大厂做的难度也比较大,因此创业团队会更有机会。基于这些考虑,我选择了这个领域。

甲子光年:To C是不是更适合年轻的创业者?

周明:To C永远都是年轻人而不是老年人的。年轻人有敏锐的视角观察,也有自己的体验,更有可能创造出新的to C场景。

甲子光年:但在中国做to B,实际上也不好做,SaaS行业就是一个典型的案例。

周明:中国长期看to B是有道理的,短期很难。中国to B各个公司对自己的数据要求比较严格,所有都不喜欢走API或者SaaS。To B也需要打单,需要去交付,这些成本都相对比较高,周期也比较长。

但我对to B长期是看好的,你可能第一个单子或前几个单子是很辛苦,但是你一旦通过打单,你提升了自己的服务能力和标准化水平,那后面的单子就能更加高效得来实施了,形成规模化,提供标准的产品和服务。但前提是你自己要走出来。

我坚信没有一件容易的事情。现在在中国创业你只能去选择那种难而正确的事情。

甲子光年:去年澜舟科技做出一个判断,to B行业的价值会在2024年上半年体现。为什么不是2023年?

周明:去年大模型刚出来,央国企大厂都在观望。假设有开源了,他们自己去试一试到底有没有用,哪些地方会有用,心里清楚之后沉淀一下,在内部形成一个共识,要不要往大模型方向走?

经过一年时间的尝试我们判断是够了,央国企在2024年应该会下场。下场就是要拨出一部分预算来做一些行动。你看投资委报告、政府工作报告,都在鼓励央国企大厂考虑人工智能+的问题了。诸如此类的信息告诉我们,2024年应该是大模型落地的元年。

当然元年不代表爆发年,只是代表大家开始行动了,开始做预算了,开始跟你接触了。什么时候爆发?怎么也要花两三年的工作培育这个市场,包括有些技术更加完善、交付的过程更加标准。

甲子光年:最近跟客户接触最直观的感受是什么?

周明:去年的客户找我们主要是做咨询,但没有诚意要成单。今年找我们确实业务有需求,他的同行,或者上级单位已经做了某些大模型的应用,现在来找我们是有诚意的。但也不是一窝蜂的来,金融客户比较多,其他行业相对少。

甲子光年:业务咨询是付费的吗?

周明:我们做咨询都是免费。一是我们觉得咨询就是建立客户认知,也赢得客户;第二客户也是这么认为,他认为你是这个领域的公司,我们不懂跟你了解,也许日后会形成合作伙伴。

5.谈客户:如何建立标杆客户

甲子光年专访|澜舟科技周明:我不追求AGI,我追求ROI

甲子光年:澜舟科技曾表示,“大模型落地商业化,标杆客户是关键”。澜舟科技是如何树立标杆客户的?

周明:比如传神语联,曾经是中国和亚洲最大的人工智能翻译网络公司,原来是靠人工翻译,后来在我们的预训练模型,以及现在的大模型基础上做翻译系统,几乎达到人类翻译的水平。现在再把订单发给具体的翻译工作人员的时候,先通过模型翻译,人再检查一遍,这样就能大幅度提升效率。这是在翻译领域的一个标杆客户。此外还有华为、中金,提升他们翻译的能力。还有投研领域的同花顺,用孟子大模型来改进他的投研系统的能力。

甲子光年:当时的合作是如何达成的?当时也会遇到成本、信任度的问题。

周明:当然感谢人家对我们的信任,更重要的是人家看到我们的技术,虽然我们是一家初创公司,但技术一开始就是讲究应用怎么做,不去讲那些高大上的概念,我们做的比较实际,把水平提升到一定程度,能在业务场景用起来。

甲子光年:怎么看待大模型成本过高的问题?

周明:去年5月份之前卖一个大模型,能卖上千万,但对于很多客户来说这是不可接受的。客户对于大模型的期待成本接近于零,你跟客户讲你训练大模型花了多少成本是没有意义的,客户不接受成本定价。客户能接受的是,你这个大模型能提供什么样的功能,至于背后的大模型技术,对客户是无感的,还是要把产品、用户体验做好。

首先,模型本身的成本要降下来;第二,要从模型走向产品,而不是去兜售模型本身;第三要考虑用户的接受度,与其最后一公里业务场景相Match。这三件事我认为很多大模型团队都没有做。

甲子光年:跟这样的B端大客户,主要就是聊这三件事吗?

周明:对,这些都不是在追赶OpenAI时能够体会到的。我们既要仰望星空,把技术做到一定水平;又要脚踏实地,把客户很好地对接,才能真正解决问题。现在有的人走向了极端,就觉得有高举高打的技术,觉得客户拿去用就好使,这在中国肯定很难。它可以吸引一段时间的投资,但要落地总要走这样一种方式。

甲子光年:如果一家千亿模型的公司来做to B,跟澜舟相比会不会更有优势?

周明:优势很清楚,因为他能做千亿模型,技术、品牌都是不错的。但劣势是,他这些人愿不愿意躬身入局,把所有客户的事情了解特别清楚?因为这件事的ROI对他来说并不高。因为ROI不高,他有可能基于各种理由不去做,从而也就失去了一些跟客户对接的机会。这件事儿本身没有对错,就是企业基因决定的。

甲子光年:开源的Llama2有700亿参数,客户为什么不直接用开源模型?

周明:如果客户是一个小应用,自己用开源做一做就够了。但要是大的应用,还是喜欢找一些专业的公司合作,他会觉得专业公司能把一些核心问题做出来,并有一定的前瞻性。而且他也希望这样的公司未来持续给他维护。

甲子光年:什么是小的应用?什么是大的应用?

周明:比如小的文本分类、小的信息抽取,用户找不找你都没有什么意义,钱很少,而且他也不想花那个钱;大的应用,比如搜索翻译,文档理解等,用户自己很难做好,这种订单也相对比较大,我们也愿意多做,也是我们发力的方向。

甲子光年:如果做to B,数据飞轮如何形成?因为to B的客户更倾向于私有化部署,数据留在客户侧,这样模型层与用户层就无法“握手”。

周明:在中国做to B,数据飞轮某种意义上是无解的,也就不要去追求它。你能做的就是两件事,一是大模型的预训练数据足够广泛,二是做RAG,把这两件事做好,在to B行业就能解决问题了。做to C要有数据飞轮,但to B很难。

甲子光年:谷歌近期发布的Gemini 1.5 Pro,有100万token上下文。有人说上下文足够长之后,RAG不存在了,你认同吗

周明:思路不一样。RAG的出现是因为很多用户不想把数据训在模型里,既有保密问题,又想保持灵活度(RAG可以灵活地更换数据)。谷歌的思路是允许用户上传一个长文本来替代RAG,从技术上来说是有可能的,但实际上真有这么大的必要吗?

我觉得RAG更灵活,而且还要考虑成本。谷歌也好,其他大模型也好,从input token到output token,上传这么大的文本是要算钱的。在云上部署的时候可能会省略掉一些本地部署的成本,但是还要考虑用户是否愿意把自己特别敏感的数据放在云上,并形成它的长文本的一部分。至少在中国,很多用户是会担心的。

甲子光年:RAG就是做本地部署吗?

周明:RAG是在本地部署,在本地把模型与用户数据连接;谷歌等于在云上,需要用户上传PDF文档,就不需要做RAG了。这两个也不能说是替代关系,等于用户多了一个选择。

6.谈金融:是普遍场景,但不一定赚钱

甲子光年专访|澜舟科技周明:我不追求AGI,我追求ROI

甲子光年:澜舟科技为什么聚焦在金融领域?

周明:金融对于国民经济非常重要,它还有一些客观的优势:一是金融数据比其他领域多;二是金融领域历来对人工智能比较热情,从CV阶段,到现在大模型的落地;三是金融领域预算比较充实。金融公司都有自己很大的团队,就是要解决它的刚需问题。

金融领域是大模型落地的一个普遍场景,但是不是最有利润的场景?不好说,因为金融大模型的利润比较单薄,成单时间比较久,预算可能做一年半年,交付在做一年半年。从商业的角度来说,大家要谨慎。

我们更多把金融当成一个打磨标杆的过程,这个过程会形成标准化的应用,在其他领域落地。

甲子光年:以金融行业模型为例,是直接通过预训练来做,还是在一个通用模型上加金融行业数据做微调?

周明:取决于你对数据的掌握。假设你的金融数据足够强,那就在通用模型基础上加金融数据做continue train,当预训练,把金融模型做出来;假如你的金融数据没有那么多,再加上你的通用模型很不错了,那就在通用模型基础上加点SFT。这个取决于你手里有多大的资源。

甲子光年:哪一种方式效果更好?

周明:不好说。站在用户场景上来讲,如果场景单一的话,SFT肯定就很简单,甚至连SFT都不用,context learning 就可以;但如果场景足够大、数据量足够大,预训练数据不用就可惜的话,还是应该训一个行业模型。背后还是成本问题。

甲子光年:你更倾向于做哪一类客户?从头预训练做行业模型,可复制性大不大?

周明:首先站在公司收益角度,哪个收益大,就更应该做哪个。个别单子订单很大,但用户用途很窄,这不一定是公司的首选。有些用户用途很广,但客户没什么钱,我们也不想从他这非要挣多少钱,只是想做一个场景实验形成一个案例。这个还是case by case。

7.谈商业模式:如何避免项目制陷阱

甲子光年专访|澜舟科技周明:我不追求AGI,我追求ROI

甲子光年:做to B的一个核心问题,包括以前的AI四小龙也遇到类似问题,就是如何避免做成项目制,因为很难规模化复制,利润很低甚至亏损。澜舟科技如何做的?

周明:首先要承认这件事的难度,我们能做的就是标准化的程度。澜舟科技发布的“一横N纵”产品体系,就是从用户的需求中提炼出最精华的、占据80%场景的需求。那么剩下20%的需求,标准化程度低或者难度太大,我们就不去碰。

这样能做到标准化。第一个客户可能要打磨做技术储备,但以后形成标准化之后,后面越来越多的客户只需要上传数据或者跟我们配合做本地部署,就能马上看到效果.

我们希望通过大模型时代提高成单和交付的效率。如果这个效率解决了,to B还是很有机会的。

甲子光年:一横N纵的具体产品体系是怎样的?

周明:一横首先有两个标准的通用大模型,一个13B,一个40B,有三个垂直模型——金融大模型、编程大模型,以及其他行业的垂直模型;N纵是一些具体场景的能力,包括文档理解、文档问答、文档写作、机器翻译、会议分析、文档检索等能力。

甲子光年专访|澜舟科技周明:我不追求AGI,我追求ROI

此外,横是可以替换的。比如我们现在用的金融大模型,突然有一天我们要做体育领域,我们自己没有这个模型,但合作伙伴有,我能马上把合作伙伴的模型接入进来。

(本周的发布会上澜舟科技宣布与零一万物达成合作,零一万物即将在近期发布千亿级别的基础大模型,可以作为澜舟科技“一横”的合作伙伴。两家公司都是创新工场塔尖孵化的公司)

甲子光年:一横N纵的产品思路是怎么形成的?

周明:最早是去年形成的。去年我们在考虑大模型落地时总是遇到一种困惑,就是每次跟客户讲,你看我们这大模型有很多技术,你想做投研、想做翻译都能做,通过聊天的方式写出来就能解决。

客户却觉得这太费劲了,他说面对你的孟子大模型,第一,我不知道它有啥能力,也不知道怎么去试;第二,我心里只需要你做一件事,可是你给我整出这么多选择。你就告诉我这是个翻译系统、这是个搜索系统,别告诉我这是一个大模型技术好不好?

我一下受到启发。大模型不是用户的中台,用户不太关心也不想了解大模型。其次,Chat不是用户的常态,它是教育受众的一种手段,而用户的场景都是很具体的业务模式。于是,我把业务底层用的核心技术一个一个找出来,分一下类就发现,N纵的技术几乎支持了80%的业务场景。

一横是给自己看的,等我把这个技术一个个做好了,跟客户讲起来也容易。你要做搜索,我们有搜索;你要做翻译,我们有翻译。而不是你要做搜索,我给你个大模型去玩玩,这是一个用客户语言跟客户对齐的方式,内部研发人员也对齐了。这样也提高了我们跟用户谈单、订单与交付的效率。

甲子光年:这件事具体是什么时候开始做的?

周明:我是去年底彻底想明白了,有了一横N纵的概念。现在很多人在吹捧什么交互式、Chat的方式,我们更多地是走向技术、走向产品,而不是底层的核心模型。

甲子光年:这次发布的是孟子GPT大模型,但实际上孟子大模型也保留了BERT、T5等路线。为什么是这种选择?

周明:都是按照客户需求,从落地角度也不存在GPT就能大一统。比如说,用一个BERT的小模型就能解决的小需求,为什么非要搞一个大模型?站在用户的角度,用户需要什么模型我就提供什么模型。

甲子光年:即使是做to B,行业也有不同的做法。比如智谱AI就自己不做行业模型,只专注在通用模型,最后一公里交给合作伙伴。而澜舟科技是自己做行业模型,为什么会这样?

周明:我们是兼容的,也有合作伙伴拿我们的模型去改造,对接客户需求。但我觉得在合作伙伴成功之前,自己要成功。你的模型水平到底多高,能不能用起来?所以我们是先走示范工程、标杆客户,重要的场景先自己做一遍,做完了再去告诉合作伙伴,遇到这种情况这么做,遇到那种情况那么做,使得整个过程非常流畅。

甲子光年:现在还在示范工程阶段吗?

周明:现在做示范工程做的比较努力,合作伙伴也在寻找,这个过程中也有合作伙伴,但是没有铺开。现在市场上还没有多少模型能做到这一点,主要是模型水平不够。有很多地方合作伙伴既要懂模型,还要懂场景,对合作伙伴也很难。

大家现在对大模型有一点误区,觉得大模型现在的水平啥都好使。你要真去做to B的话,真干啥都不好使。

甲子光年:干啥都不好使?

周明:差距很大,我们做技术的人有时候不愿意说太多,技术没有到吹成神话的地步。这时候要对接用户场景怎么办?运用之妙,存乎一心,巧妙地把大模型的长处用起来,大模型的短处克服掉,才能解决场景问题。太理想主义,至少还不是今天,至少还需要一定的时间。

甲子光年:这个时间还要多久?达到比较理想的好用的状态。

周明:要有一个top down和bottom up的过程。我们做大模型的人要让用户一点点接受,用户再反馈给我们,对大模型做相应的修正,甚至加一些中间层,使得大模型能够过渡到一种理想的状态,这正是我们提出L1、L2、L3、L4(孟子通用大模型、行业大模型、场景任务大模型、AI Agent)的分级,从大模型一点点到行业、客户场景与产品。从top down走到bottom up,走两三个来回,大模型就算走通了,现在还没有。

甲子光年专访|澜舟科技周明:我不追求AGI,我追求ROI

甲子光年:现在走完一个来回了吗?

周明:我们大模型团队在往下走,用户在往上走,中间“握手”的部分,还差点意思。

甲子光年:澜舟科技的商业化进展如何

周明:我们团队是把今年当做商业化的元年,我们也组建了相应的营销、售前队伍。去年一些业务员会去拿单,但不是为了挣钱。今年我认为大家还是要抱着谨慎乐观的态度,因为市场刚起来,客户认知建设还没有做很好,所以需要创业团队有点耐心去了解客户需求,走通商业化的全路径。

甲子光年:有设定目标数字吗?

周明:今年我们希望能走通所有环节,在金融领域做深做透。我们并没有挣多少钱的严格的目标,还需要更多地了解市场需求。

甲子光年:澜舟科技最终要做成一家什么样的公司?

周明:目标是建立一家更有效率的、盈利的智能生产力公司。

|查看原报道可点击“阅读原文”

甲子光年专访|澜舟科技周明:我不追求AGI,我追求ROI

澜舟科技官方网站

https://langboat.com

获奖与新闻

澜舟科技获批北京市专精特新中小企业

澜舟科技完成信通院“可信AI”评估

澜舟科技完成Pre-A+轮融资

HICOOL 2021创业大赛一等奖 | 周明博士专访

最新合作相关新华智云 | 相关中国联通相关华夏基金 | 相关同花顺参与人数中文在线参与人数说故事  

技术专栏一览

辅助创作引擎|搜索引擎技术  

自动摘要生成|机器翻译技术  

孟子模型开源|孟子技术解读  

认知智能平台|熊猫小说家  



长期招贤纳士(含实习)

工程岗  |  研究算法岗  |  产品岗


孟子开源社区微信群甲子光年专访|澜舟科技周明:我不追求AGI,我追求ROI

开源项目地址

https://s.langboat.com/mengzi

期待您的关注与加入:)

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2024 年 3 月
 123
45678910
11121314151617
18192021222324
25262728293031
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议 梦晨 2025-12-11 15:33:51 来源:量子位 A...
商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1 十三 2025-12-15 14:13:14 ...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了 衡宇 2025-12-10 12:3...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案

戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案

戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案 十三 2025-12-10 1...
九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局

九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局

九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局 量子位的朋友们 2025-12-10 18:...
乐奇Rokid这一年,一路狂飙不回头

乐奇Rokid这一年,一路狂飙不回头

乐奇Rokid这一年,一路狂飙不回头 梦瑶 2025-12-10 20:41:15 来源:量子位 梦瑶 发自 ...