月之暗面 Moonshot AI 是一家神秘且特别的大模型创业公司。
公司目前只发布了一款产品,基于千亿大模型的 chatbot 产品 Kimi Chat。发布之初,就打出了「长文本」、「自研闭源」、「toC」等清晰的标签。
创始人杨植麟饱受期待,他毕业于 CMU,师从苹果 AI 负责人 Ruslan Salakhutdinov,曾在 Meta 和 Google Brain 任职,是 Transformer-XL 与 XLNet 等爆款论文的第一作者。
但在这次直播中,他更多地聊了聊战略、组织、产品和人才等等——除了技术以外,作为创业者需要关注的一切。
- 为什么要下场创业?
- 谁能率先做出大模型时代的 Super App?
-
大模型的产品经理,需要具备怎样的特质?
以下是极客公园创始人 & 总裁张鹏与月之暗面 Moonshot AI 创始人 & CEO 杨植麟的对话,经 Founder Park 编辑。
01
大模型时代,对组织形态提出了新的要求
张鹏:大家都说你们公司有点神秘,尤其这个名字——「月之暗面」,先来给我们揭秘下「月之暗面」这个名字背后有什么讲究?
杨植麟:我们的名字其实来源于一张摇滚专辑,Pink Floyd(摇滚乐队)的《The Dark Side of the Moon》(月之暗面)。因为我们(创始人们)都比较喜欢摇滚,以前也是玩乐队的,今年也刚好有个契机,是月之暗面发行 50 周年。
我们平时看月亮,都只能看到发光的一面,看不到背后,但是你会有一种很强的冲动,想要去探索神秘的月球背面。
这和大模型很相似,你很想去探索一个神秘的、未知的东西。它很难,很有挑战性,同时又可以结合很多摇滚的底层精神,不断地创新,不断地挑战事物已有的形状,去想象接下来可能会是什么样。
我们当时想了各种名字,最终选择了月之暗面和 Moonshot(登月计划)的中英文组合,它可以比较好地去反映我们对于做 AGI 的决心,以及——它或许可以定义,我们是怎样的人。
《The Dark Side of the Moon》是 Pink Floyd 最受好评的专辑,专辑以以疯狂为重点,探讨了冲突、贪婪、时间、死亡和精神疾病等主题|图片来源:Wikipedia
张鹏:我也是 Pink Floyd 的粉丝,从我的角度来看,这张专辑虽然用了个很天文的名字,但本质上讲的东西可能更接近人的潜意识。
杨植麟:对,里面的那个主打的歌曲叫 Brain Damage,讲的就是一个人出现了 hallucination(幻觉)。我们现在就是穿越了 50 年,要去拯救大模型的 hallucination 问题。
张鹏:八卦一下,你原来在乐队里是哪个位置?
杨植麟:原来是鼓手。张鹏:鼓手在乐队里大概是一个什么样的定位?
杨植麟:我觉得是掌握节奏,为整个乐队的演奏提供一个框架。
构建新的组织形式是通往 AGI 的必经之路
张鹏:投身到大模型赛道里。你当时是怎么做出这个决心,并选择要做一个组织来投身其中的?能不能分享下当年的决策逻辑?
杨植麟:我的认知在过去几年里面发生了非常大的变化。
一开始觉得语言模型可能是个工具,可以去提升很多不同场景的效果;第二个阶段,认为语言模型可能对很多任务都有用。后来大家认为语言模型可能成为 AI 唯一的一个(要解决的)问题——所有的问题,都可以通过把语言模型做得更好,把 next token prediction 做得更好来解决。
2018、2019 年,在 Google 开始用几千张卡,基于 Transformer 训练语言模型的时候,过程中会观察到非常多的现象,这些现象进一步提供了更多的证据,证明这条道路是正确的。可能只需要往这个路径一直走下去,然后不断地去寻找更高效的 scale 它的方式,就可以得到一个非常好的结果,能够解决很多以前很难解决的问题——不管是记忆的问题、推理的问题,还是很多常识,甚至是更复杂的多链路问题。
这个经历给了我很深的冲击,或者说创业的铺垫。
2020 年开始,我去找很多机构合作,一起去训练大模型,也是最早在国内训练了很多像盘古、悟道大模型,这个过程也一直在酝酿一个真正的时机。
同时在这个过程中,我也看到很多大模型面对的挑战。这种挑战一方面是来自于技术,另外一方面可能是来自于组织。我们发现,如果你还是用传统的组织结构,对训练大模型来说,可能很难成功。我们今天看到 OpenAI 的成功,本质上,也是因为它的组织做了极大的创新。
所以我觉得之前的经历,可以理解成我一直在寻找一个机会——怎么样能够去从零去建造一个新的组织。我认为这是通往 AGI 的必经之路,它甚至比我们今天接触到的各种细枝末节的技术还要更重要。因为组织是一个更底层的东西,只有你把这个组织做好,才有可能真正地在 AGI 这条路上好好走下去。
去年开始,不管是资本市场,还是人才市场,都发生了极大的变化。在这种情况下,我觉得时机更加成熟,我们有机会去从零搭建一个组织去做这件事。
02
大模型时代的创新很难被规划
底层逻辑变了,做事的方式也要变
张鹏:是什么让你认为组织是一个核心的问题,以至于要利用这个契机去构建这样的组织?
杨植麟:更多的还是实践。
今年之前我们也尝试过很多,用不同的方式,不同的组织。一种就是传统的,在企业内部去做事的方式。还有就是我也参与了一些独立研究机构(的工作);甚至还有其它一些高效的模式。然后就发现这几种不同的模式,其实都很难成为组织上的根本创新。
举个很简单的例子,就是(你)很难用一种规划的方式去创新大模型。如果是在移动互联网时代,我可以规划我接下来要做哪些需求,然后这些需求只要一旦被定义出来,是可以被确定性地生产出来的,基本上很少存在今天这种 APP 突然不知道怎么开发,或者我这个定义了需求,结果没有被实现的情形。因为它是一个确定性的事件,只需要经过人在计算机上用编码让计算机理解,就可以被实现。
但是 AGI 是不一样的,我很难去规划,今天要去完成一个什么样的需求、然后完成到什么程度,因为它是没有办法被硬编码、被规则表示的。AGI 做事情的方式不是这种前置的规划性的创新,而是后置性的,我可能要去试一下才知道。AGI 得有一个底层的机器,它在一个更系统的方式下做很多东西。
这两者是一个 fundamental 的区别。因为你的组织要跟你做事的方式相匹配,当你做事情的底层逻辑发生了变化的时候,就需要新的组织形式。在互联网时代产生了很多非常好的组织,他们可能在某些领域比如跟推荐系统相关的产品都非常擅长,但是有可能在新的时代,会有一些非常擅长 AGI 的组织出现。
我觉得这个是大概率会发生的事情。
张鹏:OpenAI 在你眼里是一个比较好的 AGI 的组织形态的样板吗?它有什么是你觉得对的?有哪些可能也未必是最好的?
杨植麟:首先从结果上来讲,OpenAI 肯定做出了非常大的突破。如果没有这个公司,我觉得可能人类的进程都会不一样。
如果再深入下讨论的话,一个好的组织首先需要很高的人才密度,然后所有人都应该有一个共同的 vision(愿景),能够很高效地聚焦围绕一个目标去做事。我觉得这些点是他们做得非常好的。
但这里面最核心的一个点,也是从外界可能不那么容易看到的一个点,就是当你有了这些前提之后,你怎么样找到一个系统性的方式去做事情。我觉得这个点是所有技术的一个前提条件,也是我们现在可能最想去迭代做得更好的一个点。
张鹏:你说的系统性方式是指它可以被复制、被放大吗?
杨植麟:对。但这里的复制指的是你能把它用在做不同的事情上,它不一定能够复制到别的地方。因为这是你在一个公司里面形成,要复制到别的地方可能很难。但是一个公司可以反复地去利用这个系统去做不同的事情。比如说我今天可以用它去克服长文本的挑战,明天可以去做一个自主的 AI 能力,后天我还能用它去攻坚多模态……
这应该是一个可复用的一个系统,本质上它会沉淀下来,成为你的核心资产。我觉得这应该是每一个 AGI 公司最需要花时间去打磨的一个东西。
Google 的组织涌现出 Transformer,OpenAI 的组织涌现出 ChatGPT
张鹏:以前大家聊 OpenAI 和组织,面对不确定的创新,好像经常会二选一,是 bottom-up 还是 top-down?你在构想这套创新的组织时,是怎么去定义的?
杨植麟:我觉得 top-down 这个大的框架肯定还是适用的,特别是对于大模型来说,有一个 top down 的框架是非常重要的。
Top-down 讲究的其实是 leadership 的 vision,就是你能不能判断什么是对的、要做的事情,然后什么可能是你现在不要做的事情。
AGI 就像登月工程,它是一个需要长时间、很多个人互相耦合的一个巨大的系统,所以这种 top-down 的设计我觉得肯定是非常必要的。
然后在这个框架下面,重要的就是系统能不能把这个事情做好。组织之中会有很多很小的单元,每个单元能在做不同的事情。如果你有一个好的系统,让每个单元都可以很高效地去产出一些东西。最后有一个 top-down 的框架,把这些东西去整合起来。
张鹏:其实某种程度上我感觉你是在一个大框架下,在一个组织里,模拟不同的方向上能否涌现合适的创新,通向那个 AGI 的目标。今天我们无法精准定义哪一条路,因为里边还有大量不确定的东西,所以它是需要一些涌现的。所以这个时候需要组织支持这种涌现,对吧?
杨植麟:是的,我觉得这个是非常好的理解。
比如我们可以去看 Transformer 是怎么产生出来。它本质上是 Google 给这帮人提供了一个涌现的环境。在 Transformer 出现之前,已经存在像注意力机制、残差网络、LayerNome 这样的技术,有 SGD 这些训练的基础配套,然后有 learning rate schedule,就是所有的东西都提前准备好了。
然后这个时候 Google 提供了这样的一个环境,能够让这些人其中自由地去组合,突然涌现就产生了。
但是不同的环境能涌现出来的东西不一样,Google 的环境只能涌现出来一个科学的结果,但是它没有办法涌现出来一个伟大的系统工程——也就是 ChatGPT,这样一个把东西做到极致的同时又在产品上能够精准抓住需求的跨时代作品。因为 Google 的组织跟 ChatGPT 就是不配对的。
OpenAI 其实没有发明任何新的东西,但是它涌现出来了一个工业化的杰作。它结合的东西跟谷歌就不是在同一个维度了。
OpenAI 结合了什么?
1、Transformer 的架构。
2、计算中心,能支持 10 的 25 次方浮点数运算。
3、整个互联网积累了 20 年的数据,这个可能是互联网最大的价值。
所以 OpenAI 看到的是这三个因素,然后它提供了一个环境,使得这三个因素能够被组合起来,那它就涌现出来了一个一个 AGI 的里程碑。
这就是我刚刚讲的,不同的组织会允许涌现出来不同的东西,但你想让它涌现出来什么,你就应该把这个组织往什么方向去调整。
03
AGI 的技术路径已经确定,但产品方向仍然有很多未知
张鹏:上半年有一个流行的说法叫「明牌重注」,意思是 AGI 的技术路径已经是确定的了,接下来只要比拼资源的投入了。你会怎么看?因为从你对组织的看法来看,它还有很多的不确定性。
杨植麟:现在 AGI 的第一性原则是清楚的,就是只要能把无损压缩继续做得更好,就能产生更高程度的甚至超越人类的智能,这个本身是已经有大量的证据证明了。
就像力学三定律之于经典力学一样,大方向已经是基本确定的。
所以「明牌重注」的观点,我认为有一定的合理性。剩下的就是去推演第二个层次的东西,在大的原则下面有一些具体的事情到底应该怎么做。比如说怎么样做一个真正能无损压缩的长的上下文?这个问题它可能就没有那么简单。
我觉得即使是 OpenAI,它也只是做了第一步。后面每一步到底应该怎么做,仍然是存在着一些不确定性。
然后就是技术层面之外,在产品层面上的思考。今天我们离很多科幻电影里展现出来的超级聪明的 AI 其实还有蛮大的差距,并且现在的产品也未必是在往正确的方向发展。
每个时代都会有最伟大的人和次伟大的一些人。最伟大的人去发现正确的第一性原则,但是也会有一批同样很伟大的人。他们可能没有第一个人那么伟大,但是这一批人解决了很多技术的挑战,产品的挑战,甚至商业的挑战。
所以在第二个层面,我能想象它未来肯定是一个巨大的空间,是一个星辰大海。但是这里面具体怎么去玩,我觉得其实还是有挺多的未知和挑战。
Transformer 是新的计算机,上下文长度就是「内存」
张鹏:长文本是月之暗面模型的一个专长。因为像你所说的,其实有非常多的创新方向,那为什么选择了长文本?
杨植麟:首先我觉得其实每个人都应该去问一下自己,你希望这个 AI 未来能帮你做什么事情,或者说人与 AI 应该是一个什么样的关系。然后会发现,在一个很终极的形态下,它相比于今天欠缺了一个很大的能力,就是拥有一个更长的输入窗口。
长的输入窗口和短的输入窗口之间的区别,其实要比我之前想象的更加本质。我认为 AI 一个很终极的形态就是能够跟人建立长期的情绪价值,就是每一个人都可以有一个几乎无限长时间的终身陪伴。
因为时间是一个很重要的维度,只有时间长了之后,你所有的信任、更复杂的情感,以及能够横跨几十年的交互它才会展现出来它的力量,然后这个时候它才有可能给人提供很深刻的精神上的价值。这种情况肯定不能是一个需要每天重启上下文窗口的 AI 可以满足的。
张鹏:就是它明天就忘了你今天干的事,对吧?
杨植麟:对,所以本质上来看,如果说 Transformer 是一个新的计算机,它有两个最重要的维度。一个维度就是参数的数量,决定计算的复杂度,有点像旧式计算机里面的 CPU。另一个维度是上下文长度,它其实是这个新计算机的内存,这个内存决定了你有多少东西能参与计算。
所以在计算足够复杂的情况下,内存越大,能解锁的应用空间就会越大,所以它其实是一个非常本质的东西。如果我们去看过去几十年计算机系统的发展,40、50 年前所有人都觉得 500K 的内存可能就够了,但今天看起来这显然是一个谬论。所以我觉得一样的事情会发生在这个新的计算机系统,而「长文本」作为「新计算机」的「内存」,绝对是一个非常非常重要的东西。
04
闭源路线是为了打造 AGI 时代的 Super App
张鹏:这一波大模型创业里,我们能看到不少开源模型,开源模型也是体现团队能力和生态构建的一部分。Moonshot 是一个闭源模型,而且最近应该也没有开源的计划,想知道你们背后对这件事的思考?
杨植麟:我们是非常支持开源的。
我认为开源和闭源接下来在大模型领域里会是互补的关系,开源可以支持开发者去尝试各种创新的应用,而且在开发过程中可以对数据、训练过程、环境部署等合规性有更高的要求,场景也会更灵活。
而闭源的话,也会有自己的价值,比如说像未来的很多超级应用的入口,不管是生产力端还是娱乐消费端,都会有以闭源为核心的超级应用出现。这两种不同的模型其实是一定程度的互补,而不是冲突的关系,如何取舍其实是看每个公司不同的策略。
我们的策略是希望去打造超级应用,这是我们目前专注的地方,所以会把时间都花在上面。
以终为始,ToC 方向匹配 AGI 的终极目标
张鹏:听起来你们接下来不是要做api或者帮助企业训练自己的大模型落地到他们的业务里,而是要做 toC 的业务。其实在上一波AI浪潮里我们可以看到,没有在 toC 领域里有太多的突破,基本上做的还是 toB 的事情。为什么这一波 AI 里,你们会坚定选择 toC?毕竟,toB 的事情看起来还是至少比较确定能带来收入的。
杨植麟:ToB 我们也不是说完全不做,但主要聚焦和发力的还是 C 端。
对我们来说,这是一个新的技术变革产生的新机会,因为在过去很长一段时间,AI 的技术在 toC 领域还没有任何成功案例。
但我觉得随着新的技术变量的出现,很多 AI 技术可以实现更好的效果,这些更好的效果就可以帮助我们做到之前没有办法做的事情。这些事情可以用新的应用、新的入口的方式呈现出来,收入呈现指数的增长,用户量也在快速增长。
不管是 Midjourney、Character AI 还是 ChatGPT,都在很大程度上证明了 AI Native 的 app 是完全有机会的。
还有就是,既然做 AGI,就要选择与之能匹配的业务模式——强调极高的创新效率,我觉得也只有 toC 的模式才能去完成快速闭环,组织才有可能形成一种快速迭代的文化。以日为单位去更新模型、调整组织和满足用户的诉求,所有东西以数据为核心快速运转。只有在 C 端才有可能产生这样的能量,才有可能与以 AGI 为目标的公司匹配。
这也是我们以始为终地去思考这个事情,我们认为,与 C 端用户共创也是在做 AGI,这可能本身也是一个必要的前提。AGI 不能闭门造车,这里面核心的一个点是数据,如果不跟用户共创,很难有足够高质量的数据,就没办法知道模型真正被用起来之后会产生什么问题,很难跟用户一起去在很多场景里做更深入的挖掘和优化。我甚至觉得,这在很大程度上也是一个必要的前提条件。
张鹏:所以这件事又回到了对于目标的第一性上。如果不去做一个 C 端的 super app,有足够多的用户和数据,其实最终很难去真正实现通向 AGI 的目标。也就是说,不想做 super app 的公司其实不算是 AGI 的信徒。如果你真的要推 AGI 的话,可能需要去做这样一款 toC 的 app,而不是在 toB 领域去解决一些确定性、工程性的问题。
大模型技术让新的 Super App 成为了可能
张鹏:在你看来,Super app 的定义是什么?比如大家会认为微信肯定是 super app,因为用户可以在上面做很多事情,淘宝应该也是一个 super app,因为它有非常大的用户量,能产生很大的价值。
在瞄准 AGI 目标的时候,我们应该如何定义 super app?是应用创造了很大的价值,还是应用背后的思路和以前的定义不一样。
杨植麟:从定义上来说,倒没有特别创新的地方。就是可能实现的价值不太一样,因为能提供以前提供不了的价值,才会有新的入口出现。但最终肯定是要有很多用户、以很高的频率在用,并且在使用的过程中产生很大的价值。另外就是,AGI 本身有一个很好的属性,使得 super app 是有可能的。那就是 AGI 的 G——general,通用人工智能,可以不只是解决一类问题,而是能解决的问题越来越多。
当能解决的问题越来越多的时候,产品边界一直是在拓展的。AI 会逐渐深入到生活的各个方面,应用的价值也会越来越强,也就更符合我们对于 super app 的指标和定义。AGI 的通用性和能成为 super app,这两者是兼容的。
张鹏:我觉得你说了一个非常关键的点。移动互联网时代,我们一般看到的是,一个应用先达到某个规模,然后才去不断拓展服务的边界,逐渐成为通用的应用。但是在新的技术范式下,如果要做一款 super app,是因为先具备了通用的生产力引擎,然后自然而然变成了 super app。这是两个时代引擎驱动的基因的不同,上一个时代大家是跑马圈地,赶紧把规模做起来。现在是因为有技术的引擎作为驱动,天生就具有 super app 的基因。
杨植麟:总结得特别好,补充一点就是,即使技术上很通用,肯定也是要从一部分的场景开始,然后去不断的泛化,而且泛化的速度可能是指数级而不是线性的。
张鹏:今天很流行聊AI Native 的概念,但是好像没有特别精准的定义。以前我们开发产品,一般是有明确的目标下,产品经理、前端、后端彼此配合,按照周期去迭代交付,观察用户数据进行 A/B Test,找到最好的路径。
但今天站在 AGI 的视角,做 super app 的开发,开发范式到底应该是怎么样的?还会是原来的开发形态吗?
杨植麟:产品开发方式会随着底层技术的变化而变化。
移动互联网时代的开发,是有了明确的需求,对应确定的操作和完全确定性的事件。背后对应的是旧式计算机的技术和确定性的编码。这些非常确定的逻辑运算,衍生出各种前端确定性的交互。本质上是基于确定性的 Graphic UI,加上确定性的系统,这是过去二十年看到的互联网产品的开发范式。
但是在今天,技术范式发生了很大的改变。首先是前端变成了对话式的 Conversation UI,未来可能会有越来越多的产品采用这种 UI,后端也被极大程度的统一了,统一到了一个「语言模型」上。这个模型处理的不光是语言,它能处理世界上所有的信息,本质上是对世界上所有信息进行编码和无损压缩。
这两个都确定之后,大部分应用层的产品开发其实都不涉及后端的计算构架或者前端的 Lauguage UI,可能会有一些 GUI 和 LUI 的结合,但整体的构架是被基本确定下来了。
今天所说的大部分的开发,实际上是做中间层的事情,就是数据。交互和模型可能会一样,但用不同的数据,就会出来不同的产品。比如可能是 ChatGPT、Github Copilot 或者 Midjourney,本质上其实没有什么不同,主要是定义的数据不同。
所以我觉得这是极大的范式创新,产品经理越来越多需要想的事情是怎么通过两个数据集去开发一款产品,定义好了数据集,其实产品就定义完成了。一个是训练数据,一个是测试数据,训练数据决定了模型能提供什么能力,测试数据决定了模型的实际可用程度。
以前没有 AI Native 的产品,只有 AI feature,所以这种开发范式还不是很流行,很多强产品 sense 的人,也不一定知道怎么去套这种东西。
但是现在有越来越多的产品需要 AI Native,比如今天想开发一个跟 Character AI 一样的产品,或者在上面做优化,那你就要考虑怎么做优化。如何定义你的两个数据集,可能需要你有很好的数据的生产和处理技术,如何获取数据,以及什么样的数据是有效的等等。
我们需要在不断的探索过程中,把这些流程和开发范式具象化,AGI 的新的开发方式,可能需要一个新的组织形式才有可能做到。
张鹏:说白了,在新的开发范式下去开发产品,需要考虑的是怎么让模型和设定的目标是匹配的,而且要知道怎么训练模型和调试模型。
开源和闭源并不冲突,会长期存在
张鹏:现在大家很多人说开源挺好的,长期来看,开源的技术也会水涨船高,Llama 2 现在可能跟 OpenAI 有差距,但本身基础素质也不错,未来也会有持续的发展。
你现在要做 Super-App,想要运用大模型作为引擎,那我买一个引擎,改一改,是不是也行?未必自己要有一个引擎的专利,一个引擎的团队。我发现你在模型层面是要较劲的,为什么你会认为,必须端到端地做这件事?
杨植麟:基于开源做应用,肯定也有很大的机会,两者(开源和闭源)我觉得并不太冲突。
如果最后是一个超级入口、超级应用,我觉得大概率还是闭源,因为你可以通过闭源去形成产品的差异化,可以从制造模型的第一天,当你规划它长期演进方向的时候,你就有绝对的空间,让你的 App 能够产生非常大的差异化优势。
开源模型做应用,也许不是一个超级入口,但我觉得也有机会做很多增量的价值,更多是产品化的价值,专门的数据,通过微调产生一些人无我有的增量的东西,这也是成立的。
这两者我觉得并不冲突,在生态里面两种路径都会存在。
张鹏:你有一个特别确定的要解决的问题,这个问题用今天的技术也能工程化地解决好,也可以创造价值。如果你想要追求 super app,通向 AGI,那么你的模型就需要跟随应用共同成长,你的数据集、测试集要不断变化,引擎要不断变化,生命力得掌握在自己手里。
杨植麟:没错。而且,很多模型的基础能力,也需要跟市面上的 commodity(行活)有差距,现阶段还处于技术驱动的阶段,通过更好的基座模型,可以转化成产品优势。
但最终肯定不是,比如再过 10 年 20 年,技术上会陷入一种 commoditized(行活化)的情况,那你可能就需要利用先发优势,把壁垒转化为更可持续的壁垒,比如更强的网络效应。
05
新时代产品经理需要具备的素质:快速迭代
张鹏:产品经理很有意思。移动互联网早期真的是靠一波产品经理,想象、定义未来的场景,推动产品落地。之前我跟张小龙在视频号聊过,他开玩笑说,他是古典产品经理了。后来的产品经理,14、15 年之后,越来越多的数据(驱动)型,做 A/B test,但在最早期、蛮荒期是需要一些想象力的。我常说这是一种「神性」,「我对这个事是怎么定义的」,他们可能没有一个完整的逻辑能给所有人都讲通,但是这个想象、设定可能就就是对的。
这种不可知,有点像大模型,不可解释,给你一个结论,是直觉,这个直觉也来自人生经历等等,也是一种无法被反向解释的模型。直到后来就开始变得很科学,赛道确定,做事方法都确定了。
现在你要做 Super App,你肯定很关注产品经理,对于产品经理的要求,现在是要「神性」多一些,还是科学性多一些?
杨植麟:本质上,会在「神性」和系统性之间寻找一个平衡。我个人觉得,长期来看,系统可能会以碾压的方式成为主流的开发范式。但并不是说「神性」就不重要了,只是它需要一个很好的系统作为支撑,或者说,系统应该是主力军。
我经常说一个比喻。张小龙在一张巨大的地图上指了一个点,说在这种一棵树,后来证明他是「神」,因为他指的地方是对的,这棵树长成了巨大的森林。这就是「神性」的体现。一个神枪手,指哪打哪,判断非常准。
但是 AGI 不是这样工作的,比如你想做一个 ChatGPT。引用一个很有名的设计师说过的话,不是根据设计来完成制造,而是通过制造完成设计。(注:日本工业设计大师柳宗理,喜欢先手工制作模型再画设计草图。)
东西做完了,就设计完了,而不是先设计好了,再去做它。设计好了之后再去做,有点像以前的种树,找地方找半天,种一棵树,「我靠成了!」有点这个意思。
现在,不用那么细,大概看一下,「诶,这块地不错」,有个「神枪手」划一块地,AGI 是你的主力军,直接开过去整块推品,这里面有什么机会,哪些地方能种树,都能找出来。
这个过程需要一个系统。有了强大的系统以后,你会发现让很多天赋型、运气型的(产品经理)判断在哪里种树,就像今天几千万、几亿的场景里,选哪些场景比较好?它本身是极其低效的。
在 AGI 时代寻找 PMF 的过程,就应该用 AGI 的方式做,发挥它通用的价值,发挥用户生态的力量,发挥系统的力量。你应该一口气全推过去。我觉得这可能就是与古典的产品经理的做法最大的区别。
张鹏:最开始的时候,直觉更多用在对于问题的定义、目标的选择上,而真正在这个目标上,怎么能更快更好地实现,更多是靠系统。
看增量不看存量,可能是下一代产品经理的特质
张鹏:更具象地说,你招了不少产品人,团队有很多年轻人,他们身上有比较统一的特质吗?是不是要大厂?是不是都要做过产品?从已经招来的人身上反向总结的特质,能不能给我们透露透露?
杨植麟:我觉得很重要的,一个是开放的心态,二是学习的能力。它指向的一点就是:一个人能不能快速地迭代。这是我们觉得价值非常大的潜质。
不光是产品经理,每一个角色,甚至每一个人,不管做不做 AI,(这个点)都非常关键,因为现在变化太快,基本上你很难预测明年底,AI 能给我们提供什么,我觉得基本不太可能预测。
一年都很难预测,更不要说接下来三五年、五到十年。所以我觉得需要我们每一个人都用非常开放的心态,快速地学习,然后具体地去做。
具体到产品上,我觉得需要很强的 C 端 sense。你可能对它很感兴趣,但是到底怎样是有效的方式,能够让产品持续演进下去?做出第一版的产品,可能是容易的,因为你还没有经历让它持续迭代变好的过程,或者说去更加精细化地定义你想要一个怎样的产品的过程。它远远没有之前的产品那么直接、简单。
因为,你可能有一个产品,然后你怎么让它变得更好?「好」是非常抽象的。你要怎么让 ChatGPT 变得更好?怎样算好?往哪个方向好?好多少算是好?这些都很难(定义)。
很多产品经理容易陷入一个误区,定义一堆 feature 功能,像以前一样,这可能是不对的。因为(现在)你的功能是通过数据定义出来的,这才是 AI Native 的方式。
所以,需要很多的学习,它不光是静态的理论,而是学习之后要去试。我今天讲的东西可能是错的,没事,你去试,试完发现,好像又收获了一些,自己又迭代了一个梯度,在这个过程中,逐渐加深对它的理解。我觉得在这个过程中会出现我们这个时代的张小龙。
张鹏:不一定是这个时代的张小龙。龙哥是那个时代的经典,下一个时代可能会有一个全新的人。这个时代里,一定会出现这个时代的新的产品之神,它的「神性」体现可能是不一样的,这才是时代进步最让人期待的东西。
你刚刚说的,这个时代的人才,我们很难定义说,今天你身上一定要具备怎样的特质,但有一点是确定的,看增量。也许不看你的历史,但看你的历史和今天之间,今天和明天之间,你的增量如果足够大,在一个新的、不确定的时代里,就会具有很大的意义。看增量不看存量,这可能是下一代产品经理(的特质)。
杨植麟:对,很多时候没有太多历史包袱,是一件好事。
张鹏:我看刚才已经有人在弹幕问,「还招人吗?」「还招实习生吗?」你们现在还招人吗?
杨植麟:对,全职、实习现在都有。
张鹏:你们对人的挑选有什么标准?对人的要求也要按照新范式来?
杨植麟:我们相对来说比较 open,不同背景(都可以)。我觉得 AGI 是个很综合的事情,今年市场上有一些热度,会吸引各种背景的人,这个很重要,因为如果只有单一背景,很难做好,市场上各种人才流动是很重要的。
举个例子,现在所谓的 AGI 技术,背后其实有 NLP(自然语言处理)的部分,有 Computer Vision(计算机视觉),有 RL(强化学习),有做对齐的,还要有很好的基础设施,要有写 Kernel 的,这是一个非常全栈的东西,光是技术就要很综合,更别说技术以外,产品、运营、商业化这些,每个职能都需要,理想中应该是很多元的背景。但你的 Vision 应该是一样的,我们很欢迎对 AGI、对 Super-App、对全球市场有激情的小伙伴。
06
AGI 时代重要的指标是场景摩尔定律
张鹏:Sam Altman 曾经提过,智能摩尔定律,他也写过文章阐述万物摩尔定律,智能的成本和能力之间,存在摩尔定律的关系,我不知道你是否认同他的这个观点?
杨植麟:是的,我觉得摩尔定律也会出现一个范式上的变化。以前摩尔定律,每 n 个月晶体管数量翻倍,到后来模型的参数和算力符合摩尔定律,每 n 个月 flops 翻倍。
现在对我们来说,智能摩尔定律本质上反映的是每 n 个月,可用的 use case 的数量,会翻一倍。它本质上是 scaling law 的延伸,更多反应在模型预训练阶段,它到底符合怎样的规律。加入更多的算力、更多的数据、更多的参数后,模型的 training loss 会发生怎样的变化,这是之前标准的 scaling law 的说法。
但最终,其实最重要的指标,是场景的摩尔定律,有多少场景达到可用?它必须是指数上升的过程,不能是线性的,每 n 个月翻一倍,就是指数上升的,不能再用传统 AI 的方式,每次加一个场景,每次加一个数据,让它在这个场景上 work,那样的话就永远无法用指数的办法上升。
我觉得这个点是很关键的,衡量有多少场景被解锁,有了这个,PMF 的寻找过程就会极大地被加速,同时可以去试很多东西。就是,不应该种一棵树,而是划一片地,有一片地之后,有场景摩尔定律,就能一下全部试一遍,这是一个超级快速的种树机器,很快,不用种树它就知道,在这里种树是死是活。
当你(场景)多到一定程度的时候,就会成为一个超级入口。
张鹏:智能摩尔定律和场景摩尔定律应该是一个双螺旋,互相有关系,成本不断下降,解锁的能力越来越高,能力越高,成本越下降,场景理论上就会越多。
下个时代最伟大的公司会是两种文化的结合
张鹏:你对硅谷应该很熟悉,在 Meta 和 Google 都工作过,你怎么看硅谷的文化,硅谷工程师的能力的特点?对比中国这边未来创新者的文化和能力,你怎么理解两者之间的差异,各自擅长什么?
杨植麟:硅谷工程师的文化非常典型。比如 Noam(Shazeer,Character.AI 创始人),他们今天做了这样一个有一定程度 PMF 的产品,但是他们早期其实没有太多专门的产品经理的角色,这是很重要的工程师文化的体现,这些工程师他们可能有很多自己的想法,把技术和这些想法结合到一起,尝试向前走一步。
我觉得这其实是我们很多时候可以借鉴的一个东西,特别是在 AI Native 的新范式下,很多时候需要全民和技术「双向奔赴」,需要这种工程师文化,去把技术和需求连接在一起。比如刚刚说那两个数据集怎么构建,如果没有这种工程师文化,不往前去走一步的话,很多事情就很难做了。
所以在这个点上,如何更加 AI Native,本质上是这种工程师文化提供的很大的驱动力。
然后我觉得,底层我们还希望借鉴另一个东西,东西方文化里优质的地方都可以去吸收。
比如 OpenAI 有很强的技术理想主义,「我想做 AGI」,但也没想好商业模式怎样,一开始就有很多投资。这种技术理想主义的驱动下,包括最近很火的有效加速主义(Effective accelerationism,e/acc),我觉得这都是技术理想主义的体现。包括硅谷以前的公司,Google、微软,都是在一定的技术理想主义的驱动下产生的。
东方文化里有很多东西,强调「有用」,有商业模式的前提下考虑事情。
我觉得接下来 10 年,在 AGI 的时代里,最伟大的公司可能要结合这两种文化。一方面是能够从功利角度去找到非常好的商业模式,它是你持续燃烧的燃料;另一方面也需要技术理想主义的驱动,不光是为了赚钱或者有用,而是本身就有很强的理想,去看看,月球背面到底什么样。
张鹏:感谢植麟,我非常喜欢你思考问题的角度,尤其你说的最后一点,我们以前善于目标导向,通向有用,但未来把一件事变得有用、普惠的过程中,可能需要一点 moonshot 的精神,你在瞄向一个高位置的东西,不管打不打得中,至少要往宇宙深处走,往星河深处走,我觉得这是让人兴奋的,往往可能是一些兴奋的目标,聚集起了真正优秀的人。
我也很期待月之暗面用这种对组织、对创新的新范式的思考,接下来能够有所成就。
(完整直播回放)
如果你关注大模型领域,欢迎扫码加入我们的大模型交流群,来一起探讨大模型时代的共识和认知,跟上大模型时代的这股浪潮。
更多阅读GPTs大爆发后,AI创业者该如何进场?Mistral AI:欧洲最强大模型团队的现状及商业未来
AutoGame:AI 原生游戏的尝试和思考 | Workshop 分享
今天的AI创业,与移动互联网时代的区别在哪里?万字解析Character.AI:产品优势和商业壁垒在哪里?
转载原创文章请添加微信:geekparker