图片来源@视觉中国
出品 | 创世伙伴CCV
内容|CCV人工智能研究小组
前言
预训练大模型开启了全新的AI时代,自2022年11月OpenAI发布了ChatGPT并迅速破圈,在短短两个月内突破1亿用户。再随后的两个月时间里,AI领域激起全世界的巨浪,技术迭代的速度超乎意料,仅3月13日那一周业界便发布了Alpaca7B、PaLM-E、GPT4、Claude、pytorch2、Midjourney5、Copilot、文心一言、Stable Diffusion Reimagine等振奋人心的重量级产品。
技术的发展速度让人应接不暇,而其能力也达到前所未有的水平。根据上周微软研究院发布的154页研究,GPT4已经在多个领域展现出超出人类水平的性能,初现AGI的身影。
技术进步的速度已经远超预期,就在近日GPT5的训练阶段,马斯克等千名科技界专家联名签署了一份“暂停举行人工智能试验”的公开信,呼吁所有AI实验室立即暂停至少6个月时间,停止训练比GPT4更强大的AI系统,“以避免发生超出掌控的严重后果”。
从GPT4到GPT5,哪些飞跃式的进展再次出现?目前还有哪些市场空间存在机会?创业者如何提高AI产业的创业成功率?创世伙伴CCV从过去、现在、未来的三重视角,与你共同探讨人工智能浪潮的机会与挑战。
一、回顾:超强AI如何颠覆产业
(1)自然语言交互作为新UI:AI对于用户意图的理解能力极大增强,且可以真正做到多轮沟通,基于一个对话session的上下文更深入理解用户意图,并做出相应反馈。强大的理解能力使得人与AI的交互不再鸡同鸭讲,“听人话、说人话”将推动全新人机交互方式的发展。纵观IT历史上的重要发展节点,都跟UI的发展息息相关,从Unix的命令行,到PC和Mac的GUI,到Netscape的浏览器,到Google的搜索框,再到iPhone的多点触控,无一不是人机交互方式的改变带来了颠覆式革命。而我们认为自然语言交互作为新UI,也是全新的应用生态的一个底座。
(2)突破虚拟世界的屏障:多模态大模型是市场关注的一个重点,物理世界中的信息来源多种多样,每一种都是一种模态,包括语言、图像、声音、味道、触碰等等,而机器人技术发展到今天也已经有成熟的传感器方案来捕捉物理世界中的种种信息。当AI可以结合物理世界中的实时的、综合的信息来做理解、判断、响应,虚拟和现实世界的边界会被打破,市场将出现全新的硬件产品形态。想象一下,家里的智能音箱不光可以听你命令播放音乐、打开窗帘,它还可以察言观色,成为一个实实在在的伴侣。
(3)凭空生成、实时生成:我们认为AIGC是这次AI浪潮中的一个重要分支,从文本、代码、指令,到图像、3D、声音、视频,甚至到更完整的产品(比如完整小游戏)。最终能够生成的种类越来越多,越来越复杂。基于预训练大模型的生成式AI,极大地提升了创意和生产效率,降低了成本,我们或许可以将它看做全新一代的SaaS产品。结合自然语言交互降低使用门槛,过程中将解锁过往的不可能产品,产生大量的新组织新人群,比如游戏行业里生产力的进步会带来游戏生产组织结构的进步,未来大型的组织会消失,取而代之的会是更多的阿米巴组织、独立工作室,甚至庞大的UGC游戏社区。
二、当下:最好的时代,也是最坏的时代
对于创业公司来说,这个“人工智能的iphone时刻”是最好的时代,同样也是最坏的时代。
一方面,我们看到预训练大模型带来的变革将孕育一个全新的应用生态,这其中蕴含无数的创业机会;但同时我们也看到基础模型的能力在日复一日的膨胀,如果偏离人类社会的伦理与掌控底线,在超人工智能航道上行驶的创业企业,很容易就会被宏观调整“撞沉”。
那什么样的企业能够在当下激烈的竞争中成为赢家、笑到最后?从产业分析中,目前我们看到“两横六纵”的机会:
(1)一横:生产力工具
当下市场上应用创新的激情刚刚被唤起,创业公司纷纷躬身入局或转战AI,基于预训练大模型的生成式AI做生产力工具的创新。比如市场讨论最多的,文案生成、2D/3D创意或资产生成、音乐资产生成、虚拟助手、AI客服、情感对话机器人等等,这是第一层,最直接简单的参与,最直接简单的应用升级,我称之为“老树新花”式的创新。
这样的产品往往面向存量市场,除了基本的模型魔改和精调能力外,比拼的是手速和产品力,这就引发了“三纵”升级中仍有机会的场景:
o a.降本增效:在已有的流程上,显著提升了效率和体验,或者显著降低了成本。(10倍可能是个基本的benchmark);
o b.平台整合:打通原有业务或者生产的整个流程,做到“一键解决”,而不是将AI生成的东西再带回到原有的流程中,进一步调整和结合,那可能反而会带来更高的成本和更糟糕的使用体验;
o c.模型壁垒:先于竞争对手做出数据飞轮,形成壁垒。否则只能被追上来的大厂按在地上摩擦。
当然,在生成内容的种类上也要谨慎选择,显然更高复杂的内容形式(比如3D、视频)的相对壁垒会更高,而做简单的内容会被基础大模型“一个转身直接带走”。
(2) 二横:AI时代的原生产品
何为AI原生产品?
互联网时代、移动互联网时代、云时代都出现了属于那个时代的典型产品,而这个AI时代会出现的原生产品,我们认为它应该要符合下面几点:
o a. 以AI为核心,而非工具:AI原生的产品是要把AI作为设计的原点,有机的结合AI的新特性,而不是在产品设计过程中增加AI功能。
我们往回类比,在智能手机出现的时候,移动原生的产品可以结合摄像头、定位这样的新特性去构建产品,出现了抖音、快手、美团、滴滴这样的产品。但在移动时代的最初几年,也有大量的嫁接在移动端的PC时代产品,比如90后印象深刻的Koi Pond游戏,风靡一时但最终成为“时代的眼泪”。
o b. 解锁新场景,开创新人群:如上面所说,生产力工具类型的产品往往面向的是存量市场,而AI原生的产品应该要能够创造新的场景、新的玩法,把更多的用户圈进来。还是以移动时代为例,我们可以把outlook日历放在手机上,随时随地的记录会议邀约,也可以随时随地的被提醒下一个会议的时间地址,甚至可以在没有碰过时间的情况下直接去约对方的时间,老板不再需要秘书,打工人不再需要摊开本子,这都提升了我们的工作效率,但是比起抖音、快手这样的存在,前者离“振奋人心”还差距甚远。
o c. 产品极致的简单,反馈回路更加明确:显而易见的是,好的产品不需要说明书,没有学习成本,这样可以进一步泛化产品的适配人群。而明确的反馈回路则是将用户的数据留存在产品内部,进一步迭代AI,率先形成数据飞轮。Again,形成数据飞轮至关重要。
章节小结
应用层蓬勃发展的前提,必须是一个坚实的平台以及明确的行业分工,就像IOS一样,专注于做平台,把垂直领域的内容交给更多的参与方来生产。在此我们也倡议:自我大模型平台专心做平台,给予生态参与者充分机会,提供应用层广阔的场景空间,才能加速推动下一次信息浪潮更快来临。
目前AI的发展如此迅猛,单单依靠“短时暂停”阻拦未来浪潮只是杯水车薪,应该倡议的是给AI一些约束,这样才能产生所谓的万物生长。如果未来真如我们所设想的,中国将在AI浪潮中占据非常有利的位置——过去20年在TMT时代的辉煌证明,中国的公司在应用场景的开发和丰富度上是远超过美国公司的,相信在应用层未来会继续诞生出一批优秀的中国创业公司走向全球。
三、展望:投资人的使命是选择最好的未来去实现
Open AI为首的预训练大模型开启了全新的AI应用时代,但是Open AI的野心不止于此,而是更远的AGI(人工通用智能,Artificial general intelligence)。
在2月份斯坦福的一个seminar上,Open AI研究员Jack Rae分享了Open AI的工作纲领,即AGI的目标是实现对有效信息最大限度的无损压缩,即最大程度逼近人类智慧,也许这就是AI产品的终极形态。
目前我们正站在分叉路口上,一方面我们在面对创业寒武纪的大爆发,另一方面也有可能面临物种大灭绝。技术的进步,如果不伴随很恰当的控制,可能带来对社会的冲击。
这么来看,投资人扮演的角色:第一,需要让科技向善;第二,对持续性的追求。相较于创业者,我们的视角会更多考虑到监管,会协助社会让技术在一定的范围内发挥,实现更好的未来。正如我们常说的,科幻小说可能会给你很多的未来,投资人和创业者是在其中选到一个最好的未来去实现。
CCV认为,投资人的使命,就是要找到对人类最无害的一个技术去实现,践行科技向善的理念。
市场对于AI的未来充满想象,我们作为投资人更是如此。会不会出现Samantha?会不会每人都有专属的Jarvis?Wall-E会出现吗?AI能否推动人类科技的前沿?或许这些都是值得期待的未来。
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App