国产大模型的100种可能

1,099次阅读
没有评论

国产大模型的100种可能

图片来源@视觉中国

文 | 明晰野望

4月以来,市场几乎每天都有各种国产大模型的新信息,一众科技大厂、创业公司陆续公布相关进展,加速入场。

争相涌现的国产大模型,特别是科技大厂基于投入、算力、大数据等方面的优势,为中国自主大模型的发展带来了广泛的可能性。

事实上,BTA、华为等大厂在该领域早有研发,并非新入局者。之所以在ChatGPT教育全社会”前“隐而不发”,一是各家的核心业务不同,AI研发的侧重点也有所不同。二是正如阿里云周靖人所言,在ChatGPT出现前讲“预训练大模型”,没有人会感兴趣。

当下,有人在琢磨如何快速推出自己的国产大模型抢占市场,也有人在以算力为代表的底层基础设施层发力。更有人直言,相比于“神仙打架”,更关心国产大模型怎么落地应用,看看这个先进生产力工具究竟如何改变产业与生活方式,以及能否实现超越,由追随到引领?

关于“与OpenAI差距”的讨论也从未停止,如李彦宏的“2、3个月”,王小川的“不会低于两年”,时间定义虽不同,但均表明了其并没有领先到难以追赶的程度。

大戏,才刚刚启幕。

01 “iPhone时刻”与增量市场

“超越”不是伪命题,在中美科技竞争、市场隔离的背景下,中国科技产业需要自己的“iPhone时刻”。

人工智能则是最有希望诞生这一时刻的领域:在过去十余年间,AI进步由中美主导,投入也最巨大,因此机会主要也在中美之间。

Open AI的成功,无疑强化了这一观点,并给所有中国科技企业带来了一剂强心针,照着这个路径去做生成式AI,是能够走通的——这样即能保证“革命性技术”诞生时离其最近,也能率先进入“增量”市场。

这是在科技行业低迷的当下,一个难得的增量空间。如果能取得先发优势,就有可能开辟巨大的新市场,或给已有业务,如云计算、电商、游戏、社交、搜索乃至B端的千行百业加上“放大器”。

大模型不仅是聊天软件,更是生产力工具,已是共识。

在阿里云峰会上,张勇称所有产品未来都将接入通义千问大模型,进行全面改造;刘炽平在腾讯财报会上强调,生成式AI可成为已有业务的 “倍增器”,也可帮助开拓新增长线;任正非更是认为,ChatGPT 把计算、管道流量撑大,华为产品就有了机会。

其中的逻辑是,AI是数字化时代的“操作系统”,就像移动互联网时代的IOS和安卓,加速促进了产业数字化的发展,对生产、生活方式进行下一次重塑,带来更大空间的新领域,而大模型是整个AI产业链中,核心中的核心。

国产大模型的100种可能

从长远看,如果不能取得先机,未来就有可能会影响现有的整个商业模式,甚至被颠覆。

如周鸿祎在4月21日发出内部信,要求360全员拥抱人工智能,称“已领先一个身位”。近期接受采访时也表示,国内“搜索引擎百度市占率60%,公司30%”,强调“在战略上对标微软,搜索上践行必应”,改写格局的企图心强烈。

百度反应更为激进,做出了全球第一个对标ChatGPT的文心一言。另据晚点财经报道,在文心一言内测前,李彦宏每晚和项目团队开会,他们为筹备产品甚至一度睡在公司。

中信建投的一份“会议纪要”也显示,过去几个月他们调研了很多一线互联网公司,得到一个非常一致的结论:这次是全面的一把手工程,不管是BAT还是字节、华为,均是创始人亲自督战,对大模型团队全力支持。上一次出现如此情景,还是2009年移动互联网来临的时候。

中信建投因此认为:未来6-12个月的AI行业会很卷,但也很精彩,各家模型的登场才刚刚开始。

但仅是“开始”,当下国内大模型超过万亿参数的,就有阿里的M6、腾讯的混元、智源研究院的悟道2.0,华为的盘古Σ,千亿以上的也有近十个。

国产大模型的100种可能

从发布时间看,百度、阿里、腾讯、华为等一线科技大厂,在ChatGPT热潮前均已推出过大模型。

百度的ERNIE 1.0于2019年推出,即后来的文心大模型,目前更新到 3.0 版本;阿里在2021年发布语言大模型 AliceMind和多模态大模型 M6,去年9月合并为通义大模型。

腾讯在2022年6月发布混元大模型,目前更新至 2.0 版本。微信去年 10 月也发布了大模型 WeML;华为盘古大模型于2021年4月发布,后续发布了NLP、CV、多模态等多个大模型。

这些都说明,中国科技企业有技术和能力推动一场大模型的变局,当然,差距和阻力也依然客观存在。

02 国产大模型需要“新想法”

李彦宏在文心一言发布后曾说,百度有信心在综合能力上,迅速追上甚至超过 ChatGPT。

这可能不是百度盲目自信,今天的大模型就像一场刚刚开跑的马拉松,“你追我赶”是必然阶段。 现在Open AI领跑,也许明天谷歌就会赶上来,但也有可能是阿里、腾讯、华为实现弯道超车。

科技行业不同于其他行业的魅力所在之处在于,每一轮科技创新都是由大的确定性和小的不确定性构成,带有偶然性,并不是简单的强因果关系。

但略显遗憾的是,目前多数中国科技公司在做的大模型,包括百度和阿里在算法方面和GPT-3架构基本类似,都是基于谷歌的Transformer,其他方面也是追随OpenAI的脚步实践,在迭代速度不如人的情况下,反而差距越拉越大。

李彦宏曾明言,百度“文心一言”在研发阶段时曾与ChatGPT进行对比测试,当时差距是一个月能追得上。可过了一个月再次测试后,发现差距反而拉大了。

阿里云周靖人也坦承,目前通义千问与ChatGPT仍有差距,“GPT还是属于各方面都领先的地位”。

更为关键的是,ChatGPT“暴力美学”式大模型路径可能走到了尽头。

近日OpenAI首席执行官山姆·奥特曼公开表示,“大语言模型规模已接近极限”,“我认为我们正处于巨型模型时代的末尾,目前尚不清楚未来的进步究竟来自何处”。他同时否认了GPT-5的存在,“而且一段时间内也不会有”。

自ChatGPT推出以来,竞争对手众多。

如马斯克已经确认自建 AI 聊天机器人TruthGPT与之硬杠,亚马逊也大力投资生成式AI,谷歌大脑合并DeepMind联手追赶等等,还有大批初创公司正在构建更大算法。此外,欧洲各国正在禁用或拟禁用ChatGPT。

因此尚不清楚山姆·奥特曼出于何种考量做此表态,但也不排除巨型AI模型时代可能正在结束。这意味着大模型进化的“下一步”需要再次“另辟蹊径”,尤其是国产大模型更需要有“新想法”。

目前生成式AI的应用在文本领域相对成熟,从海外已落地或处于 Demo阶段的应用案例来看,在代码、图片、视频、游戏等领域,海外均有所创新。

国产大模型的100种可能

但中国显然有更广阔的市场及更丰富的应用场景,这也是中国科技公司天然的本土优势:从toC走向toB。

有很多科技公司的从业人士认为,中国的大模型之路应该与美国市场不同。他们更认可一种“两条腿走路”的方式,即一边做大模型基础平台开发,一边直接瞄准垂直的行业场景落地,实现大模型与场景化的两翼齐飞。

这样既能持续获得更多更丰富的各个行业里“好的原材料”(数据),也使更多的研发人员有机会深入到一线,用大模型去解决实际问题(应用场景),从而在工程化、产品化、场景化上不断迭代,最终与技术底座形成飞轮效应,走向商业化的正循环。

国产大模型的100种可能

如华为盘古大模型强调在矿山、电力等场景的应用,腾讯CV(计算机视觉)大模型在工业质检、医疗影像等领域的落地,及诸多AI创业公司深耕垂直行业,都是出于此等考量。

从中长期来看,AI大模型也一定会加速渗透到更多toB的场景,比如汽车、工业(制造业)、航天航空卫星、能源、生物制药等领域,这也是中国数字化发展的主线。

03 “AI+一切”之数字经济

2018年时,华为有个“达芬奇”计划,旨在将AI添加到一切产品和服务中,也可以理解为“AI+一切”。其中最首要的一步,就是开发AI芯片,挑战英伟达。

那一年,从产业革命,技术创新的周期视角下来看,应该是数字化和智能化的开端,数据、算力、算法都迎来大爆发,更是新一轮硬件终端智能化趋势的起点,比如汽车、穿戴设备、智能家居等等物联网终端,至今全球已经有接近1000亿的Iot智能终端实时在线。

但是,并没有数字化时代现象级的应用诞生,不管是自动驾驶还是VR、AR、智能家居、工业互联网乃至元宇宙,过去几年落地都不及预期。

中国也没有诞生自己的英伟达,美国却又增加了OpenAI这个AI新标杆。这说明,科技领域永远没有属于追随者的时代。

而大模型之所以形成全球共振效应,因为它可能是全面加速数字化应用落地的超级工具,这是一个全新的节点:大模型更多是一个工程上的突破而非技术突破,一旦商业模式确认,各行各业的落地速度会比过往快很多,这也是越来越多的企业急速涌入的根本性原因。

所以在全新节点下,4月18日钉钉全面接入“通义千问”,这意味着阿里大模型正式面向B端客户。此前在阿里云峰会上,张勇曾强调,“面对AI时代,所有产品都值得用大模型重做一次”。

“AI+一切”的野望始终都在,这为国产大模型的未来带来了何止100种的可能性。而钉钉最想实现的一个可能“是成为超级APP”,钉钉总裁叶军如此说。

但在理论上,百度、阿里、腾讯、华为、字节凭借各自的历史积累,都有可能成为“AI+一切”的赢家,而不是先做的就一定比后做的好。

目前从不同渠道流出的消息显示,4月份华为会发布自己的模型,8月份腾讯大模型要出来;字节版的ChatGPT已在内测,但内测之后体验效果不好预计在9月上线。

不过决定最终谁能跑出来,一定是先“卷”一轮。

从中国经济发展的历史来看,无论是家电、新能源车还是电商、短视频直播行业,“内战必先于外战”,但“外战优于内战”。

大模型之战应该也遵循这个路径,很多小模型或者小场景的商业闭环会被大模型“吃”掉。而大模型一旦成功,会是万亿市值规模的巨大空间,当然最后跑出来的也可能是两、三个大模型。

届时,不但会产生中国的“OpenAI”,中国的“英伟达”也会有,底层框架更会有。

因为中国大模型只有构建在国产技术底座上,每一层都实现自主可控,才有可能纵深地做持续闭环优化,这就跟芯片及再上层的芯片先进制程都要实现“自主”是一个道理。

那时国产大模型实现超越,切实可期。

但AI从来不只是技术、算力、人才的角逐,更是国家战略的角力。4月份以来,网信办发布了《生成式人工智能服务管理办法(征求意见稿)》,科技部发起成立“国家超算互联网联合体”,及从去年到现在出台的一系列有关数字经济、数据要素相关政策,都表明了国家的关切与肯定。

国产大模型的100种可能

国产大模型的100种可能

也就是说,相对海外对大模型发展的矛盾态度,中国对整个数字经济及人工智能的发展,是持一贯的支持态度,这为中国大模型的未来,加上了一个至关重要的确定性。

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2023 年 4 月
 12
3456789
10111213141516
17181920212223
24252627282930
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议 梦晨 2025-12-11 15:33:51 来源:量子位 A...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1 十三 2025-12-15 14:13:14 ...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了 衡宇 2025-12-10 12:3...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案

戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案

戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案 十三 2025-12-10 1...
九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局

九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局

九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局 量子位的朋友们 2025-12-10 18:...
乐奇Rokid这一年,一路狂飙不回头

乐奇Rokid这一年,一路狂飙不回头

乐奇Rokid这一年,一路狂飙不回头 梦瑶 2025-12-10 20:41:15 来源:量子位 梦瑶 发自 ...