明敏 发自 凹非寺
量子位 | 公众号 QbitAI
国产大模型最新进展,这次来自“国家队”!
刚刚,全栈国产化生态大模型“九天智能基座”正式发布!
它由中国移动自研。包括万卡算力、千亿模型及百汇平台三部分。
其中模型部分是九天自主研发的从算子到框架全栈国产训练的千亿参数大模型,能力达到GPT-4的90%水平。
以它为底座,已经布局17个细分领域行业大模型,覆盖政务、医疗、办公、金融风控、客服、代码等行业。
算力方面,中国移动宣布年内将建成3个国产近2万卡智算中心。此外,还发布了AI+5G新通话,AI+办公等23个AI软硬产品,AI+工业、AI+交通等20个行业应用。
没想到,大模型“国家队”进展已经如此迅速了。
自大模型趋势开始,运营商等央企就开始将注意力集中到AI自研与行业落地上,为大模型国产自主化持续加码。历时一年多,成果开始不断涌现。
那么,当下大模型“国家队”进展究竟如何了?
来参考中国移动的最新发布。
“万百千”智能基座发布
今年数字中国峰会上,中国移动发布的核心内容为1套“万百千”智能基座、3大产业融通基地、N个AI+产品及应用。
其中,“万百千”智能基座正是指“九天智能基座”,它由万卡算力、千亿参数模型及百汇平台组成。
算力方面,中国移动将要建成智算网络新集群。年内将投产3个近2万卡超大规模单体智算中心和12个区域智算中心,广泛升级1500个边缘节点,将训/推算力资源配比上升至1:10。建成的单体智算中心可为万亿、千亿等超大参数模型训练提供澎湃算力。
模型方面,九天基座大模型聚焦解决行业复杂系统智能化难题,实现行业定向增强、行业模态匹配、全栈国产化、安全可信等四大技术突破。
行业定向增强方面,在全球海量通识知识基础上,模型针对通信、电力、运输、能源等行业专业知识进行增强。成为国内预训练行业数据占比最高的大模型,达10%。
行业模态匹配方面,九天独创了结构化数据大模型,能够更好面向千行百业处理复杂的产业结构化数据。同时构建了语音、视觉、文本等方面能力,可为不同行业提供所需的模态能力。
国产化方面,九天已实现数据构建、预训练、微调、部署全链路核心技术自主创新,适配国产算力,实现全栈国产。
安全可信方面,九天已建立数据指令评估体系,同时加强数据处理和清洗、优化DPO算法、加强人类价值观对齐,确保模型实现指令安全相应。九天是唯一通过双备案的央企背景大模型,并获得中国软件测评中心安全测评的最高等级A级证书。
基于千亿基座大模型,中国移动已研发工程设计、金融风控等17款行业大模型,未来还将布局40款自研行业大模型,赋能生产、生活、社会治理等创新升级。
平台方面,汇聚平台是一个链接大模型厂商和用户的平台。它已汇聚并开放超30个“自有+开源+生态”大模型、超20个高质量数据集,包含模型体验、调优、部署、推理、评测全链条大模型开发工具,是一个大模型生产超级工厂。
一同亮相的三大产业融通基地,分别是训练基地、评测基地和联创基地,它们将助力大模型训练更快、更好、应用落地更明确。
训练基地优先开放内蒙千卡算力资源,年底开放万卡算力资源;测试基地联合赛迪,提供公正、优质大模型测评服务;产创基地开放北京、湖北、山东、福建,汇聚本地优质资源,可为本地央国企、头部行业客户、中小企业,提供AI+应用创新“试飞场”。
此外,依托中国移动AI技术的23款AI+产品及20个AI+DICT行业应用也一同亮相。比如,5G+AI新通话支持通话中实时转写、字幕翻译;视频彩铃推出文生图、文生音乐等功能。
以上就是此次中国移动带来最新大模型进展。
实际上,不只是中国移动一家央企大力在大模型领域积极布局。不完全统计,几大运营商、中国电科、国家电网、国投集团等央企都以不同方式完成入局。
为什么会出现这种现象?作为“国家队”,它们又有哪些特别之处值得被关注?
为啥“国家队”值得关注?
去年2月27日,国务院印发《数字中国建设整体布局规划》。
其中重点提到,要夯实数字中国建设基础,要全面赋能经济社会发展,要强化数字中国关键能力,要优化数字化发展环境。
与此同时,ChatGPT掀起的大模型趋势激流勇进。重视发展通用人工智能、把握人工智能等新科技革命浪潮,也被在几次重要会议中提出。
在如此时代背景和发展要求下,运营商自然就走到了聚光灯下。
一方面,运营商有技术实力。
首先在算力方面,随着“东数西算”工程启动,运营商在建设算力网络方面已悄然走在前列。
目前,我国运营商已经建立起全球规模最大的网络。同时全国约50%以上的IDC(互联网数据中心)都是由运营商提供。
云计算方面,IDC数据显示,2023年下半年中国TOP5公有云IaaS厂商中有两位都是运营商背景。比如移动云2023年收入已达833亿元人民币,同比增长率65.6%,在公有云服务市场位居国内第一阵营。
运营商先天具备网络优势,也进一步夯实其算力基础。目前我国5G基站总数已达238.4万个。
其次,运营商有数据优势。
凭借此前与千行百业的合作,运营商已经积累了庞大业务数据,能够快速构建稀缺数据集,更快训出垂直行业大模型。而这些合作经验也能让运营商在实际合作中,更快推进技术落地。
同时,东数西算、东数西训等工程的参与,也让运营商构建了更灵活的数据流通能力。
最后,不少运营商在AI方面都有提前布局。
以中国移动为例,在2013年就成立了“九天”团队,在机器视觉、语音、自然语言处理、网络智能化等领域有多年技术积累。
另一方面,运营商也有身份优势。
大模型趋势是科技革命,也是全球竞争。随着趋势不断发展,通用人工智能国产自主化越来越被重视。加之政务、交通等强调隐私保护的领域也在积极拥抱大模型,对数据安全的要求,都使得央企在竞争中具备独特自身优势。
这两重优势都让大模型“国家队”需要被重点关注。
更何况,“国家队”的动向一定程度上反映国家对AI、大模型的重视程度,同时也能体现出我国大模型自研水平、国产自有化的能力。而且在落地上,央企更接近国民经济骨干行业,比如通信、政务等,能更快促进我国整体生产力跃升。
不过随着趋势演进,“国家队”成员之间的差距也在逐渐形成。比如带来最新进展的中国移动,成为今年国家网信办公布的已备案大模型清单中首家央企。
为什么是中国移动?它做对了什么?
为什么是中国移动?
过去1年里,中国移动完成了大模型领域的一系列发布。
去年世界人工智能大会上,中国移动在大模型领域的第一落子便是发布两款行业大模型“九天·海算政务”和“九天·客服”。
几个月后,中国移动又联合多家央企发布“九天·众擎基座大模型”。它主打融入各类专业知识,深度匹配行业需求。
今年早些时候,在国家网信办公布的已备案大模型清单中,中国移动“九天自然语言交互大模型”名列其中。这是首个同时通过国家“生成式人工智能服务备案”和“境内深度合成服务算法备案”双备案的央企大模型。目前已形成9B、13.9B、57B、千亿等多种参数量版本,可灵活部署于云、边、端不同场景。
以九天基础大模型为基础,中国移动已经推出了二十余个行业大模型,覆盖政府治理、工业生产、民生服务和通信特色等领域,其中九天·客服大模型、九天·海算政务大模型等已经落地集团内外部客户。
此外,中国移动还推出了一站式大模型开发平台、大模型应用平台(LLM Studio),面向个人及行业客户提供从算力、数据、算法框架到研发工具的全栈人工智能服务。
梳理来看,中国移动的大模型战略其实非常清晰:
依托自身技术积累及业务,形成从平台、大模型及能力到规模化应用的全面产业级智能化服务能力。
据了解,中国移动原创性提出体系化人工智能(Holistic AI)技术,该技术具有AI服务大闭环、AI能力原子化重构、网络原生和安全可信四大技术特征,通过体系化人工智能核心技术引擎,实现算力、网络、人工智能能力全局统一调度和开放服务,从而构建了新型人工智能服务模式。
无疑,大模型浪潮这对于中国移动自身而言,是一次自我革新的机会,符合发展需求。运营商本身就是数字产业链条中的重要参与成员。如果不构建大模型能力,运营商只能“卖水”,在产业链中的话语权将可能逐渐被削弱。
对于国家而言,也需要中国移动这样的运营商站出来,构建更加国有化的大模型能力。
在《数字中国建设整体布局规划》中明确指出,要强化数字中国关键能力,构筑自强自立的数字技术创新体系,筑牢可信可控的数字安全屏障。
具体推进动作上,凭借扎实的技术积累,中国移动的步伐越走越快。
中国移动从11年前开始布局AI,长期关注CV、NLP等前沿AI领域技术,目前在内部建立了一支由冯俊兰博士领军的百人规模人工智能研发团队。
冯俊兰博士是IEEE Fellow、中国移动集团级首席科学家。于2001年在中国科学院获得声学博士学位,同年加入美国AT&T研究中心,曾任高级研究员、主任研究员,主要研究方向包括:语音识别、 语言理解和数据挖掘。
2013年9月加入中国移动研究院,一手带出“九天”团队。
目前,中国移动AI团队发表国际顶会、顶刊论文150余篇,发明专利930项,顶级AI竞赛TOP5奖项18项,主导了业界近九成网络智能化领域国际标准。
同时在技术落地方面,中国移动也更加关注直接影响国民生活的领域。最新展示的行业大模型覆盖医疗、办公、物联水利、网络安全、社会综合治理等领域。
数据显示,九天”产品目前已服务超10亿用户、300家客户、云边端能力调用次数超9.6万亿,年赋能价值达41亿元。
显然,在辐射全社会、实现AI普惠、推进数字中国建设上,以中国移动为代表的“国家队”正在异军突起,它们在中国大模型浪潮中的地位将愈加不可取代。
而在这场波及全球的科技浪潮中,中国移动等运营商也在将中国的数字基建优势进一步发挥释放,为中国数字化建设提供独有的一股驱动力。