第一家完成大模型研发和开源的央企为何是Ta?我们和电信AI团队聊了聊|视频

582次阅读
没有评论

常史聘 假装发自 凹非寺
量子位 | 公众号 QbitAI

前不久,中国电信的星辰语义大模型正式开源,也就此成为第一家完成大模型研发和开源的央企

星辰语义大模型由中国电信旗下的中电信人工智能科技有限公司(以下简称电信AI)完全自主研发而成,其开源版本在一众大模型知名榜单上,都取得了良好的成绩。

传统运营商,为何会投入大模型研发?为何选择开源?

两种不同领域的企业气质,它们的融合碰撞,会造就怎样的一支团队?

贴在电信AI身上的种种标签,都让其在一众大模型选手中,显得尤为独特。

事实上,中国电信入局大模型,可以说是一件水到渠成的事情。

人们常说算力、算法、数据,是大模型研发的三要素。而在这三个方面,中国电信都都具备着优势:

算力方面,中国电信近十几年构建了覆盖全国省份的四级算力体系,可满足大模型的算力要求;

算法方面,本质上比拼的是人才资源。电信AI团队规模及800人,其中研发人员占比80%。同时,电信AI也汇集了一批行业大牛,比如,AI领域知名科学家李学龙已在去年年底全职加盟中国电信,出任集团CTO及首席科学家;

而在数据上,电信20多年来已积累了大量行业数据,再加上来自包括全国主流网站、百科、书籍、论坛、媒体在内的多个渠道的通用数据,其中文训练数据超过25TB,中文总token量超8万亿。同时,电信AI组建了专业标注团队保障数据质量,为大模型算法训练打下了坚实基础。

第一家完成大模型研发和开源的央企为何是Ta?我们和电信AI团队聊了聊|视频

而凭借着这些优势,电信AI的星辰语义大模型,也在这场卷到极致的竞争中,展现出了自己的独特优势:

  • 最大可支持96k的上下文推理;

  • 中文阅读理解能力领先于同等参数规模的开源大模型;

  • 模型幻觉问题得到有效缓解;

  • 模型生成的内容更符合主流价值观;

    ……

在具体表现上,星辰语义大模型具备常识问答、写作、逻辑推理、数学、辅助代码生成等诸多通用能力。

尤其在长文写作上,星辰语义大模型表现更为突出:根据统计,在电信内部,星辰AI大模型在此任务上的有效采纳率高达85.7%。

此外,在多轮理解上,星辰语义大模型也进行了针对性的提升。

无论是百模大战、千模大战还是万模大战,这一定是一个“大浪淘沙”的过程,最终存活下来的,可能只有少数的几家。

而电信AI的目标,就是成为其中的N分之一。

不过,电信的目标并不止于此。

事实上,在大模型之外,电信在传统AI领域,如NLP、计算机视觉、乃至数字人和机器人等领域,已经进行了多年的投入和布局,也完成了不少交付。

而这些方向的技术积累,最终也将整合到这个更为宏大的目标上来。

至于这个目标是什么,相信看完视频,你会得到答案。

—  —

点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

第一家完成大模型研发和开源的央企为何是Ta?我们和电信AI团队聊了聊|视频

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy