商汤版ChatGPT来袭,中国激战千亿“大模型”

1,586次阅读
没有评论

商汤版ChatGPT来袭,中国激战千亿“大模型”

商汤上海总部(图片来源:钛媒体App编辑拍摄)

随着ChatGPT为代表的预训练大模型带来新一轮人工智能AI)热潮爆发,继百度、阿里、360之后,又一家大厂推出GPT大模型产品

钛媒体App获悉,4月10日,AI 公司商汤科技正式发布全新“日日新SenseNova”大模型体系,以及自研的中文语言大模型应用平台“商量”(SenseChat),参数量达千亿,可实现文本生成、图像生成、多模态内容生成等能力与场景应用。

商汤科技董事长兼CEO徐立表示,上述这些生成式人工智能(AIGC)产品将在医疗、短视频教育、营销以及开发等产业领域应用落地。

商汤科技联合创始人、首席科学家王晓刚表示,目前已经有一些合作伙伴和客户开始内测其产品。未来,商汤版的GPT主要面向企业端(B2B)业务。此外,商汤“日日新SenseNova”大模型体系已全面支持了智能汽车、智慧生活、智慧商业、智慧城市等业务板块,而且商汤将向客户提供涵盖图片生成、自然语言对话、视觉推理和标注服务等API接口。

事实上,自2022年12月开始,美国OpenAI公司推出的 AI 产品ChatGPT以及背后的GPT大模型,已经引发了一场 AI 新浪潮。

但 AI 技术的终极目标 通用人工智能(AGI)可不是谁都能获得的。《奇点临近》作者雷·库兹韦尔曾表示,直到2029 年,人类才有超过50%的概率开发出AGI。而作为 AI 技术积累最深厚的中国公司,如今商汤抓住了大模型这波新浪潮,以期在未来几年内实现重大突破,从而迈向 AI 领域这颗皇冠上的明珠——AGI的前沿研发与商业化进程。

GPT大模型热潮来袭

如今,火爆全网的 AI 聊天大模型应用ChatGPT访问量已飙升至8.89亿次,它也是历史上最快达到1亿月活的应用,而且整个热潮已蔓延至微软、谷歌等很多大厂开始关注大模型。过去40天,大模型集中爆发,GPT-4、微软Microsoft 365 CopilotMidjourney V5、Google PaLM API、英伟达新显卡接连出场。

尤其是微软,将GPT-4接入Word、Excel、PowerPoint等Microsoft 365 Office办公套件中,即推出一款新的 AI 驱动的产品Copilot(副驾驶),像助手一样用 AI 帮助人们生成文档、电子邮件、PPT等,从而让 AI 接入了生产力。此外,创造出ChatGPT的美国OpenAI公司还推出插件功能,实现了“App Store时刻”,让生成式 AI 真正变革了人类的生产力。

商汤版ChatGPT来袭,中国激战千亿“大模型”

  GPT-4加持的微软Word平台,支持自由编辑 AI 生成的文本

天津大学自然语言处理实验室负责人、教授熊德意表示,从 AI 发展角度看,这是一个重要的里程碑,其意义要高于7年前的“阿尔法狗”。

实际上,过去60多年间,利用 AI 技术,智能化、数字化和人口红利共同推动了中国工业与产业快速发展,尤其是深度学习十年间的快速进步,真正让 AI 在很多领域突破了“工业红线”,在诸多特定的垂直场景中带来了效率的提升。

不过,定制化AI模型的开发模式,依然面临研发成本高、周期长等问题,而且现在80%的应用场景都是低频的、长尾的需求,但却面临投入大量人力、收集巨量数据,却不能解决小数据、小样本等实际应用问题。

而谷歌2017年发布的Transformer框架催生了新的研究范式,即基于一个强大的多模态大模型,使整个网络结构完全由Attention机制释出,让机器同时学习大量的文字,通过强化学习和人类反馈不断强化大模型的学习能力,从而更高效地解决海量的开放式任务,让 AI 实现了从“数据飞轮”到“智慧飞轮”的演进,最终迈向 AGI 人机共智。

“AI 对于开发者来说是一种模式的变化,下一步对很多内容创作者来说,一样会面临工作模式的巨大变化,未来人们不需要具备底层的制作能力,而是需要更多畅想、连接、协同的能力,这些能力才是跟AI协同共创的核心商业能力。而这种生产力模型的变革,可能会产生互联网SaaS(软件运营服务)应用和工具链,或者基于这些工具链新生成的社区,也就是我们可能会拥有下一阶段的‘小红书’、B站等一系列互联网应用。”商汤科技董事长兼CEO徐立,今年2月谈及ChatGPT引发的商业产业变革时表示。

作为 AI 行业的领头羊,商汤科技拥有很强的技术实力和积累,能够参与到这场大模型军备赛当中。自2018年起,商汤科技便致力于 AI 大模型的研发,有着超过5年的技术积淀和实践经验。目前,商汤已成功研发了320亿参数量的全球最大的通用视觉模型,在自动驾驶、工业质检、医疗影像等多个领域得到广泛应用。

“‘好的原材料’就是要深入到各个行业里积累非常多的know-how。美国公司OpenAI能够把ChatGPT做出来,背后也有多年积累,从小模型到大模型的研发,中间积累了非常多的know-how。”王晓刚表示,商汤具有非常类似的优势,内部有非常多的研发人员能深入到一线,用大模型去解决实际问题,有很好的技术积累。

王晓刚强调,“我们要拥抱全新研究范式,这里面的关键是我们要转变观念。十年前,商汤还没有诞生,我们创始团队在当时做的决定就是-All In Deep Learning(深度学习)。我们之前在传统视觉技术里也有较长积累,但是,当新技术来了,我们就果断地去拥抱新技术。今天也一样。”

实际上,本轮国产大模型竞赛中,有三个能力极为重要:算力、数据和应用场景。而在国内致力于To B(企业端)业务的大厂中,商汤处于第一梯队。

商汤科技前瞻布局,依托SenseCore AI大装置,以5000 Petaflops超大规模算力和出色的并行计算能力,为大模型研发提供强大的算力基础设施,堪比芯片行业的“光刻机”;同时还有数据算法和强大的产业化能力,在智慧城市、智慧商业等领域的长期耕耘,商汤积累了海量真实世界的高质量视觉数据,支持商汤在视觉技术方面的持续突破。领先的算力布局,以及丰富的视觉数据和技术积累,为商汤多模态大模型的研发提供有力基础。

商汤版ChatGPT来袭,中国激战千亿“大模型”

商汤版ChatGPT来袭,中国激战千亿“大模型”

徐立曾表示,AI 的核心是解决“工业红线”问题,而商汤SenseCore AI 大装置相当于粒子对撞机,成为业内稀缺的大模型专用基础设施,可以解决 AI 软件所需算力支撑挑战——类似光刻机,解决芯片的“工业红线”。因此,如今基于“大模型+大算力”,商汤拥有了 AGI 时代的“光刻机”,成为 AGI 和大模型时代的基础设施服务领导者,对整个行业具有重要的应用价值和战略意义。

“需要好的顶层设计,很好地把原材料设计成一个体系,商汤能朝着 AGI 的目标努力。除了大装置和基础设施以外,还要能从算法、框架上,把整个系统设计好。”王晓刚表示。

王晓刚称,如今,商汤研发想要做的事情就是怎么样去用好这些新技术。它带来的新范式包括人机共智,一起去创造新智慧。核心在于怎样用好我们的这个大模型,能够去形成正向的反馈,而不是一味地说“很害怕被颠覆了”。

千亿商汤大模型有何新亮点?

最近几天,国内科技大厂的GPT AI 大模型密集呈现,从百度的文心一言,到阿里通义、华为盘古和京东言犀,引发国内企业的大模型“逐鹿潮”。

相对于其他大模型产品,商汤此次推出的千亿大模型真正服务于To B(企业)端客户,而非一个被网络调戏的工具。钛媒体App梳理了四大亮点和优势,从体系、语言大模型平台,到应用场景和行业落地,打通大模型产业闭环。

商汤版ChatGPT来袭,中国激战千亿“大模型”

首先是国内首个大模型体系。

4月10日,商汤科技正式发布商汤“日日新SenseNova”大模型体系,基于数据、模型训练以及部署的三位一体的飞轮,提供自然语言生成、图片生成、感知模型预标注、模型研发等多种能力,并持续更新多模态大模型,同时结合决策智能大模型,是实现AGI的重要起点。

商汤版ChatGPT来袭,中国激战千亿“大模型”

据悉,商汤“日日新SenseNova”大模型体系的名称取自《礼记·大学》中,汤之盘铭曰:苟日新、日日新、又日新,商汤希望在模型的迭代速度及处理问题的能力上可以日日更新,不断解锁AGI更多可能。

实际上,大模型最核心的需求就是构建体系架构。而在前期,商汤前瞻性打造了人工智能基础设施SenseCore AI大装置——27000块GPU(图形处理器)芯片,5000 Petaflops超大规模算力、是亚洲最大的智能计算平台之一、支持20个千亿参数超大模型同时训练、支持最大4000卡并行单任务训练,可持续7天以上不间断稳定训练——这是国内为数不多接近GPT所需算力的重要基础设施公司。

如今,基于AISaaS服务架构,商汤已经打造了CV(计算机视觉)、NLP(自然语言处理)、AIGC(人工智能内容生成)多个AI大模型。未来基于这些核心优势,在“日日新SenseNova”大模型体系和SenseCore AI大装置的支持下,商汤的多模态大模型持续演进,同时结合决策智能大模型,为AGI的实现提供重要起点。

商汤版ChatGPT来袭,中国激战千亿“大模型”

第二大亮点是首个自研中文语言大模型应用平台。

在“日日新SenseNova”大模型体系当中,商汤科技4月10日还推出了自研的中文语言大模型应用平台“商量”,具备领先的语言理解、生成能力,将科技与人文相互交融。作为高效聊天助手,它可以秒解复杂问题,提供定制化建议,还能辅助创作一流文本,并具备不断学习进化的特性等。

具体来说,在用户价值方面,“商量”可以实现单轮、多轮对话和超长文本理解能力,而且凭借“商量”中文语言大模型强大的长文本理解能力,帮助用户快速通过与大模型互动来获取知识、寻找答案;在技术能力优势方面,商汤拥有千亿参数中文语言大模型,具备问答、理解与生成等全面的中文语言能力,支持企业服务、城市管理、汽车出行等600+垂直领域,并拥有逻辑推演与智能、兼具理解广度与深度、知识自动及时更新等能力。

商汤版ChatGPT来袭,中国激战千亿“大模型”

无论是一人一句编故事,还是连续对话能力,“商量”都能准确、快捷的回答出来。

商汤版ChatGPT来袭,中国激战千亿“大模型”

此外,“商量”已经在行业实现了应用,尤其在医疗行业和编程领域。从现场实际demo当中可以看到,基于大模型应用平台,它能够准确、快捷地回答关于腹部痛等关键性问题,给出医疗参考方案。

第三大亮点是生成式AI应用,真正为短视频、直播产业带来生产力提升。

此次,商汤把GPT大模型应用于生成式 AI 领域,重构人与空间在数字时代的结合。商汤基于“日日新SenseNova”大模型体系,自研了包括秒画、如影、琼宇、格物等视频内容的制作和生成工具平台,为短视频、直播产业带来生产力的提升。

以“秒画”为例,其是商汤科技打造的AI内容创作社区平台,可帮助用户轻松地创作高质量的艺术作品,自动生成元素和细节,并可不断学习与提升。其中,“秒画”具备超10亿参数自研文生图生成模型,支持二次元、三次元等多种生成风格;推理速度快,单卡支持每2秒生成1张512分辨率的图片;用户可基于单卡A100,5分钟内定制属于自己的LoRA模型20张训练图片;汇聚了1万+开源模型,基于平台发布的模型可设置为ToB服务API,结合商汤大算力对外提供商业化服务,支持用户训练个性化绘模型,满足不同绘画风格需求。
商汤版ChatGPT来袭,中国激战千亿“大模型”

“秒画”带来个性化文生图能力(来源:商汤)

而另一种“琼宇”、“格物” 3D内容生成平台,是商汤科技基于神经辐射场技术(NeRF)的3D内容生成平台,分别是指琼宇大空间3D内容生成应用、格物小物体3D内容生成应用,可基于 3D 内容生成技术实现对空间和物体的复刻与交互。传统人工建模10000人/天的建模任务,通过“琼宇”只需要2天即可完成(算力为1200 TFLOPS)。

商汤表示,上述两套平台生成的各类3D内容都够进行再编辑再创作,通过海量高精度数字资产的生产,满足影视创作、建筑设计、商品营销、数字孪生管理等各类对可交互3D实景内容有强烈需求的应用场景。

最后一个亮点就是独特的行业赋能。商汤让大模型对外提供API接口,以及多元化、多种大模型即服务(MaaS)。

具体来说,在“一平台四支柱”的战略体系下,商汤“日日新SenseNova”大模型体系已全面支持了智能汽车、智慧生活、智慧商业、智慧城市等业务板块,打通了多个领域、行业的应用闭环。

而且,基于“日日新SenseNova”大模型体系,商汤将向客户提供涵盖图片生成、自然语言对话、视觉推理和标注服务等API接口。客户可根据实际应用需求,灵活调用商汤大模型的各项AI技术能力,低门槛、低成本、高效率地实现AI技术在实际业务环节中的部署,或进行二次开发,创造更多价值。

此外,基于商汤AI大装置和大模型体系,商汤将面向客户提供涵盖自动化数据标注、大模型推理部署、大模型并行训练、大模型增量训练、开发者效率提升等多种大模型即服务(Model-as-a-Service),包括自动化数据标注、大模型推理部署、大模型并行训练和大模型增量训练服务、开发者效率提升等。

“这绝对不只是说训练一个参数量非常大的模型,它是一个体系化的大工程。”王晓刚表示。

王晓刚提及,“涌现”这个现象的出现意味着大模型会不断给你惊喜,大模型能有新能力。而商汤在大模型训练本身,以及know-how任务理解都有这样的技术实力。结合自身的特点,具有通用性的商汤大模型,能够真正去帮助客户解决需求和问题。

“未来,我们也是希望能够依靠社区的力量把我们的这些模型进行调教,不只有原始模型,还有各种各样的这样的一些模型存在,能够更好的往前推进。”王晓刚坦言称。

大模型只是起点,奔向 AGI 之路才是重点

对于整个 AI 技术进程来说,大模型绝对不是 AI 发展的终点,而只是起点。

1950年,才华横溢的计算机科学家艾伦·图灵提出了一个他称之为“模仿游戏”的思想实验。面试官通过打字机与两个对象交谈,知道一个是人,另一个是机器。图灵建议,如果一台机器能够始终让面试官相信它是人类,我们就可以说它有能力思考。这就是著名的“图灵测试”。

后来的70年间,整个 AI 行业都为之努力,希望打造通过“图灵测试评估”能力的 AI 技术。如今,AI 算法、算力、数据“三驾马车”同步突破,AI 技术已经蓄能完毕,所有人终于可以大展身手了。

作为中国 AI 领域竞争与发展的核心玩家,商汤拥有 AI 行业全栈性研发能力。

商汤科技联合创始人、大装置事业群副总裁陈宇恒表示,所谓的通用人工智能新的创新范式,可以极高的体现商汤现有的一些 AI 产品的模式和能力。从大的方向上,商汤作为人工智能的头部的企业,未来肯定还是要去挑战更大的模型。因为现在很明显的趋势就是,每一代的大模型 AI 和算力有很大的相关性。

“下一代人工智能比上一代,比如说 GPT-4 比 GPT-3可能是百倍级的算力的需求,甚至它的参数量是十倍以上的需求,对应也需要更多的数据去完成训练。所以要不断地去接近所谓的通用人工智能或者 AGI 的路线上,肯定是要把基础的超大模型越做越大。这是未来 2 到 3 年,整个无论从学术界还是从工业界,还是从我们自己的对 AI 的理解上,都是比较明确的方向。”陈宇恒表示。

此前,商汤科技发布了2022财年报告。

财报显示,2022年,商汤研发支出达38亿元人民币(扣除以股份为基础的薪酬开支),同比增长24%,2018年至今累计研发投入达128.47亿元;人均每年研发模型数相较于2021年进一步提高了90%,累计生产的商用模型数提高了93%,至6.7万个。 

当中国大力发展 AI 技术的重要时机下,商汤大量投入技术研发,不断推进数字化、智能化、产业化升级,符合科技创新下的时代特征,如今,商汤高强度的研发投入正在开花结果,在国内大模型军备赛中实现了第一梯队的飞跃,成为行业极稀缺的“头雁”。

英伟达CEO黄仁勋曾表示,当下“我们正处于 Al 的iPhone时刻”。而商汤,也正在迎来属于自己的“iPhone 时刻”。

“AI是生产‘生产力工具’的工具,它将开启软件开发新范式,把我们带入‘新二八定律’的时代,80%的工作由机器完成,20%的工作由人来做。”徐立认为,持续的大规模技术投入带来创新,再有商业模式发展,这是一条罕有人走的路。商汤始终坚信 AI 技术变革带来增量价值,必将推动普惠和公平的智能时代到来。(本文首发钛媒体App,作者|林志佳)

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 1
评论(没有评论)

文心AIGC

2023 年 4 月
 12
3456789
10111213141516
17181920212223
24252627282930
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1 十三 2025-12-15 14:13:14 ...
跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026

跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026

跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026 一水 2025-1...
10亿美元OpenAI股权兑换迪士尼版权!米老鼠救Sora来了

10亿美元OpenAI股权兑换迪士尼版权!米老鼠救Sora来了

10亿美元OpenAI股权兑换迪士尼版权!米老鼠救Sora来了 一水 2025-12-12 13:56:19 ...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026

跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026

跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026 一水 2025-1...
10亿美元OpenAI股权兑换迪士尼版权!米老鼠救Sora来了

10亿美元OpenAI股权兑换迪士尼版权!米老鼠救Sora来了

10亿美元OpenAI股权兑换迪士尼版权!米老鼠救Sora来了 一水 2025-12-12 13:56:19 ...
IDC MarketScape: 容联云位居“中国AI赋能的联络中心”领导者类别

IDC MarketScape: 容联云位居“中国AI赋能的联络中心”领导者类别

IDC MarketScape: 容联云位居“中国AI赋能的联络中心”领导者类别 量子位的朋友们 2025-1...