刚刚!马斯克发布史上最大开源模型,高达3140亿参数

1,529次阅读
没有评论

刚刚!马斯克发布史上最大开源模型,高达3140亿参数

不爽OpenAI很久的马斯克终于行动了!

今天,马斯克旗下的xAI宣布开源大型语言模型Grok-1,这是一个由 xAI 从头开始训练的 3140 亿参数混合专家模型。

这也是迄今为止参数量最大的开源模型,大于 GPT-3/3.5,同时比 Meta 的 Llama 270B参数量大四倍多。

尽管参数计数与性能并不严格相关,但与大型、高质量的训练数据集和架构配合使用时通常会提供更好的结果。

此次开源,xAI发布了Grok-1的基本模型权重和网络架构,可在GitHub上获取。(https://github.com/xai-org/grok-1)


刚刚!马斯克发布史上最大开源模型,高达3140亿参数

Grok-1 的性能优于 GPT-3.5

该模型是2023年10月预训练阶段的原始基础模型,没有针对任何特定应用(例如对话)进行微调。

结构上,Grok-1 的架构基于混合专家(MoE)设计。包含8个专家,总参数量为314B,处理Token时,其中的两个专家会被激活,激活参数量为86B。

xAI在11 月份发布的published基准测试表明,Grok-1 的性能优于 GPT-3.5 和 Llama 2。

越来越多的研究人员认为,MoE 模型是比加载参数计数更有效的方法,可以扩展到更高的性能。MoE 模型不是由处理所有查询的单个大型模型组成,而是由多个按任务专门化的“专家”模型组成。例如,用于推理、语言翻译、语言生成、摘要或数学的专家子模型。

与 GPT-3 等统一模型不同,MoE 模型还具有仲裁功能。仲裁根据请求将任务分配给子模型,并在交付给用户之前对响应进行评级。通过不为每个查询激活整个LLM,模型通常可以降低计算成本和延迟。

此次发布正值马斯克和 OpenAI 之间的紧张关系日益紧张之际。

马斯克本来是OpenAI的发起人之一,后因担心 OpenAI 将利润置于安全之上而于 2018 年离开,他对公司的批评越来越直言不讳。


刚刚!马斯克发布史上最大开源模型,高达3140亿参数

他最近对 OpenAI 提起诉讼,指责OpenAI 实际上已成为世界上最有价值的科技公司微软的事实上的闭源子公司。马斯克认为,这种转变是对创始协议的“公然背叛”。

对各领域有重大影响

随着人工智能领域持续快速发展,Grok-1 等模型的开源可能会产生重大影响(尽管运行该模型需要大量计算资源)。

此番Grok-1的开源,无疑是对 OpenAI 的直接攻击。因为该模型在Apache 2.0 许可协议下发布,对于后续商用模型很友好。

很多行业领域的大模型就根据通用开源大模型进行微调而来,例如谷歌和DeepMind共同打造的多模态生成模型Med-PaLM M就是通用大模型PaLM-E微调的结果,能够AI阅览医学影像,报告生成和摘要、基因组变体调用等任务。

可以期待一波生物医药大模型的再次爆发和进化了。


The End—

推荐阅读

刚刚!马斯克发布史上最大开源模型,高达3140亿参数刚刚!马斯克发布史上最大开源模型,高达3140亿参数刚刚!马斯克发布史上最大开源模型,高达3140亿参数刚刚!马斯克发布史上最大开源模型,高达3140亿参数

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2024 年 3 月
 123
45678910
11121314151617
18192021222324
25262728293031
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
共推空天领域智能化升级!趋境科技与金航数码强强联手

共推空天领域智能化升级!趋境科技与金航数码强强联手

共推空天领域智能化升级!趋境科技与金航数码强强联手 十三 2025-12-09 18:18:41 来源:量子位...
起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机” 西风 202...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
小冰之父李笛智能体创业,公司取名Nextie!陆奇是股东

小冰之父李笛智能体创业,公司取名Nextie!陆奇是股东

小冰之父李笛智能体创业,公司取名Nextie!陆奇是股东 Jay 2025-12-09 08:26:01 来源...
梁文锋,Nature全球年度十大科学人物!

梁文锋,Nature全球年度十大科学人物!

梁文锋,Nature全球年度十大科学人物! 一水 2025-12-09 09:46:23 来源:量子位 来自安...
起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机” 西风 202...
摩尔线程新一代GPU架构10天后发布

摩尔线程新一代GPU架构10天后发布

摩尔线程新一代GPU架构10天后发布 思邈 2025-12-09 15:46:09 来源:量子位 国内首个聚焦...
极客公园创新大会 2026在京落幕,罗永浩、张楠、何小鹏、刘靖康等共议 AI 时代「进程由我」

极客公园创新大会 2026在京落幕,罗永浩、张楠、何小鹏、刘靖康等共议 AI 时代「进程由我」

极客公园创新大会 2026在京落幕,罗永浩、张楠、何小鹏、刘靖康等共议 AI 时代「进程由我」 henry 2...