4o-mini只有8B，o1也才300B！微软论文意外曝光GPT核心机密

一水
2025-01-02
11:09:19

来源：量子位

网友：按价格算也对得上

微软又把OpenAI的机密泄露了？？在论文中明晃晃写着：

o1-preview约300B参数，GPT-4o约200B，GPT-4o-mini约8B……

英伟达2024年初发布B200时，就摊牌了GPT-4是1.8T MoE也就是1800B，这里微软的数字更精确，为1.76T。

除此之外，论文中给OpenAI的mini系列，Claude3.5 Sonnet也都附上了参数，总结如下：

o1-preview约300B；o1-mini约100B
GPT-4o约200B；GPT-4o-mini约8B
Claude 3.5 Sonnet 2024-10-22版本约175B
微软自己的Phi-3-7B，这个不用约了就是7B

虽然论文中后面也有免责声明：

确切数据尚未公开，这里大部分数字是估计的。

但还是有不少人觉得事情没这么简单。

比如为什么唯独没有放谷歌Gemini模型的参数估计？或许他们对放出来的数字还是有信心的。

也有人认为，大多数模型都是在英伟达GPU上运行的，所以可以通过token生成速度来估计。

只有谷歌模型是在TPU上运行的，所以不好估计。

而且微软也不是第一次干这事了。

23年10月，微软就在一篇论文里“意外”曝出GPT-3.5-Turbo模型的20B参数，在后续论文版本中又删除了这一信息。

就说你是故意的还是不小心的？

微软这篇论文说了什么

实际上，原论文介绍了一项与医学相关的benchmark——MEDEC。

12月26日就已经发布，不过是比较垂直领域的论文，可能非相关方向的人都不会看，年后才被列文虎克网友们发现。

研究起因是，据美国医疗机构调查显示，有1/5的患者在阅读临床笔记时报告发现了错误，而40%的患者认为这些错误可能影响他们的治疗。

而且另一方面，LLMs(大语言模型）被越来越多的用于医学文档任务（如生成诊疗方法）。

因此，MEDEC此番有两个任务。一是识别并发现临床笔记中的错误；二是还能予以改正。

为了进行研究，MEDEC数据集包含3848份临床文本，其中包括来自三个美国医院系统的488份临床笔记，这些笔记之前未被任何LLM见过。

它涵盖五种类型的错误（诊断、管理、治疗、药物治疗和致病因子），这些错误类型是通过分析医学委员会考试中最常见的问题类型选择的，并由8位医疗人员参与错误标注。

而参数泄露即发生在实验环节。

按照实验设计，研究者将选取近期主流的大模型和小模型来参与笔记识别和纠错。

而就在介绍最终选定的模型时，模型参数、发布时间一下子都被公开了。

对了，省去中间过程，这项研究得出的结论是：Claude 3.5 Sonnet在错误标志检测方面优于其他LLM方法，得分为70.16，第二名是o1-mini。

网友：按价格算合理

每一次，ChatGPT相关模型架构和参数泄露，都会引起轩然大波，这次也不例外。

23年10月，微软论文声称GPT-3.5-Turbo只有20B参数的时候，就有人感叹：难怪OpenAI对开源模型这么紧张。

24年3月，英伟达确认GPT-4是1.8T MoE，而2000张B200可以在90天内完成训练的时候，大家觉得MoE已经且仍将是大模型架构趋势。

这一次，基于微软估计的数据，网友们主要有几个关注点：

如果Claude 3.5 Sonnet真的比GPT-4o还小，那Anthropic团队就拥有技术优势。

以及不相信GPT-4o-mini只有8B这么小。

不过此前也有人根据推理成本来算，4o-mini的价格是3.5-turbo的40%，如果3.5-turbo的20B数字准确，那么4o-mini刚好是8B左右。

不过这里的8B也是指MoE模型的激活参数。

总之，OpenAI大概是不会公布确切数字了。

此前奥特曼征集2024年新年愿望，最后公布的清单中还有“开源”。2025年的最新版本里，开源已经被去掉了。

论文地址：
https://arxiv.org/pdf/2412.19260

2025 年 1 月
一	二	三	四	五	六	日
	1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง

tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.

ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.

ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.

ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!

ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

4o-mini只有8B，o1也才300B！微软论文意外曝光GPT核心机密

4o-mini只有8B，o1也才300B！微软论文意外曝光GPT核心机密

微软这篇论文说了什么

网友：按价格算合理

小说创作

清库存！DeepSeek突然补全R1技术报告，训练路径首次详细公开

训具身模型遇到的很多问题，在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

「北京版幻方」冷不丁开源SOTA代码大模型！一张3090就能跑，40B参数掀翻Opus-4.5和GPT-5.2

AI金矿上打盹的小红书，刚刚醒了一「点点」

字节Seed：大概念模型来了，推理的何必是下一个token

海信CES发布全新一代RGB-Mini LED，全球首创玲珑4芯真彩背光

英特尔CES奇袭老黄大本营！英伟达显卡刚涨价，最强酷睿量产出货

陈天桥代季峰打响2026大模型第一枪：30B参数跑出1T性能

OpenAI推理第一人离职，7年打造了o3/o1/GPT-4/Codex

文心AIGC

小说创作

清库存！DeepSeek突然补全R1技术报告，训练路径首次详细公开

训具身模型遇到的很多问题，在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

「北京版幻方」冷不丁开源SOTA代码大模型！一张3090就能跑，40B参数掀翻Opus-4.5和GPT-5.2

AI金矿上打盹的小红书，刚刚醒了一「点点」

字节Seed：大概念模型来了，推理的何必是下一个token

海信CES发布全新一代RGB-Mini LED，全球首创玲珑4芯真彩背光

英特尔CES奇袭老黄大本营！英伟达显卡刚涨价，最强酷睿量产出货

陈天桥代季峰打响2026大模型第一枪：30B参数跑出1T性能

OpenAI推理第一人离职，7年打造了o3/o1/GPT-4/Codex