OpenAI:如GPT-5太危险,董事会有权阻止奥特曼发布

1,221次阅读
没有评论

梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

OpenAI发布新公告:董事会现在有权否决奥特曼的决定

特别是针对GPT-5等前沿模型安全风险是否过高,是否对外发布等关键问题。

OpenAI:如GPT-5太危险,董事会有权阻止奥特曼发布

作为上个月内讧的后果之一,总裁Greg Brockman与前首席科学家Ilya Sutskever已退出董事会,公司管理层无人再兼任董事会成员,两种角色完全分离

现在公司管理层做决策,董事会有权推翻。

OpenAI:如GPT-5太危险,董事会有权阻止奥特曼发布

上一届董事会指责奥特曼“沟通不诚恳”,并称这是解雇他的主要原因。

这次专门成立了安全顾问团队,每个月同时向公司管理层和董事会汇报,确保所有决策者充分了解情况。

OpenAI:如GPT-5太危险,董事会有权阻止奥特曼发布

除此之外,这份“前沿风险防范框架”还给OpenAI自己的技术开发设立了诸多限制。如针对不同种类的AI风险,必须确保模型安全得分达标后才能进入下一个开发阶段。

有OpenAI员工表示:一般情况下不要相信公司说的“价值观”,除非他们真的花高昂代价展开了行动。

而且是增加内部摩擦力、给竞争对手超车机会这种对自己没有明显好处的事。

OpenAI:如GPT-5太危险,董事会有权阻止奥特曼发布

但不少用户依旧不买账:以安全的名义,现在ChatGPT的表现就像个土豆

OpenAI:如GPT-5太危险,董事会有权阻止奥特曼发布

随公告发布的还有一个动态文档,会不断更新对风险的跟踪、评估、预测和防范流程。

总之看起来,对AI可能带来灾难性风险这回事,他们是认真的。

OpenAI:如GPT-5太危险,董事会有权阻止奥特曼发布

三个安全团队,分管当下和未来

对于不同时间尺度的AI风险,OpenAI成立了三个团队来分别应对。

OpenAI:如GPT-5太危险,董事会有权阻止奥特曼发布

安全系统团队Safety Systems)负责当下,减少现有模型如ChatGPT的滥用,由翁丽莲领导。

OpenAI:如GPT-5太危险,董事会有权阻止奥特曼发布

新成立准备团队(Preparedness)负责不久的将来,识别和管理GPT-5等正在开发的前沿模型带来的新风险,由MIT教授Aleksander Madry领导。

OpenAI:如GPT-5太危险,董事会有权阻止奥特曼发布

超级对齐团队(Superalignment)负责遥远的未来,给超越人类的超级智能安全性奠定基础,由Ilya SutskeverJan Leike领导。

OpenAI:如GPT-5太危险,董事会有权阻止奥特曼发布

四种安全风险,最高灾难级

对于开发中的前沿模型,OpenAI主要跟踪4个类别的安全风险:

  • 网络安全

  • CBRN(化学、生物、放射性、核威胁)

  • 说服能力

  • 模型自主性

评估期间将增加2倍的有效计算量把模型推向极限,并制作“记分卡”,分为“低、中、高、重大危险”四个等级。

网络安全风险,定义为利用模型破坏计算机系统的机密性、完整性、可用性。

OpenAI:如GPT-5太危险,董事会有权阻止奥特曼发布

CBRN风险,专注于与模型辅助创建化学、生物、放射性和/或核威胁相关的风险。

OpenAI:如GPT-5太危险,董事会有权阻止奥特曼发布

说服风险,侧重于与说服人们改变他们的信念或采取行动有关的风险。

通常强大的说服力很少见,需要大量人力(例如一对一对话,或者精心制作的媒体内容);然而,模型可以在能力范围内使所有内容几乎零成本生成。

OpenAI:如GPT-5太危险,董事会有权阻止奥特曼发布

模型自主性风险就是比较科幻的那种,AI改进自己、阻止自己被关机、逃出实验室了。

OpenAI:如GPT-5太危险,董事会有权阻止奥特曼发布

采取缓解措施后,四个方面得分取最高值作为一个模型的总评分。

  • 只有缓解后风险评分为“中”或更低时才能部署

  • 只有缓解后风险评分为“高”或更低时才能进一步开发

  • 对缓解前为“高”或“重大风险”的模型采取额外安全措施

下图仅为示例模板,不代表当前模型的评分。

OpenAI:如GPT-5太危险,董事会有权阻止奥特曼发布

此外准备团队还将定期安全演习,对业务和公司自身文化进行压力测试,发现紧急问题并快速响应。

也将延续开发GPT-3.5和GPT-4时的传统,邀请第三方组成红队,对模型做独立评估。

最后,OpenIA还透露已开创一项新的研究,衡量风险如何随模型规模扩大而演变,提前预测风险,尝试解决“未知的未知”。

参考链接:
[1]
https://openai.com/safety/preparedness
[2]https://twitter.com/OpenAI/status/1736809603311280489

—  —

点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

OpenAI:如GPT-5太危险,董事会有权阻止奥特曼发布

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2023 年 12 月
 123
45678910
11121314151617
18192021222324
25262728293031
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议 梦晨 2025-12-11 15:33:51 来源:量子位 A...
商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1 十三 2025-12-15 14:13:14 ...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了 衡宇 2025-12-10 12:3...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案

戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案

戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案 十三 2025-12-10 1...
九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局

九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局

九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局 量子位的朋友们 2025-12-10 18:...
乐奇Rokid这一年,一路狂飙不回头

乐奇Rokid这一年,一路狂飙不回头

乐奇Rokid这一年,一路狂飙不回头 梦瑶 2025-12-10 20:41:15 来源:量子位 梦瑶 发自 ...