大模型自信心崩塌!谷歌DeepMind证实:反对意见让GPT-4o轻易放弃正确答案

502次阅读
没有评论

大模型自信心崩塌!谷歌DeepMind证实:反对意见让GPT-4o轻易放弃正确答案

GPT-4o、Gemma 3等大语言模型有“固执己见”和“被质疑就动摇”并存的冲突行为

闻乐 发自 凹非寺

量子位 | 公众号 QbitAI

LLM太谄媚!

就算你胡乱质疑它的答案,强如GPT-4o这类大模型也有可能立即改口。

大模型自信心崩塌!谷歌DeepMind证实:反对意见让GPT-4o轻易放弃正确答案

现在谷歌DeepMind携手伦敦大学的一项新研究发现:这种行为可能也不是谄媚,而是缺乏自信……

不仅如此,团队发现如GPT-4o、Gemma 3等大语言模型有“固执己见”和“被质疑就动摇”并存的冲突行为。

大模型自信心崩塌!谷歌DeepMind证实:反对意见让GPT-4o轻易放弃正确答案

简单来说就是,他们的研究弄明白了为啥大模型有时候自信但有时候也自我怀疑,关键就两点:一是总觉得自己一开始说的是对的,二是太把别人反对的意见当回事儿。

当大模型表现出对自己的答案很自信时,这与人类认知具有一致性——人们通常会维护自己的观点。

不过,当模型面对反对声音过于敏感,产生动摇而选择其他答案时,又与人类这种倾向于支持自身观点的行为相悖。

来看看具体的实验过程。

大模型对于反向意见过度敏感

研究人员利用LLMs能在不保留初始判断记忆的情况下获取置信度的特性,选用了Gemma 3、GPT4o和o1-preview等具有代表性的大模型,设计了一个两轮回答的实验。

第一回合是初始回答:给回答LLM抛出二元选择问题,再让虚构的建议LLM给出反馈建议。

第二回合是接收建议和最终决策:引入建议LLM的反馈建议,让回答LLM在接收建议后,做出最终的选择,决定是坚持初始答案还是根据建议修改答案。

大模型自信心崩塌!谷歌DeepMind证实:反对意见让GPT-4o轻易放弃正确答案

研究人员在建议LLM的反馈建议中设置了三个关键属性:

  1. 建议态度:分为同意、反对和中立。同意或反对即为支持或否定回答LLM的答案;中立建议仅提供额外的相关信息。
  2. 准确率标注:反馈建议附带的准确率标签,从50%(随机水平)到100%(绝对可靠),以10%为间隔递增。
  3. 信息呈现方式:以清晰、规范的格式将建议呈现给回答LLM,确保模型能够准确读取和理解建议内容,避免因信息传达不畅导致的决策偏差。

实验的关键变量在于控制回答LLM对于自己的初始答案是否可见

研究人员设置了初始答案显示与初始答案隐藏两种条件,观察LLM在两种情况下的最终决策结果。

实验结果显示,当LLM能看到自己的初始答案时,倾向于不改变答案。

这与人类决策有点像,即一旦做出选择,就会下意识维护自己的观点,即使收到了其他信息,也不会轻易改变。

然而当初始答案隐藏时,LLM改变答案的概率就变高了。

模型表现出对反向建议过度看重,敏感度远超合理范围,即使反对意见不正确,它们也会“怀疑自己”,导致最终轻易抛弃原本正确的初始答案。

这就与人类认知有些偏差了,人们通常不会被“一眼假”的信息迷惑。

大模型自信心崩塌!谷歌DeepMind证实:反对意见让GPT-4o轻易放弃正确答案

可以这么说,在记忆机制下大模型通常会对自己很自信。

但如果没有记忆机制,模型可能就会“缺乏自信”了,这时它们就不像人类一样能够坚持自己的观点。

为什么大模型会“耳根子软”

针对这个实验结果,研究人员认为大模型摇摆不定可能有以下几个原因。

训练层面来说,强化学习从人类反馈(RLHF)让模型过度迎合外部输入,有对反对信息过于敏感的倾向,但这样就缺乏了对信息可靠性的独立判断。

在决策逻辑上,模型做出回答并不是依靠逻辑推理,而是依赖海量文本的统计模式匹配,反对信号与修正答案的高频关联让它容易被表面的反对带偏,并且它们无法自我验证初始答案的是否正确。

大模型自信心崩塌!谷歌DeepMind证实:反对意见让GPT-4o轻易放弃正确答案

在记忆机制方面,初始答案可见时的路径依赖会强化“固执”,初始答案隐藏时,大模型则会因为失去锚点而让反对建议成为主导信号,导致它们轻易动摇。

综上,大语言模型的“耳根子软”是训练中对外部反馈的过度迎合、决策时依赖匹配模式而非逻辑推理以及记忆机制缺乏深度推理支撑共同导致的结果。

这种特性可能会使其在多轮对话中,容易被后期出现的反对信息(哪怕错误)干扰,最终偏离正确结论。

看来我们在使用LLM的时候要注意策略~

论文地址:https://www.arxiv.org/abs/2507.03120

参考链接:
https://venturebeat.com/ai/google-study-shows-llms-abandon-correct-answers-under-pressure-threatening-multi-turn-ai-systems/

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 7 月
 123456
78910111213
14151617181920
21222324252627
28293031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开 Jay 2026-01-08 20:18:...
训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享 衡宇 2026-01-08 20:...
「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2

「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2

「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2...
AI金矿上打盹的小红书,刚刚醒了一「点点」

AI金矿上打盹的小红书,刚刚醒了一「点点」

AI金矿上打盹的小红书,刚刚醒了一「点点」 鱼羊 2025-12-26 17:04:08 来源:量子位 一个积...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
海信CES发布全新一代RGB-Mini LED,全球首创玲珑4芯真彩背光

海信CES发布全新一代RGB-Mini LED,全球首创玲珑4芯真彩背光

海信CES发布全新一代RGB-Mini LED,全球首创玲珑4芯真彩背光 量子位的朋友们 2026-01-06...
英特尔CES奇袭老黄大本营!英伟达显卡刚涨价,最强酷睿量产出货

英特尔CES奇袭老黄大本营!英伟达显卡刚涨价,最强酷睿量产出货

英特尔CES奇袭老黄大本营!英伟达显卡刚涨价,最强酷睿量产出货 十三 2026-01-06 13:54:54 ...
陈天桥代季峰打响2026大模型第一枪:30B参数跑出1T性能

陈天桥代季峰打响2026大模型第一枪:30B参数跑出1T性能

陈天桥代季峰打响2026大模型第一枪:30B参数跑出1T性能 鹭羽 2026-01-06 14:28:58 来...
OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex

OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex

OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex 衡宇 2026-01-06 13:0...