GPT-4能通过图灵测试吗?

1,247次阅读
没有评论

Does GPT-4 Pass the Turing Test?

C Jones, B Bergen
[UC San Diego]

GPT-4能通过图灵测试吗?

要点:

  • 在公开的在线图灵测试中评估GPT-4,最佳的GPT-4提示通过了41%的测试,超过了ELIZA(27%)和GPT-3.5(14%),但低于随机猜测(50%)和人类表现(63%)。
  • 参与者的决定主要基于语言风格(35%)和社交情感特征(27%),而不是是否智能,这表明这个测试衡量的是自然的交流/欺骗能力,而不仅仅是智能。
  • 参与者的身份统计数据,如教育程度、对LLM的熟悉程度,都无法预测检测率,这表明即使专家也容易受到欺骗。
  • 尽管作为智能测试受到批评,图灵测试仍然相关,因为它可以跟踪欺骗能力并分析人们判断人类特征所用的策略和标准。
  • 最佳的GPT-4提示通过率达到41%,但没有提示能明确通过图灵测试(按照通过50%或等同于人类表现的标准),提示工程具有挑战性,但进一步改进似乎是可能的。
  • 该测试框架有助于理解大众对人工质量的假设,参与者更关注语言风格的流畅性和社交情感因素,而不是智力。
  • ELIZA 27%的成功突显了ELIZA效应,并表明智力不足以通过测试,讯问者认为它过于不合作,不可能是一个现代AI
  • 结果表明当前的LLM在正确的环境下常能欺骗,但可靠通过图灵测试可能需要进一步的进步,欺骗能力可能会对社会造成严重影响。

动机:评估GPT-4在公开在线图灵测试中的表现,探讨其是否能通过图灵测试,以及参与者判断的主要依据和其对社会的潜在影响。
方法:采用了在线图灵测试的两人对话形式,将GPT-4作为被询问者,通过与人类参与者进行对话来评估其通过图灵测试的能力。
优势:GPT-4在测试中表现出色,超过了ELIZA和GPT-3.5的基准,但仍不及人类参与者。研究发现,参与者的判断主要基于语言风格和社会情感特征,支持单独智能不足以通过图灵测试的观点。

评估了GPT-4在公开在线图灵测试中的表现,发现其能力超过了基准模型,但仍不及人类参与者,同时支持单独智能不足以通过图灵测试的观点。

https://arxiv.org/abs/2310.20216 
GPT-4能通过图灵测试吗?
GPT-4能通过图灵测试吗?

GPT-4能通过图灵测试吗?
Image on 2023-11-02 05.42.12 AM
 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2023 年 11 月
 12345
6789101112
13141516171819
20212223242526
27282930  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议 梦晨 2025-12-11 15:33:51 来源:量子位 A...
商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1 十三 2025-12-15 14:13:14 ...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了 衡宇 2025-12-10 12:3...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案

戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案

戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案 十三 2025-12-10 1...
九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局

九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局

九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局 量子位的朋友们 2025-12-10 18:...
乐奇Rokid这一年,一路狂飙不回头

乐奇Rokid这一年,一路狂飙不回头

乐奇Rokid这一年,一路狂飙不回头 梦瑶 2025-12-10 20:41:15 来源:量子位 梦瑶 发自 ...