桌面版ChatGPT登台演讲,能视频通话还会实时读屏,GPT-4o最新demo再次惊艳:“能力还是被低估了”

1,307次阅读
没有评论

克雷西 发自 凹非寺
量子位 | 公众号 QbitAI

GPT-4o桌面端最新Demo,与Sora的新作品一同亮相“欧洲AI春晚”VivaTech。

现场,OpenAI工作人员不仅展示了观众期待已久的“视频通话”,还试着让ChatGPT发表了演讲。

【视频请到公众号查看】

在视频聊天当中,即使给它的只有一幅抽象的简笔画,它也能立马get到这是巴黎地标。

桌面版ChatGPT登台演讲,能视频通话还会实时读屏,GPT-4o最新demo再次惊艳:“能力还是被低估了”

然后再给它看一眼地铁图,指一指当前位置,就能火速设计出乘车路线。

桌面版ChatGPT登台演讲,能视频通话还会实时读屏,GPT-4o最新demo再次惊艳:“能力还是被低估了”

而且,除了能像移动端一样通过摄像头感知环境之外,桌面端的ChatGPT还能够对屏幕内容进行读取,结合代码现场debug。

桌面版ChatGPT登台演讲,能视频通话还会实时读屏,GPT-4o最新demo再次惊艳:“能力还是被低估了”

一系列震撼的演示效果,让前线的Tom’s Guide编辑Ryan Morrison感叹,GPT的语音功能和GPT-4o的潜力,看来是被低估了。

桌面版ChatGPT登台演讲,能视频通话还会实时读屏,GPT-4o最新demo再次惊艳:“能力还是被低估了”

桌面端“视频通话”震撼全场

在现场给400多名观众演示ChatGPT最新功能的,是OpenAI开发者体验主管Romain Huet。

本来Huet打算用手机来演示,结果受到现场技术条件限制无法展示,于是改用Mac,但也正是如此观众们才有机会看到它的屏幕读取能力。

一开始,Huet问ChatGPT能不能给现场的观众讲一点什么,然后ChatGPT真就像模像样地打起了招呼。

不过Huet觉得这样的开场白还不够有气势,于是提示它面前是一大群人,它马上就心领神会,改用了更“燃”的措辞和语气。

【视频请到公众号查看】

当然,Huet没有让ChatGPT一直讲下去,而是在做完开场白之后改由自己来介绍其最新功能。

所有对话,即使跨越语言也能快速响应,现场Huet就要求ChatGPT把自己说的英文翻译成法语,整个过程行云流水。

另外,看上去是bug,但也许是feature的一点是,翻译出的法语还带着一些美国口音,不过Huet表示之后会进行优化,让ChatGPT说外(非英)语时更像当地人。

【视频请到公众号查看】

又是一通补充讲解之后,人们期待的“视频通话”功能终于正式登场了。

只见Huet现场用笔画出了埃菲尔铁塔和凯旋门的草图,结果ChatGPT只看了一眼就直接识破。

Huet自己也打趣地对它说,”非常感谢你,我画的这么烂你都能看懂。”

【视频请到公众号查看】

这还没完,Huet紧接着又掏出了一张巴黎地铁图,用手指了指当前的大概位置。

然后,ChatGPT立刻就给出了前往埃菲尔铁塔的乘车路线,随着Huet的一句Thank You,现场爆发了潮水般的掌声。

【视频请到公众号查看】
当然,最新的ChatGPT不仅能拿来读取摄像头画面,也能实时读取屏幕和剪贴板当中的内容。

作为OpenAI负责开发者体验的主管,Huet和ChatGPT一起现场搞起了代码。

Huet通过复制到剪贴板的方式,让客户端读取了一段React框架编写的网页代码,结果ChatGPT立马就把代码的语言、功能介绍得头头是道。

甚至还当众进行了Debug,通过让ChatGPT读取屏幕,Huet告诉它目前这个网页存在不能根据屏幕宽度进行适配的问题。

通过几轮对话,Huet成功借助ChatGPT的帮助,完美解决了这个问题,再次收获了观众的掌声。

【视频请到公众号查看】

One More Thing

在现场,Huet还播放了一段用Sora为大会创作的新视频,由于现场生成时间较长,观众看到的视频预先制作好的,这也是活动中唯一一个提前做好的效果。

【视频请到公众号查看】

一同展示的还有声音克隆引擎Voice Engine,Huet录制了一段20秒的声音样本,并用VE进行了完美复刻,而且只需一个按钮,就能从英语切换到法语、日语等其他语言,并在Sora中应用。

不过由于安全问题仍未解决,Sora和Voice Engine依旧不能公开发布,想体验的朋友要再等一等了。

另外,说到克隆声音的问题,寡姐和OpenAI关于Sky的争议刚好也有了新消息。

华盛顿邮报称,根据其所获得的文件和录音显示,给Sky配音的女演员的确另有其人。

而且,寡姐所称的受到奥特曼邀请发生在去年9月,而配音演员的招募在5月就已开始。

桌面版ChatGPT登台演讲,能视频通话还会实时读屏,GPT-4o最新demo再次惊艳:“能力还是被低估了”

不过,仍然有网友认为,就算真的是另找了一名演员,也不能说明OpenAI就没有模仿寡姐的意图。

但无论OpenAI的意图如何,真正给Sky配音的演员却是无辜的,也有表演的权利。

不少网友发声对她表示同情:

Sky的配音演员同样有权利使用她自己的声音,难道因为(寡姐)是名人,所拥有的知识产权就比普通人更多吗?

进一步地,我认为虽然“OpenAI侵犯了寡姐的‘公开权’”这个观点比单纯的侵犯知识产权的想法好些,但仍然站不住脚。

桌面版ChatGPT登台演讲,能视频通话还会实时读屏,GPT-4o最新demo再次惊艳:“能力还是被低估了”

总之,寡姐抛向OpenAI的子弹仍未落地,我们不妨一边吃瓜,一边等待着GPT-4o视频对话的正式更新。

参考链接:
[1]https://vimeo.com/949419199
[2]https://www.tomsguide.com/ai/chatgpt/i-finally-saw-a-live-demo-of-chatgpt-4o-voice-if-anything-it-is-underhyped
[3]https://www.washingtonpost.com/technology/2024/05/22/openai-scarlett-johansson-chatgpt-ai-voice/

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2024 年 5 月
 12345
6789101112
13141516171819
20212223242526
2728293031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议 梦晨 2025-12-11 15:33:51 来源:量子位 A...
商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1 十三 2025-12-15 14:13:14 ...
跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026

跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026

跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026 一水 2025-1...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
预见未来:96位前沿先锋超万字核心观点总结,抢抓未来产业新高地

预见未来:96位前沿先锋超万字核心观点总结,抢抓未来产业新高地

预见未来:96位前沿先锋超万字核心观点总结,抢抓未来产业新高地 henry 2025-12-11 10:27:...
Meta公开抄阿里Qwen作业,还闭源了…

Meta公开抄阿里Qwen作业,还闭源了…

Meta公开抄阿里Qwen作业,还闭源了… Jay 2025-12-11 11:48:25 来源:量子位 Ja...
MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这

MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这

MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这 西风 2025-12-11 15:...
钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议 梦晨 2025-12-11 15:33:51 来源:量子位 A...