明敏 发自 凹非寺
量子位 | 公众号 QbitAI
现在,它不仅支持上传PDF等各种你想分析的文件。
还能在一个对话里,自动切换使用各种工具,Dall·E、浏览器、数据分析等能一条龙使用了。
这一更新,让不少人惊呼:许多创业项目死于今天。
英伟达AI科学家调侃说,那些套壳公司们可以去过万圣节了🎃。
在你为一个创新点子兴奋前,一定要想想,它是不是能让大厂几个程序员轻松快速做出来。
到底更新了啥?举个栗子🌰:
让ChatGPT上网找一下过去2周内比赛过的足球队,为他们生成一张逼真图像来体现他们赢了或者输了的情绪。(该怎么做取决于检索到的信息)
然后ChatGPT就一次性调用了browsing和Dall·E3给出了图像。
接着上传一张爆火的AI图像“教皇时装秀”,让ChatGPT把图片风格改成这样,并且强调对内最知名的球员。
结果ChatGPT就输出了如下图像。
这意味着现在ChatGPT更有必应味儿了。
想要使用多个工具,不用再手动从下拉菜单里选择,而是让ChatGPT自行理解需要调用什么功能,生产力、效率再度up up。
怪不得还只是小范围用户灰度测试(面向Plus用户),就马上引来大量网友围观。
还有人评论:这是AGI吧?
也有不少人恰柠檬了:啊啊啊怎么才能进入内测名单?
具体升级都有啥?一起来看。
上网画图数据分析一条龙
先来看支持PDF等文件的分析功能。
上传文件后给出指令,比如用两句话总结这个PDF。
ChatGPT可以直接给出回答。
也可以进行更加细节的提问。比如模型Mistral的PIQA分数比Code Llama高多少?
ChatGPT会自动提取关键字在文件内搜索、给出回答。
ChatGPT竞品Claude 2在更早之前上线了这一功能,支持10MB以下PDF,对话窗口支持200k长度文本。ChatGPT的相关数据现在还没有明确公布。
再来看“工具大荟萃”升级。
它能理解指令的需求,找到对应的工具。
多种组合已经被网友们玩出花来了。
上网+Dall·E3组合,即可生成实时天气卡片。
或者从搜索到的信息里提取多个信息点,分别生成图片。
检索2023年大西洋飓风的数据,然后制作一个信息图,根据飓风的大小表示飓风的类别级别和飓风。然后根据明年最有可能出现飓风的位置生成图像。
Dall·E3+GPT-4V联合使用,控制生成图片的更多细节。
比如先让Dall·E3根据写实照片生成一张皮克斯电影风格图片。
然后再上传图像,将它作为新元素加入到新生成图像中。
此外,还能根据生成图像的数据,进一步生成报告。
如下例子中ChatGPT先使用了GPT-4V能力,理解图像内容;然后使用Dall·E3生成新图像;接着再利用GPT-4V创建报告。
不过,非常强大的插件功能,不包含在这次升级内。
如果想要使用插件,还得是之前手动操作的方式。
有人分析,这可能是出于对插件滥用的担忧。毕竟这么多功能一组合,很可能就搞出点什么“有害组合”。
还有人从ChatGPT客户端代码发现,“GPT-4魔法创造”和“GPT-4全工具”两种模式被提及。
后者对应的应该就是这一次更新。
前者所谓的“魔法创造”,可能还藏有更多能力。
而就在下周(11月6日),OpenAI将举办首届开发者大会,届时他们将向外界介绍正在开发的新工具。
OpenAI CEO山姆·奥特曼表示,这个最新成果能帮助开发者实现更多创造。(但不是GPT-5/4.5)
最近,ChatGPT更新了知识数据,目前截止到2023年4月。
这一系列“悄悄”升级的动向,不免让人更加期待下周开发者大会,OpenAI会带来哪些惊喜?
参考链接:
[1]https://twitter.com/ldjconfirmed/status/1718456393026490523
[2]https://twitter.com/thealexker/status/1718445317559902371
[3]https://twitter.com/btibor91/status/1718592805105250481
— 完 —
「量子位2023人工智能年度评选」开始啦!
今年,量子位2023人工智能年度评选从企业、人物、产品/解决方案三大维度设立了5类奖项!欢迎扫码报名
MEET 2024大会已启动!点此了解详情。
点这里👇关注我,记得标星哦~
一键三连「分享」、「点赞」和「在看」
科技前沿进展日日相见 ~