OpenAI大更新:修复GPT-4变懒问题、3.5价格下降、增强代码生成能力

1,596次阅读
没有评论

OpenAI大更新:修复GPT-4变懒问题、3.5价格下降、增强代码生成能力

文章转自「新智元」,Founder Park 略有调整。

今天,OpenAI 正式发布了更新版的 GPT-4 Turbo——gpt-4-0125-preview。

不仅大幅改善了模型「偷懒」的情况,而且还极大地提升了代码生成的能力。

OpenAI大更新:修复GPT-4变懒问题、3.5价格下降、增强代码生成能力

与此同时,OpenAI 还发布了一系列模型和 API 更新,总体来说就是「更强的性能,更低的价格」。

  • GPT-3.5 Turbo 更新——gpt-3.5-turbo-0125。输入价格大降 50%,输出价格下降 25%。性能上也有升级。

  • 「迄今为止最强」的审核模型 text-moderation-007,帮助开发者有效地识别有害文本。

两个新一代 embedding 模型:

  • text-embedding-3-small,体积更小效率更高,价格直接砍到了原模型 20%!支持 512 维和 1536 维两种大小。

  • text-embedding-3-large,性能相比之前模型大幅提升,高达 3072 维的嵌入向量,价格是小模型的 6.5 倍。

最后,OpenAI 还强调称,用户通过 API 传送的数据,都不会被用于训练新的模型。

OpenAI大更新:修复GPT-4变懒问题、3.5价格下降、增强代码生成能力

01

GPT-4 更强了,变懒 bug 修复

自从去年 11 月份开发者大会发布 GPT-4-Turbo 以来,超过 70% 的 GPT-4 API 用户已经转用了 GPT-4-Turbo 预览版,从而能够享受最新的知识截止日期、更大的 128k 上下文窗口和更低的价格。

最新更新的 GPT-4-Turbo 预览模型——gpt-4-0125-preview 在执行任务(如代码生成)方面比之前的预览版要更强,能够减少模型有可能出现的「偷懒」现象。

新模型还修复了一个影响非英文 UTF-8 生成的漏洞。

对于那些希望自动升级到最新 GPT-4-Turbo 预览版的用户,OpenAI 还推出了一个新的模型名别名 gpt-4-turbo-preview,它将始终指向最新的 GPT-4-Turbo 预览版模型。

在未来几个月内,OpenAI 还会推出具备视觉功能的 GPT-4-Turbo 正式版。


02

GPT-3.5-Turbo 喜迎「降价增效」

下周,OpenAI 即将推出新版的 GPT-3.5-Turbo,型号为 gpt-3.5-turbo-0125。

在过去的一年里,OpenAI 已经第三次下调 GPT-3.5-Turbo 的价格。

新模型的输入价格下降了 50%,现为 0.0005 美元/1k token;输出价格下降了 25%,现为 0.0015 美元/1k token。

此外,模型还进行了多项改进,比如提高了按要求格式响应的准确性,并修复了一个导致非英文语言函数调用出现文本编码问题的漏洞。

在 API 中使用固定 gpt-3.5-turbo 模型名称的用户,将在这款新模型推出两周后,自动从 gpt-3.5-turbo-0613 升级至 gpt-3.5-turbo-0125 版本。


03

全新嵌入模型 2 连发:性能大涨价格狂降

OpenAI 推出了两款新的嵌入模型:体积更小、效率更高的 text-embedding-3-small 模型,以及更大、性能更强的 text-embedding-3-large 模型。

OpenAI大更新:修复GPT-4变懒问题、3.5价格下降、增强代码生成能力

所谓嵌入(Embedding),就是将内容(如文字或代码)中的概念转化为一串数字序列。

通过这种方式,机器学习模型和其他算法可以轻松理解不同内容之间的关系,执行聚类、检索等操作。

嵌入技术ChatGPT 和 Assistants API 中的知识检索功能,以及许多检索增强生成(RAG)开发工具提供了强大动力。

「小」文本嵌入模型:text-embedding-3-small

text-embedding-3-small 是 OpenAI 的新型高效嵌入模型,与 2022 年 12 月推出的前代产品 text-embedding-ada-002 相比,性能有了大幅提升。

性能更强

在多语言检索(MIRACL)的常用基准测试中,text-embedding-3-small 的平均得分从 31.4% 提高到 44.0%,在英语任务(MTEB)的常用基准测试中,平均得分从 61.0% 提高到 62.3%。

价格实惠

text-embedding-3-small 远比 OpenAI 之前的 text-embedding-ada-002 模型效率高,因此价格也大幅降低了 5 倍,从每千 token 的 0.0001 美元降至 0.00002 美元。

OpenAI 不会停用 text-embedding-ada-002,尽管 OpenAI 更推荐用户使用新模型,客户仍可选择继续使用上一代产品。

「大」文本嵌入模型:text-embedding-3-large

text-embedding-3-large 是 OpenAI 的新一代大型嵌入模型,能够生成高达 3072 维的嵌入向量。

text-embedding-3-large 是 OpenAI 目前性能最强的模型——与 text-embedding-ada-002 相比,它在 MIRACL 上的平均得分从 31.4% 提升至 54.9%,在 MTEB 上的平均得分从 61.0% 提升至 64.6%。

text-embedding-3-large 的价格定为 0.00013 美元/1k token。

OpenAI大更新:修复GPT-4变懒问题、3.5价格下降、增强代码生成能力

灵活调整嵌入向量

相比于小型嵌入,大型嵌入的存储和检索,如放置于向量存储库中,往往需要更高的成本,也消耗更多的计算资源、内存和存储空间。

OpenAI 的两款新嵌入模型均采用了一种特殊的训练技术,使得开发者可以在嵌入的使用成本和性能之间做出权衡。

具体来说,开发者可以通过设定 dimensions API 参数来有效缩短嵌入向量的长度(也就是去掉数列末端的一些数字),而这样做不会影响嵌入向量代表概念的核心特性。

例如,在 MTEB 基准测试中,即使将 text-embedding-3-large 嵌入向量的长度缩减到 256,它的性能仍然超过了长度为 1536 的未经缩减的 text-embedding-ada-002 嵌入向量。

这种做法极大地增加了使用上的灵活性。

比如说,当开发者需要使用一个只支持最大 1024 维度嵌入向量的向量数据存储时,可以选择 OpenAI 性能最佳的嵌入模型 text-embedding-3-large,并通过设置 dimensions API 参数为 1024,从而将原本 3072 维的嵌入向量缩减下来,以较小的向量尺寸为代价换取了准确度。

OpenAI大更新:修复GPT-4变懒问题、3.5价格下降、增强代码生成能力


04

迄今最强的内容审核模型

OpenAI 提供的免费内容审核 API 可以帮助开发者识别可能有害的文本。

作为 OpenAI 持续安全工作的一部分,OpenAI 发布了迄今为止最强大的内容审核模型 text-moderation-007。

此前的 text-moderation-latest 和 text-moderation-stable,也将重新指向这个新模型。


05

API后台更新,更好的 API 密钥管理

OpenAI 正在推出两项重要的平台升级,旨在为开发者提供对他们的 API 使用情况更清晰的洞察,并加强对 API 密钥的管理。

首先,开发者可以直接在 API 密钥页面设置不同的密钥权限。

举个例子,用户可以为一个密钥配置只读权限,以便用于内部的跟踪数据面板,或者设置为仅限访问某些特定的接口。

其次,一旦开启了密钥使用跟踪功能,使用仪表盘和数据导出功能就能够提供基于每个 API 密钥的详细使用指标。这样一来,只需为不同的功能、团队、产品或项目分配独立的 API 密钥,就可以轻松地监控到各自的使用情况。

在接下来的几个月里,OpenAI 计划为开发者提供更多便利,让他们能够更好地监控 API 使用情况并管理 API 密钥,这一点对于大型组织来说尤其重要。

OpenAI大更新:修复GPT-4变懒问题、3.5价格下降、增强代码生成能力

参考资料:

https://openai.com/blog/new-embedding-models-and-api-updates


如果你关注大模型领域,欢迎扫码加入我们的大模型交流群,来一起探讨大模型时代的共识和认知,跟上大模型时代的这股浪潮。OpenAI大更新:修复GPT-4变懒问题、3.5价格下降、增强代码生成能力

更多阅读

Product Hunt 2023 年度产品榜:GPT-4 夺冠、获奖 AI 产品全介绍

油管播放超千万,一款主打欺骗 NPC 的独立 AI 游戏正成为新爆款

从 Altman 对 GPT-5 的剧透中,我们应该如何迎接 AGI 的下一阶段?

一夜爆火!「哄哄模拟器」开发者复盘:24小时超过60万用户,2000万次对话

AI 编程的机会和未来:从 Copilot 到 Code Agent

转载原创文章请添加微信:geekparker

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2024 年 1 月
1234567
891011121314
15161718192021
22232425262728
293031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
共推空天领域智能化升级!趋境科技与金航数码强强联手

共推空天领域智能化升级!趋境科技与金航数码强强联手

共推空天领域智能化升级!趋境科技与金航数码强强联手 十三 2025-12-09 18:18:41 来源:量子位...
起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机” 西风 202...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
小冰之父李笛智能体创业,公司取名Nextie!陆奇是股东

小冰之父李笛智能体创业,公司取名Nextie!陆奇是股东

小冰之父李笛智能体创业,公司取名Nextie!陆奇是股东 Jay 2025-12-09 08:26:01 来源...
梁文锋,Nature全球年度十大科学人物!

梁文锋,Nature全球年度十大科学人物!

梁文锋,Nature全球年度十大科学人物! 一水 2025-12-09 09:46:23 来源:量子位 来自安...
起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机”

起底“豆包手机”:核心技术探索早已开源,GUI Agent布局近两年,“全球首款真正的AI手机” 西风 202...
摩尔线程新一代GPU架构10天后发布

摩尔线程新一代GPU架构10天后发布

摩尔线程新一代GPU架构10天后发布 思邈 2025-12-09 15:46:09 来源:量子位 国内首个聚焦...
极客公园创新大会 2026在京落幕,罗永浩、张楠、何小鹏、刘靖康等共议 AI 时代「进程由我」

极客公园创新大会 2026在京落幕,罗永浩、张楠、何小鹏、刘靖康等共议 AI 时代「进程由我」

极客公园创新大会 2026在京落幕,罗永浩、张楠、何小鹏、刘靖康等共议 AI 时代「进程由我」 henry 2...