刚刚,OpenAI最强竞对发布Claude 3,超过GPT-4,具有接近人类的理解能力

1,964次阅读
没有评论

刚刚,OpenAI最强竞对发布Claude 3,超过GPT-4,具有接近人类的理解能力
刚刚,被称为“OpenAI最强竞对”的大模型公司 Anthropic 重磅发布了其第三代人工智能(AI)模型 ——Claude 3 系列模型,包括 Claude 3 Opus、Claude 3 Sonnet 和 Claude 3 Haiku 其中,Claude 3 Opu 为 Claude 3 系列模型的最强版本,具有接近人类的理解能力,可以灵巧地处理开放式提示和复杂的任务,根据官方给到的资料,其性能全面超过了 GPT-4。 值得一提的是,Claude 3 系列模型具有与其他领先模型同等的复杂视觉功能,可以处理各种视觉格式,包括照片、图表、图形和技术图表。  刚刚,OpenAI最强竞对发布Claude 3,超过GPT-4,具有接近人类的理解能力 Anthropic 在其官方 X 上表示,Claude 3 系列模型“在推理、数学、编码、多语言理解和视觉方面树立了新的行业基准” 刚刚,OpenAI最强竞对发布Claude 3,超过GPT-4,具有接近人类的理解能力 据介绍,Claude 3 Opus 和 Claude 3 Sonnet 现已可以通过 API 直接访问。目前,API 也已全面开放,开发人员可立即开始使用这些模型。 另外,Claude 3 Sonnet 还可以供部分地区的用户在网站(http://claude.ai)上免费体验,而 Claude 3 Opus 的使用权限,则只开放给了 Claude Pro 用户。 此外,Anthropic 团队还表示,Claude 3 系列模型解决了之前模型经常出现“不必要的拒绝”的问题。
智能新标准
评测结果显示,Claude 3 Opus 在 AI 系统的大多数常用评估基准上都优于同类产品,包括本科生水平的专家知识(MMLU)、研究生水平的专家推理(GPQA)、基础数学(GSM8K)等。它在复杂任务上表现出了接近人类水平的理解力和流畅性,“引领着通用智能的前沿”。 所有 Claude 3 模型在分析和预测、细微内容创建、代码生成以及西班牙语、日语和法语等非英语语言对话方面的能力都得到了提高。 近乎即时的结果 Claude 3 系列模型支持实时客户聊天、自动完成和数据提取任务,在这些任务中,响应是即时和实时的。 其中,Claude 3 Haiku 是市场上同智能类别中速度最快、性价比最高的模型。它可以在三秒内读取 arXiv 上一篇信息和数据密集的研究论文(约 10k token),并附带图表和图形。 在绝大多数工作负载中,Claude 3 Sonnet 的智能水平比 Claude 2 和 Claude 2.1 高出了 2 倍。它在知识检索或销售自动化等要求快速响应的任务中表现出色。Claude 3 Opus 的速度要慢一些,与 Claude 2 和 Claude 2.1 类似,但智能水平更高。 准确性提高 与 Claude 2.1 相比,Claude 3 Opus 在具有挑战性的开放式问题上的准确率(或正确答案)提高了两倍,同时也减少了错误答案。 除了做出更可信的回答外,Claude 3 系列模型为来将启用引用功能,这样就可以通过指出参考资料中的精确句子来验证答案。 刚刚,OpenAI最强竞对发布Claude 3,超过GPT-4,具有接近人类的理解能力 200K 上下文窗口和近乎完美的记忆 现在,Claude 3 系列模型可提供 200K 上下文窗口。不过,所有三种型号都能接受超过 100 万个 token 的输入,未来也可能会向需要增强处理能力的特定客户提供这种服务。另外,Claude 3 Opus 实现了接近完美的召回率,准确率超过 99%。 刚刚,OpenAI最强竞对发布Claude 3,超过GPT-4,具有接近人类的理解能力 Anthropic 团队表示,为提高模型的安全性和透明度,他们将继续开发诸如宪法人工智能(Constitutional AI)等方法,并对模型进行微调,以减轻新模式可能带来的隐私问题。 虽然与之前的模型相比,Claude 3 系列模型在生物知识、网络相关知识和自主性等关键指标上取得了进步,但根据“负责任扩展政策”( Responsible Scaling Policy),仍处于 AI 安全等级 2(ASL-2)。红队评估结果显示,Claude 3 系列模型目前造成灾难性风险的可能性微乎其微。 更易于使用 Claude 3 系列模型更善于遵循复杂的多步骤指令。它们尤其擅长遵循品牌声音和响应准则,并开发出用户可以信赖的面向客户的体验。此外,Claude 3 系列模型更善于以 JSON 等格式生成流行的结构化输出,从而更易于指导自然语言分类和情感分析等用例。 在官方博客的最后,Anthropic 团队写道: “在推动 AI 能力发展的同时,我们也同样致力于确保我们的安全防护措施能够跟上性能飞跃的步伐。我们的假设是,站在 AI 发展的前沿是引导其走向积极社会成果的最有效方式。” 参考链接:https://www.anthropic.com/news/claude-3-family

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2024 年 3 月
 123
45678910
11121314151617
18192021222324
25262728293031
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议 梦晨 2025-12-11 15:33:51 来源:量子位 A...
商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1 十三 2025-12-15 14:13:14 ...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了 衡宇 2025-12-10 12:3...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案

戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案

戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案 十三 2025-12-10 1...
九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局

九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局

九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局 量子位的朋友们 2025-12-10 18:...
乐奇Rokid这一年,一路狂飙不回头

乐奇Rokid这一年,一路狂飙不回头

乐奇Rokid这一年,一路狂飙不回头 梦瑶 2025-12-10 20:41:15 来源:量子位 梦瑶 发自 ...