
刚刚,被称为“OpenAI最强竞对”的大模型公司 Anthropic 重磅发布了其第三代人工智能(AI)模型 ——Claude 3 系列模型,包括 Claude 3 Opus、Claude 3 Sonnet 和 Claude 3 Haiku。 其中,Claude 3 Opu 为 Claude 3 系列模型的最强版本,具有接近人类的理解能力,可以灵巧地处理开放式提示和复杂的任务,根据官方给到的资料,其性能全面超过了 GPT-4。 值得一提的是,Claude 3 系列模型具有与其他领先模型同等的复杂视觉功能,可以处理各种视觉格式,包括照片、图表、图形和技术图表。


智能新标准
评测结果显示,Claude 3 Opus 在 AI 系统的大多数常用评估基准上都优于同类产品,包括本科生水平的专家知识(MMLU)、研究生水平的专家推理(GPQA)、基础数学(GSM8K)等。它在复杂任务上表现出了接近人类水平的理解力和流畅性,“引领着通用智能的前沿”。 所有 Claude 3 模型在分析和预测、细微内容创建、代码生成以及西班牙语、日语和法语等非英语语言对话方面的能力都得到了提高。 近乎即时的结果 Claude 3 系列模型支持实时客户聊天、自动完成和数据提取任务,在这些任务中,响应是即时和实时的。 其中,Claude 3 Haiku 是市场上同智能类别中速度最快、性价比最高的模型。它可以在三秒内读取 arXiv 上一篇信息和数据密集的研究论文(约 10k token),并附带图表和图形。 在绝大多数工作负载中,Claude 3 Sonnet 的智能水平比 Claude 2 和 Claude 2.1 高出了 2 倍。它在知识检索或销售自动化等要求快速响应的任务中表现出色。Claude 3 Opus 的速度要慢一些,与 Claude 2 和 Claude 2.1 类似,但智能水平更高。 准确性提高 与 Claude 2.1 相比,Claude 3 Opus 在具有挑战性的开放式问题上的准确率(或正确答案)提高了两倍,同时也减少了错误答案。 除了做出更可信的回答外,Claude 3 系列模型为来将启用引用功能,这样就可以通过指出参考资料中的精确句子来验证答案。


正文完
可以使用微信扫码关注公众号(ID:xzluomor)
