Claude Opus 4.5
好的,以下是根据原文生成的摘要,中文,Markdown 格式,字数控制在 800 字以内:
Anthropic Claude Opus 4.5 发布:更智能、更高效的 AI 模型
Anthropic 发布了其最新模型 Claude Opus 4.5,宣称它是目前全球在编码、代理和计算机使用方面表现最佳的模型。该模型在深度研究、处理幻灯片和电子表格等日常任务中也表现出显著提升。Claude Opus 4.5 被视为 AI 系统发展的重要一步,预示着未来工作方式的变革。
核心优势:
- 卓越的软件工程能力: Claude Opus 4.5 在软件工程测试中表现出色,超越了其他模型,如上图所示。
- 更低的成本: Opus 级别的能力现在以 $5/$25 每百万 tokens 的价格提供,使其更加普及。
- 更高效的性能: 测试表明,Claude Opus 4.5 在解决问题时比之前的 Sonnet 4.5 使用更少的 tokens,在长任务中更高效。
- 强大的问题解决能力: Anthropic 的测试人员反馈,Opus 4.5 能够处理歧义、权衡利弊,并能自主解决复杂的 bug。
- 突破性的自改进 AI 代理: Opus 4.5 在办公自动化领域展现出自主提升能力的潜力,仅需 4 次迭代就能达到最佳性能。
客户反馈:
早期用户反馈积极,他们认为:
- Opus 模型一直是“真正的 SOTA”(状态最先进),而 Opus 4.5 的定价使其成为大多数任务的首选模型。
- Claude Opus 4.5 在代码生成和代理工作流程中表现卓越,并能有效降低 token 使用量。
- 在内部基准测试中,Claude Opus 4.5 优于 Sonnet 4.5 和其他竞争模型。
- 在规划和代码生成方面,Claude Opus 4.5 的推理深度得到了显著提升。
- Claude Opus 4.5 在处理长范围、自主任务方面表现出色,并减少了失败的可能性。
- 在企业任务方面,Claude Opus 4.5 表现出更强的多步骤推理能力。
- Claude Opus 4.5 在设计 3D 可视化方面表现出色,速度更快。
- 在代码审查中,Claude Opus 4.5 能够更准确地发现问题。
- Claude Opus 4.5 在解释用户意图和生成可分享内容方面表现出色。
- Claude Opus 4.5 在长篇故事叙述中具有优势。
- Claude Opus 4.5 在 Excel 自动化和财务建模方面取得了显著进展。
平台更新:
- Claude Developer Platform、Claude Code 和消费者应用都得到了更新。
- 新增了更长的代理运行工具和在 Excel、Chrome 和桌面应用中使用 Claude 的新方式。
- Claude 应用不再有对话长度限制。
- Claude Code 增加了计划模式,能够构建更精确的计划。
安全方面:
Claude Opus 4.5 被认为是 Anthropic 最安全、最可靠的模型,在抵抗 prompt injection 攻击方面表现出色。
其他信息:
- 可通过 Claude API 使用
claude-opus-4-5-20251101。 - Anthropic 正在研究 AI 如何改变工程等职业,并计划分享更多结果。
- Claude Opus 4.5 拥有更好的视觉、推理和数学技能,并在许多领域处于领先地位。
总而言之,Claude Opus 4.5 在性能、效率和安全性方面都取得了显著进步,是 Anthropic 在 AI 领域的重要一步。