BlockWeeks 5月23日消息,Anthropic在开发者大会上正式发布Claude Opus 4与Claude Sonnet 4两款新模型。Opus 4在SWE-bench验证集上表现最佳(72.5%,高算力模式下达79.4%),成为全球领先的自动编程模型。Sonnet 4亦达72.7%,超过OpenAI o3与Codex-1。Rakuten测试显示,Opus 4可连续编程7小时,稳定处理复杂任务,刷新行业纪录。新模型支持并行工具使用与改进记忆机制,Claude Code现已全面开放。
BlockWeeks 5月23日消息,Anthropic在开发者大会上正式发布Claude Opus 4与Claude Sonnet 4两款新模型。Opus 4在SWE-bench验证集上表现最佳(72.5%,高算力模式下达79.4%),成为全球领先的自动编程模型。Sonnet 4亦达72.7%,超过OpenAI o3与Codex-1。Rakuten测试显示,Opus 4可连续编程7小时,稳定处理复杂任务,刷新行业纪录。新模型支持并行工具使用与改进记忆机制,Claude Code现已全面开放。