Skip to main content

Claude Sonnet 5 正式发布 — 史上最具 Agent 能力的 Sonnet 模型,Felo 免费可用

· 阅读需 8 分钟
Felo Search Tips Buddy
Committed to answers at your fingertips

Claude Sonnet 5 基准测试大幅超越 Sonnet 4.6。Felo 免费试用,Pro 用户限时 优惠。

Claude Sonnet 5 blog cover

Anthropic 刚刚发布了 Claude Sonnet 5,这是一次重大升级。该模型大幅缩小了 Sonnet 与 Opus 之间的差距,能够执行此前 Sonnet 模型难以完成的多步骤复杂任务,且首发价格出乎意料地低。

从今天起,您可以在 Felo 上免费试用 Claude Sonnet 5。Felo Pro 用户还可享受限时 7 折(30% OFF)优惠。

免费在 Felo 上体验 Claude Sonnet 5 →

什么是 Claude Sonnet 5?

Claude Sonnet 5 是 Anthropic 最新的中级模型,被誉为"迄今为止最具智能体能力的 Sonnet 模型"。它能够制定计划、使用浏览器和终端等工具,并以一种以往需要更大、更昂贵的 Opus 级模型才能实现的自主水平运行。

核心参数:

  • 模型标识: claude-sonnet-5(通过 Claude API)
  • 上下文窗口: 200K tokens
  • 分词器: 更新后的分词器(与 Opus 4.7 引入的更改类似),相同输入根据内容类型不同,token 数量大约增加 1.0–1.35 倍
  • 可用性: 所有计划——免费版、Pro、Max、Team 和 Enterprise

Sonnet 系列(3.5、3.6、3.7)是大多数开发者真正开始体验智能体 AI 的起点。Sonnet 5 延续了这一轨迹,在推理、工具使用、编程和知识工作方面均有提升。

基准测试:数据说话

以下是 Sonnet 5 在对智能体工作真正重要的评估中的表现对比:

评估项目Sonnet 4.6Sonnet 5Opus 4.8(参考)
BrowseComp(智能体搜索)较低显著提升更高
OSWorld-Verified(计算机使用)78.5%有所改进更高
人类最后考试(无工具)34.6%有所改进更高
人类最后考试(有工具)46.8%有所改进更高

Sonnet 5 不仅仅是微小的增量提升——性能曲线表明它覆盖了比 Opus 4.8 更广泛的性价比选择范围。在中等努力水平下,它能提供显著更优的成本效益。在更高努力水平下,它可以在某些任务上与 Opus 4.8 媲美。

关键结论:现在你可以以 Sonnet 级别的价格,在某些任务上获得 Opus 级的结果。

Sonnet 5 与 Sonnet 4.6:到底哪里提升了

Sonnet 5 与前代产品在多个维度上的差异是显而易见的:

推理与工具使用

Sonnet 5 能够完成 Sonnet 4.6 会半途而废的复杂多步骤任务。它会主动检查自己的输出,而无需被明确要求。早期测试者一致评价它比之前的 Sonnet 模型"更具智能体能力"。

来自早期合作伙伴的真实案例:

  • 一个 Salesforce 自动化流程此前会中途停滞——更新账户层级并发送发布公告——现在使用 Sonnet 5 可以端到端完整完成。
  • 一家编程平台的工程师让 Sonnet 5 处理数十个具有挑战性的真实 pull request,它独立完成了每一个,并输出了经过测试和验证的结果。
  • 一位开发者让 Sonnet 5 调查一个 bug。无需额外提示,它编写了复现测试、实施修复,然后将修复暂存以确认没有该修改时 bug 会复现——全部在一次执行中完成。

编程性能

Sonnet 5 在混乱的技术上下文中,能够很好地处理持续的编程、工具使用和调试任务。它在处理遗留代码方面表现尤为出色——竞态条件、隐藏测试、代码库中没人愿意碰的部分。

对于需要跟进和技术基础的软件工程工作流,Sonnet 5 为智能体提供了强大的执行层。

安全性

在智能体场景中,Sonnet 5 通常比 Sonnet 4.6 更安全。它的幻觉和讨好倾向率更低。在 Anthropic 的自动化行为审计中,它的总体评分更低(更安全),尽管与 Opus 4.8 和 Claude Mythos Preview 相比,它仍然显示出略高的未对齐行为率。

网络安全能力仍然有限——Sonnet 5 在潜在危险的网络任务上的表现远逊于 Opus 4.8,且网络安全防护已默认启用。

定价

Claude Sonnet 5 在 Claude 平台上以极具吸引力的首发价格推出:

时间段输入 Tokens输出 Tokens
2026 年 8 月 31 日前2 美元 / 100 万 tokens10 美元 / 100 万 tokens
2026 年 8 月 31 日后3 美元 / 100 万 tokens15 美元 / 100 万 tokens

首发定价的设定考虑了新分词器会使相同输入产生 1.0–1.35 倍的更多 token,因此从 Sonnet 4.6 切换过来大致保持成本中性。

在 Felo 上:免费使用 + Pro 用户 7 折

Felo 已在发布后第一时间接入 Claude Sonnet 5:

  • 免费用户: 免费使用 Claude Sonnet 5
  • Felo Pro 用户: 限时享受 Claude Sonnet 5 使用量 7 折优惠

这使得 Felo 成为访问该模型最便宜的方式之一,尤其是在首发定价窗口期内。

如何体验

只需一步即可开始:

  1. 前往 felo.ai/search?search_model=claude-5-0-sonnet
  2. 开始对话——Claude Sonnet 5 即为当前活跃模型
  3. 完成——无需任何设置,无需 API 密钥

通过 Felo 的界面,您可以直接与 Claude Sonnet 5 进行对话体验,无需通过 Claude API 或自行构建集成。

为什么这很重要

Sonnet 5 的真正意义在于它对性价比曲线的影响。当一款中级模型能在某些任务上匹敌 Opus 级结果时,它就改变了构建 AI 智能体的经济学。更强的推理能力、更好的工具使用和更低的定价,使 Sonnet 5 成为智能体工作流(编程、研究、自动化等)的强力默认选择。

通过 Felo 免费访问意味着你现在就可以立即体验,无需任何设置。

在 Felo 上体验 Claude Sonnet 5 →


Claude Sonnet 5 数据来源于 Anthropic 官方公告 Claude Sonnet 5 系统卡


本文还有其他语言版本。请访问 felo.ai/blog/claude-sonnet-5-is-here/ 查看所有版本。