Claude Sonnet 5 正式發布 — 史上最具 Agent 能力的 Sonnet 模型,Felo 免費可用
Claude Sonnet 5 基準測試大幅超越 Sonnet 4.6。Felo 免費試用。

Anthropic 剛剛推出了 Claude Sonnet 5,這是一次重大升級。該模型大幅縮小了 Sonnet 與 Opus 之間的差距,能夠執行先前 Sonnet 模型難以完成的多步驟複雜任務,並且以令人驚訝的低首發價格推出。
從今天起,您可以在 Felo 上免費試用 Claude Sonnet 5。Felo Pro 用戶還可享限時 7 折優惠。
免費在 Felo 上體驗 Claude Sonnet 5 →
什麼是 Claude Sonnet 5?
Claude Sonnet 5 是 Anthropic 最新的中階模型,定位為「迄今最具智能體能力的 Sonnet 模型」。它能夠制定計畫、使用瀏覽器和終端機等工具,並以以往需要更大、更昂貴的 Opus 級模型才能達到的自主水準運行。
核心規格:
- 模型識別:
claude-sonnet-5(透過 Claude API) - 上下文視窗: 200K tokens
- 分詞器: 更新後的分詞器(與 Opus 4.7 引入的變更類似),相同輸入根據內容類型不同,token 數量約增加 1.0–1.35 倍
- 可用性: 所有方案 — Free、Pro、Max、Team 和 Enterprise
Sonnet 系列(3.5、3.6、3.7)是多數開發者真正開始體驗智能體 AI 的起點。Sonnet 5 延續了這條軌跡,在推理、工具使用、程式設計和知識工作各方面都有提升。
基準測試:數據
以下是 Sonnet 5 在對智能體工作真正重要的評估項目中的表現比較:
| 評估項目 | Sonnet 4.6 | Sonnet 5 | Opus 4.8(參考) |
|---|---|---|---|
| BrowseComp(智能體搜尋) | 較低 | 顯著提升 | 更高 |
| OSWorld-Verified(電腦使用) | 78.5% | 有所改進 | 更高 |
| Humanity's Last Exam(無工具) | 34.6% | 有所改進 | 更高 |
| Humanity's Last Exam(有工具) | 46.8% | 有所改進 | 更高 |
Sonnet 5 不僅僅是小幅的增量提升——效能曲線顯示它涵蓋了比 Opus 4.8 更廣泛的性價比選擇範圍。在中等努力程度下,它能提供更優異的成本效益。在更高努力程度下,它可以在某些任務上與 Opus 4.8 匹敵。
關鍵結論:現在你可以用 Sonnet 級的價格,在某些任務上獲得 Opus 級的結果。
Sonnet 5 與 Sonnet 4.6:到底哪裡提升了
Sonnet 5 與前代產品在多個面向上的差異是顯而易見的:
推理與工具使用
Sonnet 5 能夠完成 Sonnet 4.6 會半途而廢的複雜多步驟任務。它會主動檢查自己的輸出,無需被明確要求。早期測試者一致評價它比先前的 Sonnet 模型「更具智能體能力」。
來自早期合作夥伴的真實案例:
- 一個 Salesforce 自動化流程此前會中途停滯——更新帳戶層級並發送發布公告——現在使用 Sonnet 5 可以端到端完整完成。
- 一個程式設計平台的工程師讓 Sonnet 5 處理數十個具挑戰性的真實 pull request,它獨立完成了每一個,並產出經過測試和驗證的結果。
- 一位開發者請 Sonnet 5 調查一個 bug。無需額外提示,它編寫了重現測試、實作修復,然後將修復暫存以確認沒有該修改時 bug 會重現——全部在一次執行中完成。
程式設計效能
Sonnet 5 在混亂的技術情境中,能妥善處理持續性的程式設計、工具使用和除錯任務。它在處理既有程式碼方面表現尤為出色——競態條件、隱藏測試、程式碼庫中沒人願意碰的部分。
對於需要後續跟進和技術基礎的軟體工程工作流程,Sonnet 5 為智能體提供了強大的執行層。
安全性
在智能體情境中,Sonnet 5 通常比 Sonnet 4.6 更安全。它的幻覺(hallucination)和討好(sycophancy)率更低。在 Anthropic 的自動化行為審計中,它的總體評分更低(更安全),儘管與 Opus 4.8 和 Claude Mythos Preview 相比,它仍顯示出略高的未對齊行為率。
網路安全能力仍然有限——Sonnet 5 在潛在危險的網路任務上的表現遠遜於 Opus 4.8,且網路安全防護已預設啟用。
定價
Claude Sonnet 5 在 Claude 平台上以極具吸引力的首發價格推出:
| 時段 | 輸入 Tokens | 輸出 Tokens |
|---|---|---|
| 2026 年 8 月 31 日前 | 2 美元 / 100 萬 tokens | 10 美元 / 100 萬 tokens |
| 2026 年 8 月 31 日後 | 3 美元 / 100 萬 tokens | 15 美元 / 100 萬 tokens |
首發定價已納入新分詞器會使相同輸入產生 1.0–1.35 倍更多 token 的因素,因此從 Sonnet 4.6 切換過來大致保持成本中性。
在 Felo 上:免費使用 + Pro 用戶 7 折
Felo 已在發布後第一時間接入 Claude Sonnet 5:
- 免費用戶: 免費使用 Claude Sonnet 5
- Felo Pro 用戶: 限時享受 Claude Sonnet 5 使用量 7 折優惠
這使得 Felo 成為存取該模型最划算的方式之一,尤其是在首發定價視窗期間。
如何體驗
只需一步即可開始:
- 前往 felo.ai/search?search_model=claude-5-0-sonnet
- 開始對話——Claude Sonnet 5 即為當前使用中模型
- 完成——無須任何設定,無需 API 金鑰
透過 Felo 的介面,您可以直接與 Claude Sonnet 5 進行對話體驗,無須透過 Claude API 或自行建構整合。
為什麼這很重要
Sonnet 5 的真正意義在於它對性價比曲線的影響。當一款中階模型能在某些任務上匹敵 Opus 級結果時,它就改變了建構 AI 智能體的經濟學。更強的推理能力、更好的工具使用和更低的定價,使 Sonnet 5 成為智能體工作流程(程式設計、研究、自動化等)的強力預設選擇。
透過 Felo 免費存取,意味著你現在就可以立即體驗,無需任何設定。
Claude Sonnet 5 資料來源於 Anthropic 官方公告 和 Claude Sonnet 5 系統卡。
本文還有其他語言版本。請前往 felo.ai/blog/claude-sonnet-5-is-here/ 查看所有版本。