距離上次新品發(fā)布僅僅兩周后,Anthropic 又出手了。
最新消息,Anthropic 發(fā)布輕量級模型 Claude Haiku 4.5,主打「更便宜、更快速」。
據(jù) Anthropic 介紹,Claude Haiku 4.5 的編碼性能可與中高端模型 Claude Sonnet 4(這是 Anthropic 于 5 個月前發(fā)布的模型)相媲美,但成本更低,每百萬輸入 token 的成本為 1 美元,每百萬輸出 token 的成本為 5 美元,僅為 Claude Sonnet 4 的三分之一。而推理速度卻提升一倍多。

用 Anthropic 發(fā)言人的話來說就是,「Haiku 4.5 在性能上有了明顯的飛躍,現(xiàn)在基本上和 Sonnet 4 一樣智能,但速度卻快得多,成本卻只有 Sonnet 4 的三分之一。」
不僅如此,從測試數(shù)據(jù)來看,Claude Haiku 4.5 在某些任務(wù),甚至超越了 Claude Sonnet 4。比如 computer use 「OSWorld」(一個在現(xiàn)實世界計算機任務(wù)中測試人工智能模型的基準(zhǔn)測試平臺)上,前者得分 50.7%,后者得分 42.2%;數(shù)學(xué)推理(AIME 2025)測試中,前者借助 Python 工具,成績高達(dá) 96.3%,后者為 70.5%。

整體來看,Claude Haiku 4.5 核心面向?qū)崟r、低延遲的任務(wù)場景,比如聊天助手、客服人員、協(xié)同編程等。這些場景用戶將會體驗到 Claude Haiku 4.5 的高智能、極快速度。而 Claude Code 用戶則會發(fā)現(xiàn) Claude Haiku 4.5 顯著提升了編碼體驗的響應(yīng)速度,包括多智能體項目到快速原型開發(fā)設(shè)計等。
早期客戶的一些體驗評價也體現(xiàn)了 Claude Haiku 4.5 的能力水平:
比如,Augment Code 的聯(lián)合創(chuàng)始人 Guy Gur-Ari 表示,「Claude Haiku 4.5 達(dá)到了我們意想不到的最佳狀態(tài):接近前沿的編碼質(zhì)量、驚人的速度和成本效益。在 Augment 的內(nèi)部編碼評估測試中,Haiku 4.5 的性能達(dá)到了 Sonnet 4.5 的 90%,甚至可以與規(guī)模更大的模型相媲美。」

Windsurf 的首席執(zhí)行官 Jeff Wang 也表示,「歷史上,模型總是為了質(zhì)量而犧牲速度和成本,而Haiku 4.5 正在「模糊」這種傳統(tǒng)權(quán)衡的界限:它是一種快速的前沿模型,既保持了成本高效,又預(yù)示了這類模型的發(fā)展方向。」

其實,從測試數(shù)據(jù)上也不難看出,目前,Claude Sonnet 4.5 仍然是 Anthropic 最好的模型,在各項性能表現(xiàn)上都超過 Claude Haiku 4.5,而 Claude Haiku 4.5 的長處在于能以更高的成本效益為用戶提供「近乎前沿的性能」。
另外,Anthropic 表示,兩者的配合使用還將為企業(yè)客戶帶來極大優(yōu)勢:前者可以構(gòu)建前沿多步驟計劃,而后者則并行完成子任務(wù),「從而支持多智能體系統(tǒng)快速高質(zhì)量地處理復(fù)雜的重構(gòu)、遷移和大型功能構(gòu)建。」
比如,在金融服務(wù)領(lǐng)域,Claude Sonnet 4.5 和 Haiku 4.5 的結(jié)合所帶來的多智能體架構(gòu),將徹底改變企業(yè)監(jiān)控市場和管理風(fēng)險的方式。在 Anthropic 的設(shè)想中,Haiku 4.5 將同時監(jiān)控數(shù)千個數(shù)據(jù)流 —— 追蹤監(jiān)管變化、市場信號和投資組合風(fēng)險,而 Sonnet 4.5 則負(fù)責(zé)處理復(fù)雜的預(yù)測模型和戰(zhàn)略分析。
而對于研究機構(gòu)來說,分工可以大幅壓縮時間。比如,Claude Sonnet 4.5 可以協(xié)調(diào)全面的分析,而多個 Haiku 4.5 Agent 則可以并行處理數(shù)十個來源的文獻(xiàn)綜述、數(shù)據(jù)收集和文檔合成,根據(jù) Anthropic 的描述,這可能「將數(shù)周的研究壓縮到數(shù)小時」。
還有一點非常重要的是,Claude Haiku 4.5 不僅速度快、價格低,而且安全。