Anthropic 4 月 16 日發布 Claude Opus 4.7,主打 coding 大幅躍進(SWE […] 〈Claude Opus 4.7 深度介紹》coding 能力升級、1M 不加價,實測缺點在哪?〉這篇文章最早發佈於動區BlockTempo《動區動趨-最具影響力的區塊鏈新聞媒體》。Anthropic 4 月 16 日發布 Claude Opus 4.7,主打 coding 大幅躍進(SWE […] 〈Claude Opus 4.7 深度介紹》coding 能力升級、1M 不加價,實測缺點在哪?〉這篇文章最早發佈於動區BlockTempo《動區動趨-最具影響力的區塊鏈新聞媒體》。

Claude Opus 4.7 深度介紹》coding 能力升級、1M 不加價,實測缺點在哪?

2026/04/18 15:04
閱讀時長 7 分鐘
如需對本內容提供反饋或相關疑問,請通過郵箱 crypto.news@mexc.com 聯絡我們。
Anthropic 4 月 16 日發布 Claude Opus 4.7,主打 coding 大幅躍進(SWE-bench Pro 衝 64.3%,較前代 4.6 的 53.4% 提升 10.9 分)、視覺解析度加強三倍、1M context 維持標準價沒加 long-context premium。不過部分用戶還是反應不少痛點。 (前情提要:Claude Code 用起來變笨了?AMD AI 總監開砲:思考深度暴跌 67%、API 月費暴漲 144 倍) (背景補充:大賣空麥可貝瑞放話:Anthropic 正在吃掉 Palantir)   Anthropic 在 4 月 16 日把 Claude Opus 4.7 正式推上 API、Amazon Bedrock、Google Cloud Vertex AI 和 Microsoft Foundry 四大雲平台,GitHub Copilot Pro+、Business、Enterprise 使用者也同步收到。 和 4.6 版本比,這次升級的方向明確,包括加強 coding 能力是絕對主線、視覺是第二優先、而 API 改動則是老使用者最有感也最有爭議的部分。 這篇文章我整理了新功能、我自己測下來的感覺,還有社群反應兩極的缺點。 Opus 4.7 定位:Mythos 以下最強模型 要搞懂 Opus 4.7,得先理解它在 Anthropic 模型階梯上的位置。Anthropic 內部還有一個能力上限更高的 Mythos(神話),因為大規模發現零日漏洞能力被判定為國家安全風險,目前不對外發布,只給聯邦機構與 Project Glasswing 合作名單內的關鍵基礎設施廠商用。 Opus 4.7 則是「公開能賣的最強」目前民用版本。 這是 Anthropic 的策略底層,執行長 Dario Amodei 在《金融時報》專訪裡估算,中國開源模型最快 6 個月、最慢 12 個月就會追上 Mythos 的能力,在那之前 Opus 4.7 是 Anthropic 能給市場的最強商用模型。 三大核心提升 新功能清單裡,最能打的是這三個升級點: Coding 能力大幅躍進。 SWE-bench Pro(評估 AI 解真實 GitHub issue 的 benchmark)從 4.6 的 53.4% 直接跳到 64.3%,提升 10.9 分。這個成績在公開模型中排第一,超越 GPT-5.4 的 57.7% 和 Gemini 3.1 Pro 的 54.2%。SWE-bench Verified 也從 80.8% 升到 87.6%。 專門衡量 Cursor IDE 自主 coding 表現的 CursorBench,從 58% 衝到 70%。Anthropic 自己的說法是「你之前需要密切監督才敢交出去的 coding 任務,現在可以比較放心交給 4.7」。 多步 agentic 工作流(multi-step agentic workflow,讓 Claude 一次完成包含多個工具呼叫的任務)用起來也很有感覺。 官方宣稱相較 4.6 有 14% 改進、用更少 tokens、而 tool 使用錯誤降到大約 1/3。這個數字跟我自己測下來的體感蠻吻合,下一節會講。 視覺能力三倍提升 Opus 4.7 是第一個支援高解析度影象的 Claude 模型,最大可以到 2576px / 3.75MP,等於 4.6 的三倍。 用起來是截圖可以直接丟,不用先 resize,PDF 圖表、IDE 截圖、設計稿等等,它能把更多細節記下來。 跑分的話,視覺相關 benchmark 有 13% 提升。 1M token context 沒漲價 context window 從 200K 擴到 1M 沒有漲價是大家很關注的一點,先前用戶很擔心漲價或是把上下文窗口縮回 200k,更關鍵的是 Anthropic 沒有收 long-context premium(長上下文溢價)。 以前 Claude 超過 200K tokens 的請求會加錢,4.7 直接全部按 $5 / $25 per million tokens 的標價走。搭配 128K max output tokens,長程式碼庫分析、長合約審閱、長 log 診斷之類的工作流,不用再切 chunk。 xhigh、adaptive thinking、sampling:API 改得最多的地方 新功能列表裡,這塊改最多,也引來很多爭議。 新增 xhigh(extra high)effort level 以前 Claude 的推理力道有 high 和 max 兩級,4.7 在中間插了一級 xhigh,給「問題強度很高但是不想要做max 那麼深的推理」的場景來用。 另外還新增一個 /ultrareview 指令,專門跑深度 code review session,比普通 review 花更多 tokens 換更完整的檢查。 Anthropic 也在測試一個叫「task budgets」的系統,讓開發者指定 Claude 在長任務中最多花多少時間思考,目前是 beta。 Extended Thinking 改叫 adaptive thinking 這是最多人反彈的一項。4.6 以前你可以在 API 設定 budget_tokens: 5000,Claude 保證思考 5000 tokens 再回答。 4.7 把這個設計拿掉,改成 adaptive mode,意思是模型自己判斷要不要思考、思考多久。如果你還照以前寫 budget_tokens,直接回 400 error。Thinking 內容預設也不會出現在 response body 裡,要明確 opt-in 才給你。Anthropic 的理由是內部評估中 adaptive 在多數任務上贏過固定 budget,而且 response latency 略有改善。 Sampling 控制從 API 消失 temper...
市場機遇
4 圖標
4實時價格 (4)
$0.013497
$0.013497$0.013497
+7.00%
USD
4 (4) 實時價格圖表
免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 crypto.news@mexc.com 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。

USD1 Genesis:0 費率 + 12% APR

USD1 Genesis:0 費率 + 12% APRUSD1 Genesis:0 費率 + 12% APR

新用戶:質押最高享 600% APR。限時福利!