Claude Code 認了對中國用戶塞入「間諜暗碼」防賣水和蒸餾，被曝光才撤下

以「安全與對齊」為招牌的 Anthropic，Claude Code 團隊工程師 Thariq 公開回應日前引發軒然大波的「間諜程式法」爆料，正面承認公司今年 3 月曾在產品中嵌入一項實驗性機制，會偵測系統時區是否為 Asia/Shanghai 或 Asia/Urumqi、代理主機名是否匹配中國相關轉售商，再用特殊標點以隱寫（steganography）方式，在系統提示中悄悄注入對人類隱形、卻能被伺服器解析的標記。他說目的是「防止未授權轉售商濫用帳號與模型蒸餾」，並強調已加速下線、之後的版本完全回滾。
（前情提要：Claude Sonnet 5 上線：Anthropic 喊多項表現逼近 Opus，價格更便宜）
（背景補充：Fable 5、Mythos 5 要回來了！Anthropic 官宣明日重新上線）

重點摘要

Claude Code 工程師 Thariq 承認今年 3 月曾嵌入實驗性機制，偵測中國時區與代理主機名，並用隱寫術在系統提示注入隱藏標記
機制細節：時區為 Asia/Shanghai 或 Asia/Urumqi 時，日期分隔符從「-」翻成「/」，並替換「Today’s date」的撇號為視覺相同的 Unicode 字元編碼
Thariq 稱目的是防止未授權轉售商濫用與模型蒸餾，明日版本（2.1.197）完全回滾；但社群批評「被抓到才撤、不通知使用者」，信任受重創

以「安全與對齊」為招牌的 Anthropic 自己承認反蒸餾的做法。Claude Code 團隊工程師 Thariq 公開回應日前引發軒然大波的「間諜暗碼」爆料，正面承認公司今年 3 月曾在產品中嵌入一項實驗性機制，在使用者毫不知情的情況下，對中國相關使用者進行環境指紋標記。

根據 Thariq 的說法與爆料內容，這套機制會偵測三件事：系統時區是否為 Asia/Shanghai 或 Asia/Urumqi、網路代理主機名是否匹配一份中國相關轉售商清單，以及是否命中特定 AI 實驗室的關鍵詞。判斷的結果不會明著寫出來，而是用特殊標點，以「隱寫術」（steganography）的方式，偷偷注入系統提示中的隱藏標記。

偷藏可辨識的暗碼

隱寫術指的是把訊息藏在看起來正常的內容裡。這套機制巧妙（也可以說陰險）的地方在於，當它偵測到中國時區時，系統提示裡「Today’s date is」那一行的日期分隔符，會從連字號「-」悄悄翻成斜線「/」，例如 2026-06-30 變成 2026/06/30；同時，「Today’s date」裡的那個撇號，會在三種視覺上幾乎一模一樣、但編碼不同的 Unicode 字元之間切換，用來標示代理是否匹配中國域名、是否引用中國 AI 實驗室，或兩者都中。

最關鍵的是，這些改動對人類使用者完全隱形，甚至可能連 AI 模型本身都看不出來，卻能被 Anthropic 的伺服器輕鬆解析。根據外電，相關行為出現在 Claude Code 版本 2.1.193 到 2.1.196，而類似邏輯最早可追溯到 4 月初的 2.1.91 版本。

Anthropic 說是反蒸餾，社群說是偷偷監控

Thariq 給出的理由是防禦性的。他表示該機制旨在「防止未授權的轉售商濫用帳號及模型蒸餾」，並強調團隊此後已落地更強的防護措施，「一直打算將其下線」，相關 PR 已合併，預計在明日版本（2.1.197）發布中完全回滾。

今年 2 月，Anthropic、OpenAI 與 Google 曾同時披露工業規模的模型蒸餾攻擊，Anthropic 更具體指控 DeepSeek、Moonshot AI 與 MiniMax，動用超過 24,000 個欺詐帳號、生成 1,600 萬次以上對話，用來訓練競爭模型。對這些 AI 巨頭而言，防堵蒸餾與盜用是真實存在的痛點。

問題是，這次爆料由安全帳號 @IntCyberDigest 於 6 月 30 日公開，還附上兩張程式碼截圖，直接坐實了「使用者毫不知情」這一點。Thariq 的回應雖屬正面承認，但「3 月上線、被曝光後才加速撤銷」的時間線，仍引發社群普遍質疑。

反蒸餾已成中美兩大 AI 陣營的主題攻防，相應手段是否需要完全公開？以商業邏輯來說是不可能的。

常見問題

Claude Code 的「間諜程式碼」到底做了什麼？

據爆料與工程師 Thariq 承認，Claude Code 曾嵌入實驗性機制，偵測使用者時區是否為中國（Asia/Shanghai、Asia/Urumqi）、代理主機名是否匹配中國轉售商，再用特殊 Unicode 標點以隱寫方式，在系統提示中注入對人類隱形、但伺服器可解析的標記。

Anthropic 為什麼要這樣做？現在撤掉了嗎？

Thariq 稱目的是防止未授權轉售商濫用帳號與模型蒸餾。今年 2 月 Anthropic 曾指控 DeepSeek 等中國 AI 公司用大量欺詐帳號蒸餾其模型。他表示相關 PR 已合併，明日版本（2.1.197）將完全回滾該機制。