以「安全與對齊」為招牌的 Anthropic,Claude Code 團隊工程師 Thariq 公開回應日前引發軒然大波的「間諜程式法」爆料,正面承認公司今年 3 月曾在產品中嵌入一項實驗性機制,會偵測系統時區是否為 Asia/Shanghai 或 Asia/Urumqi、代理主機名是否匹配中國相關轉售商,再用特殊標點以隱寫(steganography)方式,在系統提示中悄悄注入對人類隱形、卻能被伺服器解析的標記。他說目的是「防止未授權轉售商濫用帳號與模型蒸餾」,並強調已加速下線、之後的版本完全回滾。
(前情提要:Claude Sonnet 5 上線:Anthropic 喊多項表現逼近 Opus,價格更便宜)
(背景補充:Fable 5、Mythos 5 要回來了!Anthropic 官宣明日重新上線)
- Claude Code 工程師 Thariq 承認今年 3 月曾嵌入實驗性機制,偵測中國時區與代理主機名,並用隱寫術在系統提示注入隱藏標記
- 機制細節:時區為 Asia/Shanghai 或 Asia/Urumqi 時,日期分隔符從「-」翻成「/」,並替換「Today’s date」的撇號為視覺相同的 Unicode 字元編碼
- Thariq 稱目的是防止未授權轉售商濫用與模型蒸餾,明日版本(2.1.197)完全回滾;但社群批評「被抓到才撤、不通知使用者」,信任受重創
以「安全與對齊」為招牌的 Anthropic 自己承認反蒸餾的做法。Claude Code 團隊工程師 Thariq 公開回應日前引發軒然大波的「間諜暗碼」爆料,正面承認公司今年 3 月曾在產品中嵌入一項實驗性機制,在使用者毫不知情的情況下,對中國相關使用者進行環境指紋標記。
根據 Thariq 的說法與爆料內容,這套機制會偵測三件事:系統時區是否為 Asia/Shanghai 或 Asia/Urumqi、網路代理主機名是否匹配一份中國相關轉售商清單,以及是否命中特定 AI 實驗室的關鍵詞。判斷的結果不會明著寫出來,而是用特殊標點,以「隱寫術」(steganography)的方式,偷偷注入系統提示中的隱藏標記。
偷藏可辨識的暗碼
隱寫術指的是把訊息藏在看起來正常的內容裡。這套機制巧妙(也可以說陰險)的地方在於,當它偵測到中國時區時,系統提示裡「Today’s date is」那一行的日期分隔符,會從連字號「-」悄悄翻成斜線「/」,例如 2026-06-30 變成 2026/06/30;同時,「Today’s date」裡的那個撇號,會在三種視覺上幾乎一模一樣、但編碼不同的 Unicode 字元之間切換,用來標示代理是否匹配中國域名、是否引用中國 AI 實驗室,或兩者都中。
最關鍵的是,這些改動對人類使用者完全隱形,甚至可能連 AI 模型本身都看不出來,卻能被 Anthropic 的伺服器輕鬆解析。根據外電,相關行為出現在 Claude Code 版本 2.1.193 到 2.1.196,而類似邏輯最早可追溯到 4 月初的 2.1.91 版本。
Anthropic 說是反蒸餾,社群說是偷偷監控
Thariq 給出的理由是防禦性的。他表示該機制旨在「防止未授權的轉售商濫用帳號及模型蒸餾」,並強調團隊此後已落地更強的防護措施,「一直打算將其下線」,相關 PR 已合併,預計在明日版本(2.1.197)發布中完全回滾。
今年 2 月,Anthropic、OpenAI 與 Google 曾同時披露工業規模的模型蒸餾攻擊,Anthropic 更具體指控 DeepSeek、Moonshot AI 與 MiniMax,動用超過 24,000 個欺詐帳號、生成 1,600 萬次以上對話,用來訓練競爭模型。對這些 AI 巨頭而言,防堵蒸餾與盜用是真實存在的痛點。
問題是,這次爆料由安全帳號 @IntCyberDigest 於 6 月 30 日公開,還附上兩張程式碼截圖,直接坐實了「使用者毫不知情」這一點。Thariq 的回應雖屬正面承認,但「3 月上線、被曝光後才加速撤銷」的時間線,仍引發社群普遍質疑。
反蒸餾已成中美兩大 AI 陣營的主題攻防,相應手段是否需要完全公開?以商業邏輯來說是不可能的。
常見問題Claude Code 的「間諜程式碼」到底做了什麼?
據爆料與工程師 Thariq 承認,Claude Code 曾嵌入實驗性機制,偵測使用者時區是否為中國(Asia/Shanghai、Asia/Urumqi)、代理主機名是否匹配中國轉售商,再用特殊 Unicode 標點以隱寫方式,在系統提示中注入對人類隱形、但伺服器可解析的標記。
Anthropic 為什麼要這樣做?現在撤掉了嗎?
Thariq 稱目的是防止未授權轉售商濫用帳號與模型蒸餾。今年 2 月 Anthropic 曾指控 DeepSeek 等中國 AI 公司用大量欺詐帳號蒸餾其模型。他表示相關 PR 已合併,明日版本(2.1.197)將完全回滾該機制。
📍相關報導📍
如何用 Claude Code 打造 1 萬美元等級的網站與動畫效果
「2 + 2 = 5」騙倒 AI 瀏覽器:ChatGPT Atlas、Claude 等中招洩露憑證
小龍蝦 OpenClaw 推出 iOS、Android 行動版 app:透過手機隨身指揮 AI 代理






