Anthropic移除隱藏代碼,曾用於偵測中國競爭對手
分類: AI 新品報導 發布時間:
人工智慧公司Anthropic宣布,將移除數月前為偵測其他AI公司竊取其模型而植入的隱藏代碼。此舉旨在防止帳號濫用,並保護其模型免受「蒸餾」(distillation)的侵害,即透過重複查詢來複製AI模型。
Anthropic的Claude Code團隊工程師Thariq Shihipar表示,這項實驗性措施於三月啟動,預計於七月一日移除。他指出,團隊已開發出更強力的防護機制,因此移除此隱藏代碼是預期中的行動。

據了解,該實驗性措施利用了「隱寫術」(steganography),將秘密數據隱藏在看似普通的文本中。系統會檢查Claude Code的基礎URL環境變數,若該變數被覆蓋,則會進一步檢查系統時區,並比對主機名稱是否出現在已知中國AI實驗室、其他AI公司、經銷商或閘道網域的列表中。
有開發者認為,雖然偵測中國AI競爭對手或經銷商是合理的,但其隱藏實施方式卻不夠透明。該系統會利用不易察覺的Unicode標記,將代理或閘道分類資訊編碼進看似英文的句子中,並透過XOR和base64加密網域列表。這種做法被認為與一個要求信任的開發者工具的行為不符。
當被問及Anthropic是否在其服務條款中披露了此隱藏追蹤機制時,公司發言人並未直接回應,僅引用了Shihipar的說法。同時,發言人也未立即說明為防止未經授權的經銷商和模型蒸餾所實施的「更強力的防護機制」具體內容。
在此之前,Anthropic曾表示正投資於防範模型蒸餾的技術,包括分類器偵測、行為指紋識別系統、與其他AI實驗室共享情報、存取控制,以及增加模型輸出被用於重製模型的難度。其中一種防護措施曾透過Claude Code的原始碼洩漏而曝光,該程式碼包含一個名為ANTI_DISTILLATION_CC的標誌,啟用時會向API請求注入偽造的工具數據,以污染模型訓練數據。
儘管Anthropic採取了技術防護措施,仍呼籲AI產業、雲端供應商及政府共同應對模型蒸餾的威脅。近期美國白宮的行政命令也顯示出政府對保護美國AI免受外國對手威脅的關注。


