同時關聯該項目與事件的快訊
Anthropic 高級管理人員今日將在華盛頓與特朗普政府官員會面,試圖解決圍繞其最新 AI 模型的監管爭議。事件起因於美國政府上週五向 Anthropic 下達出口管制指令,要求其立即暫停 Fable 5 與 Mythos 5 模型,並禁止“任何外國國民(無論在美境內或境外)”訪問,理由涉及“國家安全相關威脅”。Anthropic 隨後爲合規起見,已在全球範圍內關閉相關模型訪問權限。據知情人士透露,美國政府此前未提前披露具體風險,僅在週五下午電話通知,並隨後發出正式限制函。此次行動發生在模型發佈僅數日之後。Fable 5 與 Mythos 5 基於其 Claude Mythos Preview 演進版本,被定位爲具備高級代碼漏洞識別能力的前沿模型,並曾在發佈前與政府機構進行安全測試。部分功能此前已被限制在企業與特定用戶範圍內使用。值得注意的是,此次事件發生在 Anthropic 與美國政府關係持續緊張的背景下。今年早些時候,美國國防部曾將其列爲“供應鏈風險”,導致部分國防承包商被禁止使用其技術,相關訴訟仍在進行中。Anthropic 方面表示,該爭議或源於“潛在但非通用的越獄風險”,並強調若以此標準審查,可能對整個前沿模型行業的發佈節奏造成系統性影響。目前雙方仍在協商恢復模型訪問的可能性。(CNBC)
美國政府對 Anthropic 模型 Fable 5 / Mythos 5 的出口管制與訪問限制,部分源於亞馬遜的網絡安全研究以及 AWS CEO Andy Jassy 與白宮的溝通推動。據悉,亞馬遜提交的研究指出,通過一系列提示詞測試,研究人員能夠誘導 Fable 5 輸出可能被用於網絡攻擊的敏感信息,從而引發安全擔憂,隨後 Andy Jassy 將相關發現上報美國政府層面,促使白宮採取進一步限制措施,包括禁止外國用戶訪問該模型。同時,前美國商務部官員 Kate Koren 透露,白宮對 Anthropic 的既有政策立場也可能影響了此次決策判斷,因爲 Anthropic 在 AI 安全邊界問題上與白宮存在分歧,包括拒絕將模型用於大規模監控或致命自主武器系統。儘管雙方在今年早些時候一度緩和並擴大合作,但此次事件可能再次加劇雙方緊張關係。(華爾街日報)
美國總統科學與技術顧問委員會聯席主席 David Sacks 發文回應 Anthropic“安全爭議”引發管制,他表示已就當前 Anthropic 相關情況與多方進行了溝通,並總結稱當前事件的核心在於其新發布模型 “Fable”(對應 Mythos 類模型的商業版本)所引發的安全爭議。儘管 Anthropic 在公開聲明中稱該漏洞“不嚴重”,但美國政府及測試方均不認同這一判斷,認爲其已足以影響模型安全性,甚至涉及“網絡武器可操作性”風險。David Sacks 進一步批評稱,Anthropic 過去一直強調“安全優先”,但此次更傾向維持消費者版本持續上線,而非優先修復安全問題。此事不應與此前其他國防或監管爭議混爲一談,並稱美國政府仍認可 Anthropic 技術能力,當前問題“本可迅速解決,主動權在 Anthropic 一方”。
Zcash founder Zooko Wilcox 在 X 發文表示,由 Anthropic 的 Claude Mythos 人工智能模型進行的安全審計未在 Zcash 協議中發現“更嚴重漏洞”。該審計由支持 Zcash 發展的瑞士非營利組織 Shielded Labs 請求開展。 6 月 3 日,Zcash 開發者在發現屏蔽池漏洞後曾臨時暫停 Orchard 交易,並於當天通過緊急升級恢復功能。該問題源於 Orchard 屏蔽池中一個存在四年的僞造漏洞,由安全研究員 Taylor Hornby 在 Anthropic 的 Claude Opus 4.8 模型協助下發現;Zcash Foundation 表示,沒有證據顯示該漏洞被利用,也未檢測到未經授權的價值創造,用戶隱私未受影響。Anthropic 於週二發佈 Claude Mythos 模型首個公開版本 Fable 5,並於週五表示,因美國政府以國家安全擔憂爲由發佈出口管制指令,已暫停 Fable 5 和 Mythos 5 AI 模型訪問權限。(Cointelegraph)
a16z 聯合創始人 Marc Andreessen 在 X 平臺發佈了一篇風格極具諷刺意味的長文,圍繞“AI 監管”議題展開表達,通過兩種極端敘事呈現其立場衝突。在“反對 AI 監管”的敘事中,Marc Andreessen 將監管描繪爲壓制創新的力量,可能扼殺車庫創業、削弱硅谷生態、加重合規負擔,並限制 AI 與算力基礎設施的發展,並且諷刺“美國 AI 監管者如果曾管束我們的祖父,就會禁止使用馬車”。而在“支持 AI 監管”的敘事中,Marc Andreessen 又以反諷方式描述監管體系可能帶來的秩序、安全與產業化合規體系擴張,包括大規模合規產業、政府監管框架強化以及社會再分配機制等。不過,Marc Andreessen 在整篇文章並未給出單一結論,而是通過高度誇張的語言對比,突出 AI 監管在“創新自由”與“安全治理”之間的長期結構性衝突與撕裂。此前消息,Anthropic 發佈聲明稱美國政府以國家安全權力爲由發佈了一項出口管制指令,要求暫停任何外國主體對人工智能模型 Fable 5 和 Mythos 5 的所有訪問權限,無論該人員是否在美國境內,包括屬於外國公民的 Anthropic 員工。
美國政府引用國家安全權威發佈出口控制指令,要求暫停所有外國國民對 Fable 5 和 Mythos 5 的訪問,包括 Anthropic 的外國國民員工。爲了確保合規,Anthropic 必須關閉所有客戶對 Fable 5 和 Mythos 5 的訪問,其他所有 Anthropic 模型不受影響。美國政府給出的口頭證據顯示該模型存在一個潛在的窄範圍、非通用越獄方法。Anthropic 遵守政府的法律指令並刪除所有用戶對 Fable 5 和 Mythos 5 的訪問權限,但不同意因發現窄範圍潛在越獄而收回已部署商業模型的決定,並正在努力盡快恢復訪問。
Anthropic 首席執行官達里奧·阿莫代伊表示,如果新的人工智能模型存在特定風險,政府應有權阻止其部署。阿莫代伊周三發表了一篇長文,主張人工智能模型應接受強制性的第三方測試,以評估其在多個領域可能帶來的風險。他寫道,如果人工智能被認定“存在不可接受的風險”,那麼“政府應擁有阻止或遏制其部署的權力”。這是阿莫代伊迄今爲止針對加強人工智能監管最強硬的表態之一。阿莫代伊寫道:“我認爲,至少在當前這一指數級發展階段,目前最合適的類比是汽車、飛機或藥品,這些技術對現代經濟至關重要,但如果設計或使用不當,也可能導致大量人員死亡。”Anthropic 此前曾對外界發出警告,稱其推出的人工智能模型 Mythos 具備發現並利用關鍵軟件漏洞的能力,因此公司決定僅向少數合作伙伴開放該模型。本週,Anthropic 又發佈了一個刪除相關網絡安全攻擊能力的新版本。(金十)
據 The Information,消息人士稱 Anthropic 或於今日發佈新模型 Claude Fable。該模型被描述爲 Mythos 的安全版本,在保留部分高級能力的同時,增加針對網絡攻擊等高風險場景的安全限制。Anthropic 曾於今年 4 月預覽 Mythos,並稱其具備發現大量全新網絡安全漏洞等能力,但因潛在安全風險未直接開放。截至目前,Anthropic 尚未正式公佈 Claude Fable 的詳細信息。
Odaily Seer 先知頻道監測顯示,Polymarket 上“Claude Mythos 模型發佈時間爲 6 月 10 日”概率暫報 74%,24 小時上漲 24%;此外,“截止 6 月 12 日前發佈”概率暫報 83%;“截止 6 月 15 日前發佈”概率暫報 89%;“截止 6 月 22 日前發佈”概率暫報 95%;“截止 6 月 30 日前發佈”概率暫報 94%;“截止 7 月 31 日前發佈”概率暫報 99%。此前消息,科技記者 Alex Heath 爆料,Anthropic 明天將發佈“公開版本 Mythos”,官方計劃將對 Mythos 進行更名和小幅調整,以“Fable 5”的名稱發佈。Odaily Seer 先知頻道持續關注預測市場,在定價之前,看見變化。
人工智能企業 Anthropic 已同意向金融穩定委員會相關人員,就旗下 Mythos AI 模型進行專項通報。此次通報將重點說明該模型排查出的全球金融體系網絡防禦體系存在的安全漏洞。兩位知情人士稱,此番溝通由英國央行行長安德魯・貝利提議,要求 Anthropic 向金融穩定委員會介紹其全新 Claude・Mythos 預覽版 AI 模型。金融穩定委員會正編撰金融業人工智能合規應用規範報告,計劃下月發佈草案公開徵求意見。金融穩定委員會與 Anthropic 雙方均拒絕對近期雙方溝通事宜置評。(界面)
AI 安全初創公司 Depthfirst 表示,其自研 AI 模型在代碼漏洞檢測方面表現超越 Anthropic 最新模型 Mythos,並以約 1/10 成本發現更多關鍵安全漏洞,引發網絡安全行業關注。據該公司披露,Mythos 上線一個月前曾宣稱在關鍵互聯網基礎代碼中發現大量嚴重漏洞,而 Depthfirst 稱其模型在更低成本(約 1000 美元對比 1 萬美元)條件下,進一步識別出 Mythos 未發現的多個高危漏洞。Depthfirst CEOQasim Mithani 表示,公司通過"單任務優化型 Al 模型“提升漏洞檢測效率,使安全分析成本大幅下降,同時提升覆蓋深度。該公司在今年 3 月完成 8000 萬美元融資,估值達 5.8 億美元,並同步推出“Open Defense Initiative”,向開源開發者與關鍵基礎設施項目提供 500 萬美元 AI 檢測額度,用於漏洞掃描與安全審計。(福布斯)
白宮近日對 Anthropic 提議將其 AI 模型 Mythos 擴展至約 120 家公司表示反對,主要基於安全和算力的考慮。Anthropic 原計劃在現有約 50 家企業的基礎上,新增 70 家公司使用 Mythos,但白宮對此提出質疑,擔心算力不足可能影響政府自身對 Mythos 的使用。Mythos 於 4 月初發布,旨在檢測並利用關鍵軟件漏洞,目前僅限於管理關鍵基礎設施的企業測試,尚無公開發布計劃。白宮擔心,若將使用範圍擴大至更多商業用戶,政府在使用該模型時將面臨算力瓶頸,特別是 Anthropic 與亞馬遜、谷歌和博通簽訂的算力採購協議,儘管已簽約,但新產能尚未上線。政治方面,白宮與 Anthropic 的關係也未見緩和。特朗普政府曾公開批評 Anthropic 招聘了多名拜登政府前官員,並對其與自由派組織的關係表達不滿。一個例子顯示出雙方的信任問題:Anthropic 前研究員 Collin Burns 原本被安排進政府的 AI 模型評估崗位,但白宮高層得知後直接更換了人選,理由是避免 AI 公司人員直接參與與其他 AI 公司打交道的事務。此外,Anthropic 上週還披露了 Mythos 模型的未授權訪問事件,進一步加劇了外界對該公司的監管關注。
Anthropic 與 OpenAI 相繼出現安全事件,引發市場對 AI 模型自身安全性的關注。目前 Anthropic 正在調查其 Claude Mythos 模型可能被用戶未經授權訪問的情況。幾乎同時,OpenAI 也被曝在其 Codex 應用中,意外開放了多款尚未發佈的模型。分析認爲,此類事件凸顯出,即便是主打網絡安全能力的 AI 模型提供商,自身仍面臨較大安全挑戰。在 AI 逐步用於防禦網絡攻擊的同時,其平臺安全與訪問控制問題同樣成爲關鍵風險點。業內觀點指出,這些漏洞事件強化了對 AI 企業安全治理能力的審視,也反映出當前 AI 技術在快速發展過程中,安全體系仍有待完善。(The Information)
據 Decrypt 報道,Mozilla 近日披露,Anthropic 旗下最新 AI 模型 Claude Mythos 在對 Firefox 瀏覽器的內部測試中識別出 271 個安全漏洞,相關漏洞已於本週完成修復。作爲對比,此前另一版本 Anthropic 模型僅發現 22 個安全敏感漏洞。Mozilla 表示,所有被發現的漏洞均未超出頂尖人類研究員的發現範疇。Claude Mythos 於2026年 3 月正式發佈,是 Anthropic 在推理、編碼及網絡安全領域最強大的模型,目前通過"Project Glasswing"計劃限定向亞馬遜、蘋果、微軟等經審覈的合作伙伴開放使用。
Anthropic 因 Mythos 模型具備高度自動化網絡攻擊能力,最終決定限制其公開發布。報道稱,該模型在內部測試中已可獨立完成漏洞發現與利用流程,並生成多步驟攻擊方案。知情人士表示,Mythos 在早期測試中可自主構建針對 Linux 系統的入侵工具,並在引導下完成複雜漏洞鏈攻擊。相關能力被評估爲可能對全球基礎設施構成風險。Anthropic 管理層最終將 Mythos 定位爲網絡防禦工具,並通過受限方式向部分機構開放測試。業內人士指出,類似模型或顯著提升網絡攻防效率,同時也可能帶來新的安全挑戰。(Bloomberg)