Anthropic 在 Claude Mythos 更廣泛發布前擴大 Project Glasswing 的存取範圍
序言
Anthropic 正在增加參與 Project Glasswing 的組織數量,這是其用來評估和保護先進 Claude Mythos 人工智慧模型的受控計畫。本文摘要說明了擴展內容、Anthropic 為何擴大存取所提出的理由,以及圍繞該模型的更廣泛安全與政策背景。目的是客觀呈現變動內容、被新增的參與者,以及隨著更強大 AI 模型接近部署,對資安與公共安全可能產生的影響。
重點摘要
Anthropic 正在向 Project Glasswing 新增大約 150 個組織,以協助在 Claude Mythos 廣泛公開釋出之前找出並修復漏洞。新夥伴來自關鍵基礎設施部門,例如電力、水務、醫療、通訊與硬體,並且在取得存取權之前必須符合 Anthropic 的安全要求。公司表示,此舉旨在隨著具 AI 能力的攻擊技術演進,增強防禦方的能力。
主體內容
Anthropic 已宣布大幅擴展 Project Glasswing,這是其針對 Claude Mythos 模型的受控存取測試計畫。公司正邀請大約 150 家額外組織參與。Project Glasswing 的設計目的是讓經過審查的科技公司、安全研究人員與政府單位探測 Mythos 的錯誤、異常行為與潛在利用途徑,以便在更廣泛發布之前修補問題。此擴展被呈現為 Anthropic 在準備更廣泛提供 Mythos 等級能力時採取的謹慎推出策略的一部分。
新獲准的組織代表被視為關鍵基礎設施的部門:電力、水務、醫療、電信與硬體。Anthropic 強調,許多合作夥伴維運政府與數以億計終端用戶使用的軟體;若其程式碼庫遭到成功攻破,可能造成重大傷害。Anthropic 在公開聲明中估計,對許多夥伴來說,大規模攻擊可能影響超過一億人,並帶來嚴重的國家與全球安全後果。依據該風險評估,所有新夥伴在取得模型存取權之前,必須先滿足公司的安全要求。
Anthropic 表示,這次擴展是在與現有 Glasswing 夥伴、安全產業、開源維護者與美國政府利害關係人進行數週合作之後。公司也指出,先前的夥伴已經利用 Mythos Preview 揭露了大量漏洞:根據 Anthropic 的說法,嚴重或危急等級的問題超過 10,000 件。夥伴回報的使用案例包括自動化漏洞識別、建議補丁生成、安全審查協助與預發布測試工作流程。
Claude Mythos 的能力已吸引研究人員與政府機構的關注,他們正在評估其防禦效用以及若遭濫用時可能帶來的風險。獨立分析與測試該模型的組織報告了顯著結果。例如,有報導指出在測試中模擬的公司網路攻擊能以多個自動化步驟完成;某些專案聲稱該模型協助發現數百個瀏覽器漏洞或支援針對硬體的利用鏈研究。這些展示引發了討論:雖然該模型可加速防禦工作——發現並協助修復缺陷——但也可能降低攻擊者設計複雜行動的技術門檻。
Anthropic 將 Project Glasswing 的擴展定位為一項防禦措施:公司主張防禦方需要存取越來越有能力的 AI 工具,以跟上攻擊者可能很快獲得的相當能力。Anthropic 預期其他開發者會在未來六到十二個月內推出 Mythos 等級的模型,並警告那些未來發布可能不會包含相同的安全控制。Anthropic 認為,這種前景增加了現在就裝備受信任夥伴以發現和修補漏洞的緊迫性。
此公告的時機與 Anthropic 向美國證券交易委員會提出的機密 IPO 申請同步。公司表示計畫在完成額外的安全防護措施後「於未來數週」向客戶提供 Mythos 等級的模型。雖然 Anthropic 已公開提供有關 Glasswing 擴展的一些細節,但公司尚未立即回應媒體要求進一步評論的請求。
受控擴展也改變了市場與社群對該模型公開可用性的預期。預測市場與其他指標已調整了 Claude Mythos 在本月底前廣泛釋出的可能性,反映投資人與使用者基於公司分階段推出與以安全為先的姿態所重新校準的時程。
從 Anthropic 的公告可以得出幾項更廣泛的啟示。首先,公司做法凸顯部署前沿 AI 時的一個常見取捨:在讓受信任方早期防禦性使用的好處與可能因能被濫用而帶來的風險之間取得平衡。其次,針對關鍵基礎設施夥伴的重點強調了當先進 AI 應用於擁有大量使用者系統的軟體安全時,特別脆弱與高賭注的情形。第三,Anthropic 預期其他團隊很快會發布同等能力的模型,指出模型能力與安全措施的競賽正在加速。
從政策角度來看,此舉強化了在處理可能實質影響國家安全與公共安全的模型時,需要協調的公私部門參與的呼籲。政府與產業利害關係人可能會繼續推動透明的防護措施、標準化的風險評估,以及負責任的存取程序,以在降低濫用機會的同時讓防禦方得以準備。
總而言之,Anthropic 將 Project Glasswing 擴展至約 150 家額外組織,是其對 Claude Mythos 採取謹慎推出策略的具體步驟。此舉既反映了該模型改善防禦性資安工作的潛力,也反映了對強大生成式 AI 可能被惡意利用的更廣泛憂慮。隨著 Anthropic 朝更廣泛發布邁進,Glasswing 的測試與修復成果將受到資安團隊、監管機構與廣大公眾的密切關注。
重點摘要表
| 面向 | 說明 |
|---|---|
| 計畫擴展 | Anthropic 正在向 Project Glasswing 新增約 150 家組織,以測試並保護 Claude Mythos。 |
| 參與部門 | 新夥伴包括關鍵基礎設施組織:電力、水務、醫療、通訊與硬體。 |
| 安全理由 | Anthropic 表示防禦方需要有能力的 AI 工具來在更廣泛的模型發布之前識別並修補漏洞。 |
| 回報結果 | 早期參與者據稱使用 Mythos Preview 發現超過 10,000 件高或危急等級的漏洞並草擬修補。 |
| 風險考量 | 雖然對防禦方有用,但若未妥善控制,該模型的能力也可能被濫用以促成複雜的網路攻擊。 |