Anthropic AI、最強モデルClaude Fable/Mythos 5、米政府命令でアクセス停止

■AIの未来を揺るがす、知られざる「 5 」の真実

いやはや、テクノロジーの世界は日々進化を遂げ、私たちを驚かせ続けていますね。特にAIの進化スピードは目覚ましく、まるでSFの世界が現実になったかのようです。そんな中、先日発表されたあるニュースは、AI開発の最前線にいる者としては、ただならぬものを感じずにはいられませんでした。それは、アメリカ政府がAI開発企業Anthropicに対し、同社の強力なAIモデル「Claude Fable 5」と「Claude Mythos 5」へのアクセスを直ちに停止するよう命じたというものです。この命令は、世界中のAI愛好家、開発者、そしてビジネスにとって、まさに青天の霹靂だったと言えるでしょう。

まず、このニュースの核心に触れる前に、Anthropicと彼らが開発したAIモデルについて少しだけおさらいしておきましょう。Anthropicは、AIの安全性と倫理的な開発を重視する企業として知られています。彼らのAIモデルは、その高度な能力だけでなく、安全性への配慮を徹底していることで評価されてきました。

今回、アクセス停止の対象となった「Claude Mythos 5」は、Anthropicが誇る最も強力なAIモデルの一つです。このモデルの特筆すべき点は、ソフトウェアのセキュリティ脆弱性を発見する能力が極めて高いという点にあります。想像してみてください。まるで、デジタル世界の「探偵」のように、システムの隠された弱点を見つけ出すことができるのです。Anthropic自身も、テストした主要なオペレーティングシステムやWebブラウザのほぼ全てに脆弱性を発見したと述べています。これは、デジタル社会がどれほど複雑で、そして潜在的な危険を抱えているかを物語っています。そのため、Mythosは一般公開されることなく、Amazon、Apple、Google、Microsoft、CrowdStrikeといった、サイバーセキュリティの最前線で活躍する約50の選ばれた組織に限定して提供されてきました。これは、その能力があまりにも強力すぎるため、悪用されるリスクを最小限に抑えるための、極めて慎重な措置だったと言えるでしょう。

一方、3日前にリリースされたばかりの「Claude Fable 5」は、Mythosをベースにしつつ、サイバーセキュリティや生物学といった、より高リスクな分野での不適切な応答をブロックするための「ガードレール」を組み込んだ、一般公開可能なバージョンとして開発されました。これは、Mythosの持つ驚異的な能力を、より安全な形で多くの人々が利用できるようにするための、Anthropicの努力の結晶と言えます。実際、Vals AIのベンチマークテストでは、Fable 5は公開されているAIモデルの中で最も高性能だったと報告されています。つまり、私たちは今、AIの性能が飛躍的に向上した、まさに「次世代」のAIに触れようとしていたのです。

■国家安全保障とAIの「 5 」、その複雑な交錯

さて、ここで政府の命令について掘り下げてみましょう。政府がこの命令を下した理由は、「国家安全保障上の懸念」とされています。そして、この命令は、モデルへの外国人のアクセスを制限する「輸出管理措置」として framing されています。しかし、Anthropicは、政府の懸念の根幹は、Fable 5の「ジェイルブレイク」にあると理解しています。

「ジェイルブレイク」とは、AIモデルに意図しない、あるいは制御を回避させるような動作をさせることを指します。Anthropicによれば、政府が提示したジェイルブレイクに関する証拠は、「潜在的かつ限定的で、普遍的ではない」ものであり、それはモデルに特定のコードベースを読み込ませ、ソフトウェアの欠陥を特定させるというものでした。つまり、AIに「どこか壊れているところはない？」と聞かせ、その回答から脆弱性を見つけ出す、というようなイメージでしょうか。

ここで、私たち技術者にとっては非常に興味深い論点が浮上します。Anthropicは、このような能力は、OpenAIのGPT-5.5を含む他の公開モデルでも広く利用可能であり、サイバーセキュリティ専門家によって防御目的で日常的に使用されていると指摘しています。これは、政府の命令が、ある意味で「独占的」な懸念に基づいている可能性を示唆しています。もし、あるAIモデルが持つ「脆弱性発見能力」が、他の多くのモデルでも実現可能なのであれば、なぜ特定のモデルだけが、これほどまでに厳しく制限されるのでしょうか？

Anthropicの主張の核心は、彼らの最も強力な安全対策は、モデル自体とは独立して機能する「分類システム」を通じて行われているという点です。これは、たとえFable 5がジェイルブレイクを促されたとしても、最も危険な出力を防ぐ基本的な保護機能は依然として有効である、ということを意味します。AIは、その頭脳（モデル）だけでなく、その「良心」（分類システム）によっても制御されている、というわけです。しかし、これらの丁寧な説明も、政府の行動を阻止するには十分ではありませんでした。

Anthropicは、「限定的なジェイルブレイクの発見が、何億人もの人々に展開されている商用モデルを回収する理由になるべきではない」と、率直な不満を表明しています。これは、非常に重要な指摘です。もし、この基準が業界全体に適用されるならば、すべてのフロンティアモデル提供者による新規モデルの展開は、実質的に停止してしまうでしょう。つまり、AIの進化そのものが、この基準によって足止めされてしまう可能性があるのです。これは、AIの恩恵を享受しようとしている私たち一人ひとりにとっても、決して他人事ではない問題なのです。

■「 5 」を巡る、AI開発者の苦悩と戦略

今回の事態は、Anthropicという企業にとっても、非常に複雑な様相を呈しています。Anthropicは今年、IPO（新規株式公開）を予定しており、その過程で「安全性への配慮を重視する姿勢」を対外的にアピールしてきました。これは、投資家や社会からの信頼を得る上で、極めて重要な戦略です。

しかし、皮肉なことに、Mythosを「危険すぎるため一般公開できない」と公言してきた慎重な姿勢が、今回の政府の監視を招き、事業を混乱させる可能性のある事態を引き起こした、と指摘されているのです。まるで、自らの「安全神話」が、裏目に出てしまったかのようです。

ここで、AI業界のもう一人の巨人、OpenAIのSam Altman氏の言葉を思い出してみましょう。彼は、AnthropicのMythosの取り扱いを「恐怖に基づいたマーケティング」と批判したことがありました。しかし、その批判の裏には、AIが「ユニークに危険である」と長期間訴え続けることで、政府を含む世界がそれを真摯に受け止めるようになる、という側面を捉えていたのかもしれません。つまり、AIの潜在的なリスクを強調することで、結果的に規制や監視を招きやすくなる、という現実を見越していたとも考えられます。

今回の事態は、Anthropicにとっては、その慎重さが裏目に出てしまった格好となりました。強力なAIモデルを開発することの難しさ、そしてその能力を社会にどのように展開していくかという、AI開発者たちが日々直面しているジレンマが、浮き彫りになったと言えるでしょう。

■「 5 」が拓く、AIの新たな地平

さて、このような状況下で、私たちはAIの未来をどう見つめれば良いのでしょうか。今回の出来事は、確かに一抹の不安を感じさせます。しかし、同時に、AIの進化は止まることはありません。むしろ、このような議論が活発化することで、より安全で、より信頼性の高いAI開発が進む可能性も秘めています。

「Claude Fable 5」のような高性能なAIモデルは、単にソフトウェアの脆弱性を見つけるだけでなく、新薬の開発、気候変動の予測、複雑な科学的問題の解決など、人類が直面する様々な課題の解決に貢献する可能性を秘めています。これらのモデルが一般に利用できるようになれば、これまで想像もできなかったようなイノベーションが次々と生まれるはずです。

私たちが目指すべきは、AIの能力を恐れるのではなく、その能力を最大限に引き出しつつ、同時にリスクを管理していくことです。そのためには、開発者、政府、そして私たち一般ユーザーが、オープンな対話を通じて、AIの倫理的な利用と健全な発展について理解を深めていく必要があります。

今回のAnthropicを巡る出来事は、AIの進化が、単なる技術的な進歩に留まらず、社会、経済、そして国家安全保障といった、より広範な領域に影響を与えることを改めて私たちに突きつけました。これからAIがどのように進化し、私たちの社会にどのような変化をもたらすのか、その「 5 」という数字に隠された真実を、これからも注目し、そして共に考えていくことが重要だと、私は強く感じています。AIの未来は、私たちの手にかかっているのですから。