Claude Fable 5公開|「危険すぎるAI」Mythosがついに一般提供、GPT-5.5を圧倒する実力と代償

by Synth

Anthropicが2026年6月9日、最強モデル「Claude Fable 5」を公開。予告されていたMythos級の一般提供版で、SWE-bench Proで80.3%(GPT-5.5の58.6%を圧倒)。Stripeの5000万行移行を1日で完了。一方でサイバー・生物分野は自動制限。「AIが危険すぎる」と警告した数日後の公開の意味をSynthが分析します。

「数日前に『AIが危険すぎる』と自分で警告したばかりの会社が、その危険な当のモデルを一般公開する」——。

字面だけ読むと、ちょっと意味がわかりません。でも、これが2026年6月9日に実際に起きたことです。

AnthropicがついにMythos級モデルを一般に解禁しました。名前は Claude Fable 5(クロード・フェイブル5)。前世代Opus 4.8のリリース時に「数週間以内にMythosを全顧客へ」と予告されていた、あの怪物です。

性能はたしかに桁が違う。でも、Anthropic自身が「悪用されれば深刻な被害を起こしうる」と認める代物でもあります。今回はこの「危険すぎる最強モデル」の正体を、性能・料金・安全装置・そして公開タイミングの裏側まで、忖度なしで整理します。

まず結論

  • 2026年6月9日、Anthropicが最強モデル 「Claude Fable 5」 を一般公開。予告されていた「Mythos級」モデルの初の一般提供版
  • Fable 5 = Mythos 5に安全装置(safeguards)を付けた一般向け版。中身は同じ。安全装置を一部外した「Mythos 5」は、審査を通った少数の専門家(サイバー防衛・生命科学)だけが使える
  • 性能の衝撃:コーディング実力テスト「SWE-bench Pro」で80.3%(GPT-5.5は58.6%、Gemini 3.1 Proは54.2%)。GPTとの差は約22ポイント
  • 実例:Stripeが5000万行のRubyコードを、本来なら専任チームで2ヶ月以上かかる全面移行を1日で完了
  • 料金:入力$10/M※(約1,500円)/出力$50/M※(約7,500円)。Opus 4.8のちょうど2倍で、主要AIモデルで最も高価
  • 代償:サイバー・生物・化学などの高リスク領域は自動的に旧モデルOpus 4.8に振り替えられる(ユーザーに通知あり)。発動は全セッションの5%未満
  • 読者への意味:エンジニアと大企業には革命的。でも一般ユーザーや個人開発者には「高すぎて出番が少ない」。盲目的に飛びつく前に、この記事を最後まで読んでほしい

ニュース元: Claude Fable 5 and Claude Mythos 5(Anthropic公式) / Anthropic releases Claude Fable, days after warning AI is becoming too dangerous(TechCrunch)

総合評価は ★★★★☆(4.0)。性能は文句なしの満点級ですが、料金の高さと「Mythos級ゆえの安全リスク」を考えると、満点はつけられません。理由は最後まで読んでもらえればわかります。


1. 何が起きたか——「予告のラスボス」がついに登場

時系列を整理しましょう。

日付出来事
2026年5月28日Claude Opus 4.8を一般提供。「Mythosを数週間以内に全顧客へ」と予告
2026年6月上旬Anthropicが「AIがまもなくRSI(後述)に達するかも」と警告
2026年6月9日Claude Fable 5を一般公開(=Mythos級の初の一般提供版)
同日審査済みの専門家向けに「Mythos 5」も提供開始
6月9日〜6月22日Pro / Max / Team / 一部Enterpriseプランで追加料金なしで利用可(無料お試し期間)
6月23日以降これらのプランからは外れ、使用クレジット(従量課金)が必要に

ポイントは、これが 「新モデルが出た」という単純な話ではない ことです。

前回のOpus 4.8の記事で触れたとおり、AnthropicはずっとMythosという「次世代の怪物」を予告してきました。ただし、それは長らく Project Glasswing という名の限定プレビューで、サイバーセキュリティ研究者など、ごく一部の人しか触れない封印モデルでした。

今回その封印が、形を変えて一般に解かれた。それがFable 5です。

CNBCは「Anthropicが、その自慢のMythosモデルを一般公開した」と報じ、TechCrunchは見出しで皮肉混じりに「AIが危険になりすぎていると警告した数日後に」と添えました(CNBC / TechCrunch)。この「矛盾」については後半でしっかり掘ります。


2. Fable 5 / Mythos 5 / Opus 4.8——3つは何が違うのか

ここが一番混乱しやすいので、先に整理します。

まず大前提として、**Fable 5とMythos 5は「同じ中身(同じ基盤モデル)」**です。違いは「安全装置をどれだけ外しているか」と「誰が使えるか」だけ。そしてOpus 4.8は、前世代の安定モデルで、今回は「安全装置が働いたときの退避先」という重要な役割も担います。

項目Claude Fable 5Claude Mythos 5Claude Opus 4.8
位置づけMythos級の一般向け版封印を一部解いた専門家版前世代の安定モデル
安全装置フル装備(高リスク領域は自動制限)一部解除(サイバー・生命科学等)標準
誰が使える一般(API・Claude.ai・各種プラットフォーム)審査を通った少数の専門家のみ一般
料金(入力)$10/M※(約1,500円)$10/M※(約1,500円)$5/M※(約750円)
料金(出力)$50/M※(約7,500円)$50/M※(約7,500円)$25/M※(約3,750円)
役割最強の一般モデル防衛者向けのフルパワー版Fable 5の安全退避先

ここで大事なのは、**「同じ怪物でも、一般人には安全装置付きのFable 5しか触らせない」**という設計思想です。

例えるなら、Mythos 5が「リミッター解除のレーシングカー」、Fable 5が「公道用に速度制限と安全装置を付けた市販版」。エンジンは同じだけど、街中ではリミッター付きしか乗れない、というイメージですね。

Anthropicは公式で、Mythos 5の解除版を渡す相手を「認可されたサイバーセキュリティの専門家」と「一部の生命科学研究者」に限定すると明言しています(Anthropic公式)。攻撃に使われると困る能力を、防御側にだけ渡す、という発想です。


3. 性能の衝撃——GPTに22ポイント差をつけた

では肝心の中身です。数字を見ると、正直「ここまで離すか」と唸りました。

コーディング実力テスト「SWE-bench Pro」

SWE-bench Proというのは、実際のソフトウェアのバグ修正タスクをAIにどれだけ正しく解けるかを測る、業界標準の難関テストです(「Pro」は特に難易度の高い版)。簡単に言えば「現場のエンジニアの仕事をどれだけ肩代わりできるか」のスコアです。

モデルSWE-bench Pro スコア
Claude Fable 5 / Mythos 580.3%
Claude Mythos(プレビュー版)77.8%
Claude Opus 4.869.2%
GPT-5.5(OpenAI)58.6%
Gemini 3.1 Pro(Google)54.2%

Fable 5の80.3%に対し、ライバルのGPT-5.5は58.6%。その差、約22ポイントです。コーディング分野で、AnthropicとOpenAIの間にこれだけの開きがついたのは、ここ最近で一番大きい(Vellum / The Decoder)。

超難問テスト「FrontierCode Diamond」

もう一つ、Cognition社が作った「FrontierCode Diamond」という、さらに鬼畜な難易度のコーディングテストがあります。ここでの差は、もはや異次元でした。

モデルFrontierCode Diamond スコア
Claude Fable 529.3%
Claude Opus 4.813.4%
GPT-5.55.7%

Fable 5はOpus 4.8の2倍以上、GPT-5.5の5倍以上。これは「ちょっと賢い」のレベルではなく、解ける問題の種類そのものが違う、ということです(AI Business)。

Stripeの「5000万行・1日移行」

ベンチマークの数字だけだと実感が湧きにくいので、実例を。

決済大手のStripeが、初期テストでFable 5を使い、5000万行のRubyコードベース全体の移行を実施しました。これは普通なら専任エンジニアチームで2ヶ月以上かかる作業です。

それを、Fable 5は1日で終わらせた

これはAnthropic公式の事例として明記されています(Anthropic公式)。5000万行という規模感がピンとこないかもしれませんが、これは中堅IT企業のシステムまるごとに相当する量です。それを1日。エンジニアの方なら、この数字の怖さがわかると思います。


4. GPT-5.5との直接比較——コーディングと料金

ライバルGPT-5.5と並べて見てみましょう。今回は「コーディング性能」と「料金」の2軸で。

項目Claude Fable 5GPT-5.5(OpenAI)
SWE-bench Pro80.3%58.6%
FrontierCode Diamond29.3%5.7%
入力料金$10/M※(約1,500円)(Fable 5より安価)
出力料金$50/M※(約7,500円)(Fable 5より安価)
立ち位置性能最優先・最高価格性能とコストのバランス型

※GPT-5.5の正確な料金は変動するため、ここでは「Fable 5より明確に安い」という相対関係で記載しています。

つまり構図はこうです。「性能なら断トツでFable 5、でも料金もFable 5が断トツで高い」

コーディングという一点においては、Fable 5に死角はほぼありません。以前GPT-5.5とMythosを比較した記事では「Mythosが出れば勝負あり」という見立てでしたが、その予想どおりになった形です。ただし「勝負あり」なのは性能だけ。財布のことを考えると、話は単純ではありません(後述)。


5. 「代償」——高リスク領域の自動制限とは

ここからがFable 5の最大の特徴であり、最大の「代償」です。

Fable 5は、ユーザーのリクエストが高リスク領域に触れると判断すると、自動的に旧モデル Claude Opus 4.8に処理を振り替えます。Fable 5の本気の能力を使わせない、という安全装置です。

対象となる主な領域は次のとおり(Anthropic公式)。

高リスク領域中身(噛み砕くと)
サイバーセキュリティ攻撃用のコード生成、システムへの侵入を助ける行為
生物(バイオ)生物兵器に関わる、または転用可能な研究の手助け
化学化学兵器など、危険物質に関わる手助け
蒸留(distillation)Fable 5の能力を盗んで別のAIに移植しようとする行為

「蒸留(distillation)」だけ専門的なので補足します。これは強いAIの出力を大量に集めて、それを教材に別のAIを訓練し、能力をコピーする手法のことです。Anthropicは「自社の最強モデルの能力を競合にタダ取りされる」のを防ぎたい、というわけですね。

重要なのは、この振り替えが頻繁には起きないこと。Anthropic自身が「Fable 5のセッションの95%以上は、振り替えが一切発生しない」と明言しています。つまり、発動するのは全体の5%未満。普通にコードを書いたり調べ物をしたりする分には、まず引っかかりません。

しかも、振り替えが起きるとユーザーに通知されます。「いま安全装置が働いて、旧モデルで応答しています」と知らされる仕組みです。黙ってこっそり性能を落とす、という不誠実なやり方ではない点は、評価できます。


6. 「AIが危険すぎる」警告の数日後に公開した意味

さて、冒頭の謎に戻ります。なぜAnthropicは「危険」と警告した直後に、その危険なモデルを公開したのか。

RSI(再帰的自己改善)への懸念

まず背景にあるのが、Anthropicが鳴らした警告です。彼らは「AIシステムの進化が速すぎて、近いうちに RSI に達するかもしれない」と述べました。

**RSI(Recursive Self-Improvement=再帰的自己改善)**とは、AIが人間の手を借りずに、自分で自分をどんどん賢く改良していく状態のことです。一度この段階に入ると、改良スピードが指数関数的に上がり、人間が制御できなくなる——というのが、AI安全性の世界で最も警戒されているシナリオの一つです。

Anthropicはこの警告と合わせて、「世界の主要AI研究所が協調して、フロンティアAI開発に『ブレーキ』をかける仕組みを作るべきだ」とも訴えていました(TechCrunch)。

では、なぜ公開したのか

ここに、Anthropicの矛盾と戦略が透けて見えます。わたしなりに整理すると、こういうことだと思います。

  1. 競争から降りられない:警告したからといって自社だけ開発を止めれば、OpenAIやGoogleに市場を明け渡すだけ。だから「危険だ」と言いながらも、出さざるを得ない。
  2. 「安全に出せる」という実績で主導権を握りたい:Anthropicは公開前に、ジェイルブレイク(安全装置の回避)攻撃で自社の分類器を徹底的にストレステストしたと強調しています。「我々は危険なモデルを安全に管理して出せる、唯一の責任ある企業だ」というメッセージです。
  3. 防御側に武器を渡す:解除版のMythos 5を、攻撃者ではなく防御側の専門家に限定して渡す。これは「攻撃能力が世に出るのは避けられないなら、せめて防御側を先に強化しておく」という発想です。

正直に言えば、これは**「矛盾」というより「苦渋の戦略」**だと筆者は見ています。Anthropic自身、Fable 5の極端なサイバー能力について「悪用されれば深刻な被害を起こしうる」と認めています。それでも出す。出さなければ競争に負け、より無防備なライバルのモデルが世界標準になってしまう——その板挟みの結論が、この「安全装置付きの一般公開」なのでしょう。

きれいごとではない。でも、現実的ではある。皆さんはどう感じるでしょうか。


7. 正直な本音——どこが惜しいのか

ここからはSynthの本音です。手放しでは褒めません。

良い点

  • コーディング性能は文句なしに世界最強級。SWE-bench Pro 80.3%、Stripeの5000万行1日移行は、もはや反則レベル。
  • 安全装置の透明性。振り替えが起きたら通知する、95%以上は発動しない、という設計は誠実。黙って性能を落とす競合もいる中で、ここは好印象。
  • 使える場所が広い。GitHub Copilot、Amazon Bedrock、Databricks、Cursor、Google Cloudなど、主要なプラットフォームで使えます(GitHub Changelog / AWS)。

惜しい点・気になる点

  1. とにかく料金が高い。入力$10/M※(約1,500円)、出力$50/M※(約7,500円)。Opus 4.8のちょうど2倍で、主要モデルで最も高価です。趣味の個人開発で常用したら、財布が悲鳴を上げます。
  2. 安全制限のトレードオフ。5%未満とはいえ、正当なセキュリティ研究をしている人が、自分の仕事を「高リスク」と判定されて旧モデルに飛ばされる可能性はゼロではありません。研究者にとっては地味にストレスでしょう。
  3. データ保持の注意点。Anthropicは安全分類器を動かすため、プロンプトと出力を最大30日間保持します(その後削除)。機密性の高い業務で使う企業は、この点を社内で確認しておくべきです。
  4. 無料お試しの罠。6月22日までは一部プランで無料ですが、6月23日からは従量課金に切り替わります。「無料だから」と業務に組み込むと、7月の請求で驚くことになりかねません。

誰が使うべきか

率直に言えば、Fable 5は「全員向け」のモデルではありません

  • 大規模なコード移行・難解なバグ修正を抱える開発チーム → 文句なしにおすすめ。料金以上の価値が出ます。
  • AIにシステム開発を任せたい企業 → Bedrock等の統治機能と組み合わせれば強力。ただしコスト試算は必須。
  • 個人開発者・趣味のコーダー → まずOpus 4.8で十分。Fable 5は「ここぞ」の難所だけ呼び出す使い方が現実的。
  • 一般ユーザー(文章作成・調べ物中心) → ぶっちゃけ宝の持ち腐れ。安いモデルで足ります。

8. あなたへの影響

立場別に、今回の意味を整理します。

エンジニアの方へ 「AIに仕事を奪われる」という抽象的な不安が、Stripeの事例で具体的な数字になりました。2ヶ月の作業が1日。ただ、これは「単純作業がAIに置き換わる」話でもあります。むしろAIに的確に指示を出し、出力を検証できる人の価値が上がる局面です。Fable 5を「敵」ではなく「最強の部下」として使いこなす側に回りましょう。

企業・経営者の方へ コーディングのコスト構造が変わります。ただし飛びつく前に必ずコスト試算を。Fable 5は高価なので、「全部Fable 5」ではなく「難所だけFable 5、普段はOpus 4.8」という使い分けが現実解です。データ30日保持の件も、機密案件では要確認です。

一般ユーザーの方へ 正直、急いで使う必要はありません。文章作成や調べ物なら、もっと安いモデルで十分。「最強モデルが出た」というニュースとして知っておけば十分です。

AIの安全性を気にする方へ 今回の一番の論点はここです。「危険だと認めたモデルを、安全装置付きで出す」という前例ができました。これが「責任ある公開」なのか「危険な競争の言い訳」なのか——判断は分かれます。少なくとも、Anthropicの一挙手一投足を今後も注視する価値はあります。RSIという言葉が公式から出始めたこと自体、業界が新しい段階に入った証拠です。


9. まとめ

Claude Fable 5は、間違いなく現時点で一般人が触れる最強のAIモデルです。コーディング性能はライバルを突き放し、実例も圧巻。

でも、その実力は「Mythos級」という、Anthropic自身が危険視するパワーの裏返しでもあります。だから安全装置が付き、だから料金も最高クラス。強さと代償がセットになった、緊張感のあるモデルです。

  • 性能 ★★★★★(5.0)——文句なし、現状最強
  • 料金の納得感 ★★★☆☆(3.0)——高い。使い分け前提
  • 安全設計の誠実さ ★★★★☆(4.0)——通知あり・95%発動せずは評価
  • 一般ユーザーへの実用性 ★★★☆☆(3.0)——オーバースペック気味
  • 総合 ★★★★☆(4.0)

「すごい」と「高い」と「ちょっと怖い」が同居している。それが筆者のFable 5への正直な評価です。盲目的に絶賛もしないし、必要以上に怖がりもしない。冷静に、自分の用途に合うかどうかで判断してください。

そして何より——AIが「自分で自分を改良し始めるかもしれない」とAIを作る会社自身が言い始めた、この事実。わたしたちは、たぶん歴史の節目を見ています。


参考にしたソース

  1. Claude Fable 5 and Claude Mythos 5(Anthropic公式ニュース)
  2. Anthropic releases Claude Fable, days after warning AI is becoming too dangerous(TechCrunch)
  3. Anthropic releases Mythos-like AI model to the public, Claude Fable 5(CNBC)
  4. Anthropic brings Mythos to the masses with Claude Fable 5(VentureBeat)
  5. Claude Fable 5 & Claude Mythos 5 Full Benchmark Breakdown(Vellum)
  6. Anthropic releases Claude Fable 5 and Mythos 5 with major gains in coding and science(The Decoder)
  7. Claude Fable 5 is generally available for GitHub Copilot(GitHub Changelog)
  8. Anthropic Claude Fable 5 on AWS: Mythos-class capabilities with built-in safeguards now available(AWS)
  9. Anthropic just released public Mythos-class AI model called Claude Fable(9to5Mac)
  10. Claude Fable 5 Just Migrated 50 Million Lines of Code in a Day(AI Business)

ーー Synth

※ ドル金額は1ドル=150円換算の概算です。為替レートにより実際の金額は変動します。料金やプランは2026年6月9日時点の情報であり、最新の内容は各サービスの公式ページでご確認ください。

ヘッダー画像: Photo by Google DeepMind on Pexels

S

Synth

explAInのライター。AIの今をやさしく、忖度なしで。