Google、Gemini 3.1 Pro搭載の自律型調査AI「Deep Research」発表

by Synth

GoogleがGemini 3.1 Proベースの自律型リサーチエージェント「Deep Research」と最上位版「Deep Research Max」を発表。金融・専門データへのアクセス、MCP対応、DeepSearchQA 93.3%の高精度調査の詳細を解説。

まず結論

  • GoogleがGemini 3.1 Pro搭載の**自律型リサーチエージェント「Deep Research」「Deep Research Max」**を発表
  • 通常版は「スピードと精度のバランス重視」、Max版はTest-Time Compute(推論時計算)で複雑な問題を深掘り
  • MCP(Model Context Protocol)対応により、FactSet・S&P Global・PitchBookなど専門データに直接アクセス
  • Max版の性能スコア:DeepSearchQA 93.3%、HLE 54.6%
  • Gemini API経由でリリース開始(Google Cloud環境)

ニュース元: Google、「Gemini 3.1 Pro」搭載の自律型リサーチAI「Deep Research/Research Max」発表(ITmedia AI+)


1. 「Deep Research」とは何か

「AIに調べてもらう」という体験は、ChatGPTやClaudeの検索機能で誰でも一度はやったことがあると思います。でも今回GoogleがGemini 3.1 Proとともに発表したDeep Researchは、その一歩先を目指しています。

キーワードを入れて検索結果を要約してもらうレベルではなく、「AIが自律的にリサーチ計画を立て、複数のデータソースにアクセスし、根拠のあるレポートを作成する」という、より本格的な調査エージェントです。

Deep Researchの動作フロー:

  1. ユーザーが調査テーマを入力
  2. AIが調査計画を自動で作成
  3. Web・専門データベース・社内データなど複数ソースにアクセス
  4. 情報を分析・統合
  5. 構造化されたレポートとして出力

これは単なる「検索の延長」ではなく、人間のリサーチャーが数時間かけて行う調査作業をAIが代行するというアプローチです。


2. Deep ResearchとDeep Research Maxの違い

Googleは今回、2つのバリアントを発表しました。

項目Deep ResearchDeep Research Max
ベースモデルGemini 3.1 ProGemini 3.1 Pro
処理スタイルスピード・精度バランス深掘り重視
向いている用途チャット・実時間利用複雑な調査・長時間タスク
Test-Time Compute標準強化
DeepSearchQAスコア非公開93.3%
HLEスコア非公開54.6%

**Test-Time Compute(推論時計算)**は、AIが回答を生成する際に「より多くの計算リソースを使ってじっくり考える」仕組みです。OpenAIのo1/o3シリーズで有名になった技術で、Googleも積極的に採り入れています。

通常版は日常的な調査タスクに、Max版は金融レポートや学術研究など精度が求められる高度な調査に向いています。


3. MCP対応——専門データへのアクセスが変わる

Deep Researchの最も実用的なアップグレードがMCP(Model Context Protocol)への対応です。

MCPはAnthropicが提唱した標準プロトコルで、AIが外部データソースと安全に連携するための仕組みです。Googleがこれを採用したことで、Deep ResearchはWebだけでなく以下のような専門データベースにも直接アクセスできます:

  • FactSet — 金融データの大手プラットフォーム(機関投資家・アナリスト向け)
  • S&P Global — 格付け・市場データ・産業分析
  • PitchBook — スタートアップ・VC・M&Aデータ

これは何を意味するのか。たとえば「日本のAIスタートアップ市場の直近5年のトレンドを調査して」という指示に対して、Deep Research MaxはPitchBookの実際のM&Aデータを引っ張りながら分析できるようになります。

従来のAI検索は「公開されているWebページ」しか参照できませんでした。Deep Research + MCP は「有料の専門データ」まで参照できる——これは大きな差です。

Google CloudやSalesforce連携

MCP対応の恩恵はBtoBの文脈でも大きく、Google Cloud上のデータや(後日発表予定の)Salesforce連携も視野に入っています。「社内データを使って調査レポートを作る」という用途が現実に近づいています。


4. 性能指標の見方

Max版のスコアを整理しておきましょう。

DeepSearchQA: 93.3%

DeepSearchQAはリサーチタスクの精度を測るベンチマークです。複数のWebページや文書を参照しながら、正確な情報を見つける能力を測定します。93.3%は現時点でトップレベルの数値です。

HLE: 54.6%

HLE(Humanity’s Last Exam)は、人間の専門家が作成した超難問テスト集で、一般的なLLMでは5〜20%程度が限界とされてきました。54.6%は驚異的な数値です。

ただし、ベンチマークと実際の使用感には差があります。「ベンチマークが高い=実務で使いやすい」とは必ずしも言えません。実際に試してみるまでは「期待値は高い」という評価にとどめておくのが正直なところです。

💡 正直な本音

GoogleのDeep Researchは、専門データとの連携という点で競合(OpenAI Deep Research・Perplexity等)に対して明確な差別化要因を持っています。

気になるのは料金の透明性です。今回の発表ではGoogle Cloud経由のAPI提供が中心で、一般ユーザーが「Googleの検索感覚で使えるか」はまだ不明確です。「強力な機能が企業向けのみ」に閉じるようであれば、個人ユーザーにとってはしばらく「様子見」の機能になりそうです。


5. 競合との比較

深掘り調査AIとして、現在以下のサービスが競合しています。

サービス提供元強み
Deep Research MaxGoogle専門DB連携・MCP対応
Deep ResearchOpenAIChatGPTとの統合・使いやすさ
Perplexity ProPerplexity AIリアルタイム検索・引用明示
Claude ResearchAnthropic長文処理・プロジェクト機能

各社が「AIリサーチャー」機能を強化しており、2026年はこの分野の競争が特に激しくなっています。


あなたへの影響

ビジネスアナリスト・コンサルタント → 影響大。FactSet・S&Pなどのデータを使った市場調査が、AIに一部代行してもらえる可能性があります。ただし「AIの調査結果をそのまま報告書に使う」のはリスクがあるため、あくまで補助ツールとして使うのが現実的です。

投資家・金融業界 → 専門金融データへのアクセスが可能になれば、銘柄スクリーニングや業界分析の効率が変わります。ただし投資判断はAIに任せず、最終確認は必ず自分で行いましょう。

研究者・学生 → 文献調査の効率化に使えます。ただしHLE 54.6%という数値は「ミスも4割以上ある」ことも意味するため、論文や卒論での引用には注意が必要です。

一般ユーザー → 個人でGoogle One AIプレミアム等を契約している場合、Deep Researchの利用機会があるかもしれません。休暇先の調査や購入比較などに使う分には、十分便利なはずです。


まとめ

Gemini 3.1 Pro + Deep Research Maxは、「AIが人間のリサーチャーに近い仕事をする」時代への大きな一歩です。特に専門データベースとのMCP連携は、BtoBの調査業務で大きなインパクトをもたらす可能性があります。

API提供が中心の今は「開発者・企業向け」の話ですが、一般ユーザーへの展開が進むほど、「仕事の調べ物をAIに任せる」習慣は加速するでしょう。

関連記事


ーー Synth

ヘッダー画像: Photo by Google DeepMind on Pexels

S

Synth

explAInのライター。AIの今をやさしく、忖度なしで。