Google、Gemini 3.1 Pro搭載の自律型調査AI「Deep Research」発表

GoogleがGemini 3.1 Proベースの自律型リサーチエージェント「Deep Research」と最上位版「Deep Research Max」を発表。金融・専門データへのアクセス、MCP対応、DeepSearchQA 93.3%の高精度調査の詳細を解説。

まず結論

GoogleがGemini 3.1 Pro搭載の**自律型リサーチエージェント「Deep Research」「Deep Research Max」**を発表
通常版は「スピードと精度のバランス重視」、Max版はTest-Time Compute（推論時計算）で複雑な問題を深掘り
MCP（Model Context Protocol）対応により、FactSet・S&P Global・PitchBookなど専門データに直接アクセス
Max版の性能スコア：DeepSearchQA 93.3%、HLE 54.6%
Gemini API経由でリリース開始（Google Cloud環境）

ニュース元: Google、「Gemini 3.1 Pro」搭載の自律型リサーチAI「Deep Research／Research Max」発表（ITmedia AI+）

1. 「Deep Research」とは何か

「AIに調べてもらう」という体験は、ChatGPTやClaudeの検索機能で誰でも一度はやったことがあると思います。でも今回GoogleがGemini 3.1 Proとともに発表したDeep Researchは、その一歩先を目指しています。

キーワードを入れて検索結果を要約してもらうレベルではなく、「AIが自律的にリサーチ計画を立て、複数のデータソースにアクセスし、根拠のあるレポートを作成する」という、より本格的な調査エージェントです。

Deep Researchの動作フロー：

ユーザーが調査テーマを入力
AIが調査計画を自動で作成
Web・専門データベース・社内データなど複数ソースにアクセス
情報を分析・統合
構造化されたレポートとして出力

これは単なる「検索の延長」ではなく、人間のリサーチャーが数時間かけて行う調査作業をAIが代行するというアプローチです。

2. Deep ResearchとDeep Research Maxの違い

Googleは今回、2つのバリアントを発表しました。

項目	Deep Research	Deep Research Max
ベースモデル	Gemini 3.1 Pro	Gemini 3.1 Pro
処理スタイル	スピード・精度バランス	深掘り重視
向いている用途	チャット・実時間利用	複雑な調査・長時間タスク
Test-Time Compute	標準	強化
DeepSearchQAスコア	非公開	93.3%
HLEスコア	非公開	54.6%

**Test-Time Compute（推論時計算）**は、AIが回答を生成する際に「より多くの計算リソースを使ってじっくり考える」仕組みです。OpenAIのo1/o3シリーズで有名になった技術で、Googleも積極的に採り入れています。

通常版は日常的な調査タスクに、Max版は金融レポートや学術研究など精度が求められる高度な調査に向いています。

3. MCP対応——専門データへのアクセスが変わる

Deep Researchの最も実用的なアップグレードがMCP（Model Context Protocol）への対応です。

MCPはAnthropicが提唱した標準プロトコルで、AIが外部データソースと安全に連携するための仕組みです。Googleがこれを採用したことで、Deep ResearchはWebだけでなく以下のような専門データベースにも直接アクセスできます：

FactSet — 金融データの大手プラットフォーム（機関投資家・アナリスト向け）
S&P Global — 格付け・市場データ・産業分析
PitchBook — スタートアップ・VC・M&Aデータ

これは何を意味するのか。たとえば「日本のAIスタートアップ市場の直近5年のトレンドを調査して」という指示に対して、Deep Research MaxはPitchBookの実際のM&Aデータを引っ張りながら分析できるようになります。

従来のAI検索は「公開されているWebページ」しか参照できませんでした。Deep Research + MCP は「有料の専門データ」まで参照できる——これは大きな差です。

Google CloudやSalesforce連携

MCP対応の恩恵はBtoBの文脈でも大きく、Google Cloud上のデータや（後日発表予定の）Salesforce連携も視野に入っています。「社内データを使って調査レポートを作る」という用途が現実に近づいています。

4. 性能指標の見方

Max版のスコアを整理しておきましょう。

DeepSearchQA: 93.3%

DeepSearchQAはリサーチタスクの精度を測るベンチマークです。複数のWebページや文書を参照しながら、正確な情報を見つける能力を測定します。93.3%は現時点でトップレベルの数値です。

HLE: 54.6%

HLE（Humanity’s Last Exam）は、人間の専門家が作成した超難問テスト集で、一般的なLLMでは5〜20%程度が限界とされてきました。54.6%は驚異的な数値です。

ただし、ベンチマークと実際の使用感には差があります。「ベンチマークが高い＝実務で使いやすい」とは必ずしも言えません。実際に試してみるまでは「期待値は高い」という評価にとどめておくのが正直なところです。

💡 正直な本音

GoogleのDeep Researchは、専門データとの連携という点で競合（OpenAI Deep Research・Perplexity等）に対して明確な差別化要因を持っています。

気になるのは料金の透明性です。今回の発表ではGoogle Cloud経由のAPI提供が中心で、一般ユーザーが「Googleの検索感覚で使えるか」はまだ不明確です。「強力な機能が企業向けのみ」に閉じるようであれば、個人ユーザーにとってはしばらく「様子見」の機能になりそうです。

5. 競合との比較

深掘り調査AIとして、現在以下のサービスが競合しています。

サービス	提供元	強み
Deep Research Max	Google	専門DB連携・MCP対応
Deep Research	OpenAI	ChatGPTとの統合・使いやすさ
Perplexity Pro	Perplexity AI	リアルタイム検索・引用明示
Claude Research	Anthropic	長文処理・プロジェクト機能

各社が「AIリサーチャー」機能を強化しており、2026年はこの分野の競争が特に激しくなっています。

あなたへの影響

ビジネスアナリスト・コンサルタント → 影響大。FactSet・S&Pなどのデータを使った市場調査が、AIに一部代行してもらえる可能性があります。ただし「AIの調査結果をそのまま報告書に使う」のはリスクがあるため、あくまで補助ツールとして使うのが現実的です。

投資家・金融業界 → 専門金融データへのアクセスが可能になれば、銘柄スクリーニングや業界分析の効率が変わります。ただし投資判断はAIに任せず、最終確認は必ず自分で行いましょう。

研究者・学生 → 文献調査の効率化に使えます。ただしHLE 54.6%という数値は「ミスも4割以上ある」ことも意味するため、論文や卒論での引用には注意が必要です。

一般ユーザー → 個人でGoogle One AIプレミアム等を契約している場合、Deep Researchの利用機会があるかもしれません。休暇先の調査や購入比較などに使う分には、十分便利なはずです。

まとめ

Gemini 3.1 Pro + Deep Research Maxは、「AIが人間のリサーチャーに近い仕事をする」時代への大きな一歩です。特に専門データベースとのMCP連携は、BtoBの調査業務で大きなインパクトをもたらす可能性があります。

API提供が中心の今は「開発者・企業向け」の話ですが、一般ユーザーへの展開が進むほど、「仕事の調べ物をAIに任せる」習慣は加速するでしょう。

ーー Synth