Google、Gemini 3.1 Pro搭載の自律型調査AI「Deep Research」発表
GoogleがGemini 3.1 Proベースの自律型リサーチエージェント「Deep Research」と最上位版「Deep Research Max」を発表。金融・専門データへのアクセス、MCP対応、DeepSearchQA 93.3%の高精度調査の詳細を解説。
目次
まず結論
- GoogleがGemini 3.1 Pro搭載の**自律型リサーチエージェント「Deep Research」「Deep Research Max」**を発表
- 通常版は「スピードと精度のバランス重視」、Max版はTest-Time Compute(推論時計算)で複雑な問題を深掘り
- MCP(Model Context Protocol)対応により、FactSet・S&P Global・PitchBookなど専門データに直接アクセス
- Max版の性能スコア:DeepSearchQA 93.3%、HLE 54.6%
- Gemini API経由でリリース開始(Google Cloud環境)
ニュース元: Google、「Gemini 3.1 Pro」搭載の自律型リサーチAI「Deep Research/Research Max」発表(ITmedia AI+)
1. 「Deep Research」とは何か
「AIに調べてもらう」という体験は、ChatGPTやClaudeの検索機能で誰でも一度はやったことがあると思います。でも今回GoogleがGemini 3.1 Proとともに発表したDeep Researchは、その一歩先を目指しています。
キーワードを入れて検索結果を要約してもらうレベルではなく、「AIが自律的にリサーチ計画を立て、複数のデータソースにアクセスし、根拠のあるレポートを作成する」という、より本格的な調査エージェントです。
Deep Researchの動作フロー:
- ユーザーが調査テーマを入力
- AIが調査計画を自動で作成
- Web・専門データベース・社内データなど複数ソースにアクセス
- 情報を分析・統合
- 構造化されたレポートとして出力
これは単なる「検索の延長」ではなく、人間のリサーチャーが数時間かけて行う調査作業をAIが代行するというアプローチです。
2. Deep ResearchとDeep Research Maxの違い
Googleは今回、2つのバリアントを発表しました。
| 項目 | Deep Research | Deep Research Max |
|---|---|---|
| ベースモデル | Gemini 3.1 Pro | Gemini 3.1 Pro |
| 処理スタイル | スピード・精度バランス | 深掘り重視 |
| 向いている用途 | チャット・実時間利用 | 複雑な調査・長時間タスク |
| Test-Time Compute | 標準 | 強化 |
| DeepSearchQAスコア | 非公開 | 93.3% |
| HLEスコア | 非公開 | 54.6% |
**Test-Time Compute(推論時計算)**は、AIが回答を生成する際に「より多くの計算リソースを使ってじっくり考える」仕組みです。OpenAIのo1/o3シリーズで有名になった技術で、Googleも積極的に採り入れています。
通常版は日常的な調査タスクに、Max版は金融レポートや学術研究など精度が求められる高度な調査に向いています。
3. MCP対応——専門データへのアクセスが変わる
Deep Researchの最も実用的なアップグレードがMCP(Model Context Protocol)への対応です。
MCPはAnthropicが提唱した標準プロトコルで、AIが外部データソースと安全に連携するための仕組みです。Googleがこれを採用したことで、Deep ResearchはWebだけでなく以下のような専門データベースにも直接アクセスできます:
- FactSet — 金融データの大手プラットフォーム(機関投資家・アナリスト向け)
- S&P Global — 格付け・市場データ・産業分析
- PitchBook — スタートアップ・VC・M&Aデータ
これは何を意味するのか。たとえば「日本のAIスタートアップ市場の直近5年のトレンドを調査して」という指示に対して、Deep Research MaxはPitchBookの実際のM&Aデータを引っ張りながら分析できるようになります。
従来のAI検索は「公開されているWebページ」しか参照できませんでした。Deep Research + MCP は「有料の専門データ」まで参照できる——これは大きな差です。
Google CloudやSalesforce連携
MCP対応の恩恵はBtoBの文脈でも大きく、Google Cloud上のデータや(後日発表予定の)Salesforce連携も視野に入っています。「社内データを使って調査レポートを作る」という用途が現実に近づいています。
4. 性能指標の見方
Max版のスコアを整理しておきましょう。
DeepSearchQA: 93.3%
DeepSearchQAはリサーチタスクの精度を測るベンチマークです。複数のWebページや文書を参照しながら、正確な情報を見つける能力を測定します。93.3%は現時点でトップレベルの数値です。
HLE: 54.6%
HLE(Humanity’s Last Exam)は、人間の専門家が作成した超難問テスト集で、一般的なLLMでは5〜20%程度が限界とされてきました。54.6%は驚異的な数値です。
ただし、ベンチマークと実際の使用感には差があります。「ベンチマークが高い=実務で使いやすい」とは必ずしも言えません。実際に試してみるまでは「期待値は高い」という評価にとどめておくのが正直なところです。
💡 正直な本音
GoogleのDeep Researchは、専門データとの連携という点で競合(OpenAI Deep Research・Perplexity等)に対して明確な差別化要因を持っています。
気になるのは料金の透明性です。今回の発表ではGoogle Cloud経由のAPI提供が中心で、一般ユーザーが「Googleの検索感覚で使えるか」はまだ不明確です。「強力な機能が企業向けのみ」に閉じるようであれば、個人ユーザーにとってはしばらく「様子見」の機能になりそうです。
5. 競合との比較
深掘り調査AIとして、現在以下のサービスが競合しています。
| サービス | 提供元 | 強み |
|---|---|---|
| Deep Research Max | 専門DB連携・MCP対応 | |
| Deep Research | OpenAI | ChatGPTとの統合・使いやすさ |
| Perplexity Pro | Perplexity AI | リアルタイム検索・引用明示 |
| Claude Research | Anthropic | 長文処理・プロジェクト機能 |
各社が「AIリサーチャー」機能を強化しており、2026年はこの分野の競争が特に激しくなっています。
あなたへの影響
ビジネスアナリスト・コンサルタント → 影響大。FactSet・S&Pなどのデータを使った市場調査が、AIに一部代行してもらえる可能性があります。ただし「AIの調査結果をそのまま報告書に使う」のはリスクがあるため、あくまで補助ツールとして使うのが現実的です。
投資家・金融業界 → 専門金融データへのアクセスが可能になれば、銘柄スクリーニングや業界分析の効率が変わります。ただし投資判断はAIに任せず、最終確認は必ず自分で行いましょう。
研究者・学生 → 文献調査の効率化に使えます。ただしHLE 54.6%という数値は「ミスも4割以上ある」ことも意味するため、論文や卒論での引用には注意が必要です。
一般ユーザー → 個人でGoogle One AIプレミアム等を契約している場合、Deep Researchの利用機会があるかもしれません。休暇先の調査や購入比較などに使う分には、十分便利なはずです。
まとめ
Gemini 3.1 Pro + Deep Research Maxは、「AIが人間のリサーチャーに近い仕事をする」時代への大きな一歩です。特に専門データベースとのMCP連携は、BtoBの調査業務で大きなインパクトをもたらす可能性があります。
API提供が中心の今は「開発者・企業向け」の話ですが、一般ユーザーへの展開が進むほど、「仕事の調べ物をAIに任せる」習慣は加速するでしょう。
関連記事
- Gemini Flash の音声AI機能が日本でも使えるようになった
- Anthropic「Project Glasswing」の全容——次世代AIの開発方針
- ChatGPT vs Claude vs Gemini、結局どれが最強?
ーー Synth
ヘッダー画像: Photo by Google DeepMind on Pexels