Googleマーティン・スプリット氏に聞く|構造化データ・AI学習ブロック・クロール上限の正解【Search Central Live Canada】

生成AI情報
  1. AI×SEO
  2. 生成AI情報
  3. Googleマーティン・スプリット氏に聞く|構造化データ・AI学習ブロック・クロール上限の正解【Search Central Live Canada】

2026年4月21日にカナダで開催された「Search Central Live Canada」に弊社の執行役員・鈴木謙一が参加してきました。

※Search Central Live Canadaとは、Google Search Centralチームが主催する検索関係者向けのカンファレンスで、Googleの検索担当者から直接、検索の仕組みや最新トピックを学べるイベントです。

そこでGoogle Search Relations TeamのMartin Splitt(マーティン・スプリット)氏に、構造化データの実装範囲、Google-Extendedをブロックした際のAI検索への影響、Googlebotのクロールサイズ上限など、SEO担当者が気になるテーマについて伺うことができました。本記事ではその内容を一問一答形式でお届けします。

動画で見たい方はこちら▼

動画の出演者

aleyda
Martin Splitt(マーティン・スプリット)氏
Google Search Relations Team
鈴木謙一
鈴木 謙一
株式会社Faber Company 執行役員(Search Advocate)
Google 公式の検索セントラル ヘルプ コミュニティのダイヤモンド プロダクト エキスパート(日本第1号)

鈴木:
本日はミエルカチャンネルにご出演いただきありがとうございます。早速ですが、構造化データやGoogle-Extended、クロール上限など、いくつか質問させていただきます。

Martin Splitt:
もちろんです、よろしくお願いします。

構造化データはGoogle対応のものだけで十分?

鈴木:
構造化データはGeminiがコンテンツを効果的に理解するのに役立つと言われています。Google検索が公式にサポートしている構造化データだけでなく、それ以外のタイプも追加した方が良いのでしょうか?

Martin Splitt:
まずはGoogle検索が公式にサポートしているものから始めるのがいいと思いますが、一般的にはデータが多いに越したことはありません。

ただ、Googleがサポート対象としていない種類の構造化データを追加することに、あまり多くの労力を割くべきではないと思います。Googleがサポートしているものより得られる価値や投資対効果がそれほど大きくならない可能性が高いからです。

※ 構造化データ:Webページの内容を検索エンジンに正しく伝えるためのフォーマット化されたデータ。Schema.orgのボキャブラリーを用いてJSON-LDなどで記述するのが一般的。Googleはレシピ・FAQ・商品・パンくずリストなど特定のタイプについて、リッチリザルトの表示対象としてサポートしている。

※関連記事:構造化データとは?SEOへの効果やマークアップ方法を解説

Google-Extendedをブロックすると、AIモードやAI Overviewsに影響する?

鈴木:
Google公式の説明では、「Google-Extendedをブロックしてもウェブ検索(AIモードやAI Overviewsを含む)には影響せず、Geminiの学習にだけ影響する」とされています。

ただ、AIモードやAI OverviewsはGeminiのカスタマイズ版を使っているため、Google-Extendedをブロックすると、間接的にAIモードやAI Overviewsにも影響するように思えてしまいます。実際のところはどうなのでしょうか?

Martin Splitt:
影響しません。なぜなら、AIモードやAI Overviewsは確かにGeminiの技術ベースで動いていますが、まったく同じ学習データを使っているわけではないからです。

検索、AI Overviews、AIモード向けには、私たちは多くの特別な処理を行っているので、Google-Extendedをブロックすることで検索系のAI機能に悪影響が出ないか、と心配する必要はありません

※ Google-Extended:GeminiアプリやVertex AIなどのGoogle製生成AIモデルの学習にコンテンツを使用するかどうかを、サイト運営者がrobots.txtで制御するためのユーザーエージェント。AI学習を拒否したい場合に「User-agent: Google-Extended / Disallow: /」と記述する。

※関連記事:
Google検索「AIモード」の機能・使い方、SEOへの影響
Google検索「AI Overviews」とは?機能や影響・SGEとの違い

hreflangはAI検索でも役立つ?

鈴木:
hreflangはAIモードやAI Overviewsなど、AI駆動の検索機能でも機能しますか?一般的にLLMは言語を問わず動作するので、AIモードやAI Overviewsは言語に関係なく最も関連性の高いコンテンツを引用しているように見えます。

Martin Splitt:
おっしゃる通りです。AIモードやAI Overviewsは、基本的に言語を問わず関連性の高いコンテンツを引用してきます。

とはいえ、hreflangを正しく実装しておくことには意味があります。hreflangは「同じコンテンツに異なる言語バージョンが存在する」ということを、検索システム側に正しく理解させるために役立ちます。

そして将来的には、その情報がLLMにも活用され、ユーザーが好む言語で情報源(ソース)を提示できるようになる可能性があります。なので、hreflangを実装する価値は引き続きあると言えます。

※ hreflang:同じコンテンツの多言語版・地域版が存在する場合に、それぞれのページがどの言語・地域向けかを検索エンジンに伝えるためのHTMLタグ/HTTPヘッダー/サイトマップの記述。グローバルサイトを運用する際の必須テクニカルSEO項目の1つ。

※関連記事:LLMとは? 概要・定義・歴史・ユーザー行動の変化

Googlebot-Image / Googlebot-Videoの取得サイズ上限は?

鈴木:
Googleクローラーのデフォルトのクロール上限は15MBで、Googlebotには独自の上限が設定されているクローラーもありますよね。たとえばHTMLは2MB、PDFは64MBです。

では、Googlebot画像(Googlebot-Image)やGooglebot動画(Googlebot-Video)はどうでしょうか?取得できる画像・動画のサイズはどれくらいまでなのでしょうか?

Martin Splitt:
良い質問ですね。具体的な数値はパッと頭に浮かばないのですが、基本的に「通常のユースケースをすべてカバーできるだけの十分な大きさ」になっています。

鈴木:
通常のサイズの画像や動画であれば問題なくクロールしてくれる、ということですね。

Martin Splitt:
そうです、その通りです。

※ クロール上限(Crawl Limit):Googlebotが1つのファイルに対して取得(ダウンロード)できる最大バイト数。HTMLは2MB、PDFは64MB、その他のリソースのデフォルトは15MBとされている。これを超えた部分はクロール対象外となるため、ファイルサイズの最適化が重要となる

※関連記事:Googlebotとは?仕組み・クロール頻度・対策方法をわかりやすく解説

鈴木:
なるほど、構造化データ、Google-Extended、hreflang、クロール上限と、SEO担当者が現場で気になるポイントについてクリアに整理することができました。本日はお時間をいただきありがとうございました。

Martin Splitt:
こちらこそ、ありがとうございました。

まとめ:今回のインタビューで押さえておきたい4つのポイント

  1. 構造化データはGoogle検索がサポートしているタイプを優先して実装する。サポート外のタイプはROIが低く、過度に労力を割く必要はない
  2. Google-Extendedをブロックしても、AIモードやAI Overviewsには影響しない。AI検索系の機能は同じ学習データを使っていない
  3.  hreflangは言語非依存のLLMに対しても、ユーザーの言語に合った情報源提示の手がかりとして将来的に役立つ可能性がある
  4.  Googlebot画像・動画のクロール上限は明示されていないが、通常のサイズの画像・動画であればクロールに問題はない

\ Search Central Live Canada カンファレンスレポートはこちら(無料)/
Search Central Live Canada  カンファレンスレポートをダウンロード

※Faber Companyの関連サービス:
・「ミエルカGEO」:GEO(AI検索・LLMO・AIO)対策・診断ツール
・「GEO対策コンサルティング」:GEO(AI検索・LLMO・AIO)対策のコンサルティングサービス