Google の Google Webmaster Trends Analyst Gary Illyes(ゲイリー・イリーズ)氏に、弊社役員の鈴木謙一がインタビュー!AI関連・SNSシグナル・Z世代のAI検索などについて、貴重なお話をたくさん伺うことができました。
※この動画は、2025年8月に投稿されたものです。
▼動画で見たい方はこちら▼
■出演者情報
Gary Illyes(ゲイリー・イリーズ)氏
Google の Google Webmaster Trends Analyst ウェブマスターセントラルブログへの寄稿やGoogleウェブマスターフォーラムでユーザーのウェブサイトのデバッグを手伝っている。

海外SEO情報ブログ – SuzukiKenichi.COM: 海外SEO
▶︎https://www.suzukikenichi.com/blog/
Web担当者フォーラム執筆記事
▶︎https://webtan.impress.co.jp/user/1730/articles
X(旧Twitter)
▶https://x.com/suzukik
鈴木:皆さんこんにちは。今日は、タイのバンコクで開催されている「Search Central Deep Dive Asia Pacific 2025」に来ていて、Googleのゲイリーがいるので、おなじみのインタビューをしてみようと思います。
ゲイリーさん、本日はお越しいただきありがとうございます。
Gary Illyes:お招きいただきありがとうございます。
Google内のAIでも使用する学習用コンテンツは違う?
鈴木:まずはじめに、もしGoogle Extendedをブロックすれば、私のコンテンツはGeminiアプリやプロジェクトのAI APIの学習には使われません。ただし、これはAI OverviewやAIモードには影響しません。でも、AI OverviewやAIモードもカスタマイズされたGeminiをLLMとして使っています。
なぜそうなるのでしょうか?Googleは、Geminiアプリの学習用コンテンツと、AI OverviewやAIモードで使うコンテンツを分けているのでしょうか?たとえそれらすべてがGoogle Extended由来だったとしても。
Gary Illyes:はい、その通りです。ご指摘のとおり、AI OverviewやAIモードで使用されているのはカスタムGeminiモデルです。つまり、別の方法で学習された可能性があります。学習方法の詳細までは分かりませんが、間違いなくカスタムモデルです。
鈴木:ということは、GeminiとAI Overview・AIモードは、異なるインデックスを使って根拠づけ(グラウンディング)を行っているということですか?
Gary Illyes:私が知る限りでは、GeminiもAI OverviewもAIモジュールも、グラウンディングにはGoogle検索を使っています。つまり、複数のクエリをGoogle検索に投げて、そのクエリに対する検索結果を受け取る、という仕組みです。
鈴木:ということは、AI OverviewやAIモードで使われる学習データは、Google Extendedではなく通常のGooglebotによって収集されたものなのでしょうか?
Gary Illyes:ただし、グラウンディングの際にはAIは関与していないことを覚えておいてください。つまり、Google Extendedによって影響を受けるのは、生成の部分だけなんです。また、Google Extendedを許可しなければ、Geminiは基本的にあなたのサイトをグラウンディングには使わないということになります。
鈴木:Dan Petrovicの実験によると、AI ModeはWeb上のページコンテンツをライブで直接取得することはありませんがGeminiは取得してますね。これは正確な情報ですか?
Gary Illyes:私はGeminiの担当ではないので正確には分かりません。しかし、AI Modeに関して言えば、確実にインデックスにあるものを取得して動いています。私の知る限り、今のところリアルタイムでの取得は行っていません。
LLMがAIから学習する傾向をどう思う?リスクは?
鈴木:次の質問です。AIによって作られたコンテンツが増える中で、LLMがそのAIコンテンツから学習するようになっています。この傾向について、どう思いますか?また、どんなリスクがあると考えますか?
たとえば、Googleは検索インデックスの品質を保つために、より多くのページをクロールしなければならなくなるかもしれません。
Gary Illyes:私は検索インデックス自体にはそれほど懸念を持っていませんが、モデルの学習ではAIが生成したコンテンツをどう除外するかをしっかり考える必要があります。そうでないと「AIがAIで学習する」というループに陥ってしまって、それは学習にとって好ましくありません。今どれほど深刻な問題かは分かりませんが、それは学習に使う文書の選び方次第かもしれません。
鈴木:私が言いたかったのは、「人間が作ったかAIが作ったかは関係ない。質が高ければAIが生成したコンテンツでも学習に使えばいい」ということです。
つまり、AIがAIの作ったコンテンツで学習して、またAIが……と繰り返されるわけですね。
Gary Illyes:確かにそうですが、もしコンテンツの質と正確性を保てるのであれば、高品質であることを確認したうえで使うべきだと思います。
あまり重要ではありません。問題になるのは、すでに存在するコンテンツと極端に似たものが使われてしまう場合です。理想的には、そうしたコンテンツはインデックスに入っておらず学習対象にならないはずです。そしてもうひとつの問題は、不正確なデータで学習してしまうことです。
この点がよりリスクが高いと思います。というのも、バイアスが入り込んだり、事実と異なる情報がモデルに組み込まれたりするからです。ただ、コンテンツの品質が高ければ問題はありません。現在では通常、人間が生成されたコンテンツをレビューする必要がありますが、それさえ行われていれば学習に使っても大丈夫です。
鈴木:セッションでは「現時点では人間が作成したコンテンツを使っている」と言っていましたが、もしAIが高品質なコンテンツを作れるなら、将来的には変更される可能性があるということですね?
Gary Illyes:コンテンツをレビューする必要があるかどうかについて、当面ガイドラインを変更する予定はないと思います。
ですので、「人間が作った」と言うのは少し違うかもしれません。正しくは「人間がキュレーションした」と表現すべきだと思います。つまり、誰かが編集的な視点でチェックして、その内容が正確であると確認した、という意味です。
HTTP 402 Payment Required はどのような利益をもたらす?
鈴木:さて、次の質問ですが、Cloudflareが最近リリースしたPay per Crawlでは、 402 Payment Required ステータスコードを使っているようです。これはまだ開発中だと思いますが。
Gary Illyes:私は知らないです。
鈴木:この新しい技術はGoogleを含むパブリッシャーや企業の双方にとって利益になると思いますか?
Gary Illyes:まだその件については考えられていません。この発表の時は別のイベントに参加していて、内容を把握する時間がありませんでした。
鈴木:現在、多くの大手出パブリッシャーがGoogleのAIクローラーをブロックする決定をしています。これはGoogleのモデル学習に影響を与える可能性がありますか?
Gary Illyes:Google検索にとって?それとも一般的に言って?
鈴木:それとも一般的に言って、です。
Gary Illyes:うーん、Google検索やそれ以外も含めて、正直よく分かりません。なぜなら、モデルは基本的にDeepMindがトレーニングしていて、私はそのチームでは働いたことがないからです。ただ、Google検索の視点から言えば、大きな問題にはならないと思います。
パブリッシャーの立場としては、二つの考え方があると思います。一つは「すべてのAIクローラーをブロックしよう」という立場。もう一つは「この流れがどこに向かうのか見てみよう」という立場です。私は個人的には後者の考え方に近いです(Googleの立場としてではなく)。というのも、AIがコンテンツの提示において可能性を持っていると考えているからです。
この分野から収益を得られる可能性もあります。それがどのような形になるかはまだ分かりませんが、個人的にはその機会を逃したくありません。なぜなら、Z世代などの新しいユーザー層がこうしたAIインターフェースやAIシステムをとても好んでいるからです。
Z世代は、AIシステムによって提示されるコンテンツの形式を非常に好んでいます。もし彼らが次の主要なユーザー層になるのであれば、パブリッシャー側としても、こうした結果からどう価値を得ていくかを考えていく必要があるかもしれません。
でも、そもそも結果に表示されなければ、そこから収益や何らかのメリットを得ることもできないですよね。
今後AI学習の制御はどうなる?
鈴木:先ほども言いましたが、多くのパブリッシャーは、自分たちのコンテンツがAIの学習用に使われることを望んでいません。私は個人的には気にしていません。
現時点では、それを解決する完璧な方法はありません。今後数年で、もっと細かく制御できるような手段は出てくるのでしょうか?
Gary Illyes:はい、いくつかのアイデアはすでに出ています。私は「AI Preferences」というIETFのワーキンググループに関わっており、パブリッシャーが自分たちのコンテンツをどの用途に使わせるかを制御できるような標準仕様の策定について議論しています。
これが最終的にどうなるかはまだ分かりませんが、IETFと協力して取り組んでいるプロジェクトです。実際に導入されるかどうかも含めて、今後の動向を見守っていくことになります。
AIに関しては、技術分野の中でもまだ多くの誤解があります。たとえば「推論(inference)」に関しても、疑問や混乱が多いですね。
それから、人々が正しく理解していないものをブロックしてしまうことで、結果的にこの分野のイノベーションが妨げられる可能性もあります。それが良いか悪いかは別として、そういったことも起こり得ます。
ですから、考慮すべき点はたくさんありますし、これからこの問題がどう進んでいくかは、まだはっきりとは見えていません。
ただ、確実に取り組んでいるところではあります。
鈴木:個人的には、内部的な解決策が出てくるのを楽しみにしています。
Gary Illyes:これはGoogle単独の取り組みではなく、インターネット技術の標準化を進めるIETF(Internet Engineering Task Force)のプロジェクトです。
AIクローラのグラック、モデル学習に影響は?
鈴木:では最後の質問です。AIとは関係のない内容です。
その前に、セッションで「404ページはクロールバジェットを消費しない」と言っていましたよね。しかし、サイトに大量の404ページがあった場合はどうなるのでしょう?Googleは定期的にそれらのページを再確認しようとしてクロールしたりしないんでしょうか?
Gary Illyes:そうですよね、いつも疑問です。
鈴木:では、404ページはクロールバジェットには関係ないということで正しいのか、確認していただけますか?
Gary Illyes:404ページはクロールバジェットを消費しません。それは理にかなっていると思います。なぜなら、競合サイトに大量の壊れたリンクを向けることで、意図的に相手のクロールバジェットを使い切らせようとすることが技術的には可能だからです。でも、それで相手のクロールバジェットを消費させるのはおかしいですよね。
だから、そういった問題を防ぐ最善の方法は、404ページをクロールバジェットに含めないことだと思います。
「404ページはクロールバジェットを消費しない」大量にある場合は?
鈴木:なるほど、それは納得できます。でも、もし自分のサイトに何百万もの404ページがあって、それが通常のページのクロールを妨げている場合はどうでしょう?
Gary Illyes:確かにスケジューリングにはある程度影響しますが、通常はそれが大きな問題になることはありません。なぜなら、あるURLパターンが404であると判明すれば、そのパターンに対するクロールはどんどん減らしていくからです。
基本的には、それが大きな問題になるとは思いません。ただし、パブリッシャーにとって実際に問題になっているケースがあります。たとえば、404ページが重い処理を実行してしまっている場合です。私たちもその件で複数の報告を受けています。
例えば、複数のSQLクエリを実行し、データが返ってくるのを待つというような処理が行われていると、不要なページのためにサーバーリソースが消費されてしまいます。
そのようなケースでは、できるだけシンプルな404ページにしておくことをおすすめします。計算コストの高いページではなく、軽量なページで対応するほうが望ましいです。404は避けられないものですから。
また、たまにサイト上に大量の404ページがあることを発見して、意図せずにサーバーリソースを消費してしまうことがあります。
鈴木:いずれにせよ、クロールバジェットという観点では404を心配する必要はない、ということですね?
Gary Illyes:はい、それで大丈夫です。
鈴木:分かりました。では次に、市川さん。
サイト全体がAIで作られたコンテンツ、ペナルティは?
市川:はい。私からは3つ質問があります。
まず1つ目の質問です。あるコンテンツがあって、その文章はすべて正当で、内容に関連した多くの画像も含まれているとします。ただし、それらの文章も画像もすべてAIによって生成されたものだとした場合、そのコンテンツやサイト全体がペナルティを受ける可能性はありますか?
Gary Illyes:いいえ、そのようなことはありません。AI生成の画像がSEOに直接影響を与えることはありません。
市川:AI生成の画像がSEOに直接影響を与えることはないのですね?
Gary Illyes:直接的には関係ありません。ただし、画像をサイトに掲載することで、多少なりともリソースを消費することにはなります。
でもそれ以外に悪影響が出ることは基本的にないと思います。むしろ、画像検索や動画検索などからの流入が得られる可能性すらあります。なので、基本的には問題ありません。
ソーシャルメディアの閲覧数やシェア数は検索結果に影響する?
市川:では次の質問です。SEOとソーシャルメディアについてです。ソーシャルメディアでの閲覧数やシェア数などは、検索順位のシグナルとして使われるのでしょうか?
Gary Illyes:この件については、昔からの定型的な回答があります。私たちは過去の経験、特に2014年ごろのある出来事をきっかけに学びました。
答えは「いいえ」ですし、将来的にも「いいえ」である可能性が高いです。その理由は、Googleが自分たちで管理できるシグナルだけを使用する必要があるからです。
ソーシャルネットワークのシグナルのような外部の情報は、Googleがコントロールできないからです。
つまり、誰かがソーシャルメディア上で数字を不正に操作しても、それが正当なものかどうかGoogle側では判別できませんし、確認する手段もありません。
AI Modeの中に広告が表示される可能性は?
市川:最後の質問です。AI Mode はまだ日本では利用できませんが、多くの人が関心を持っています。
これは私の個人的な質問ですが、AI Mode内に広告が表示される可能性はありますか?
Gary Illyes:それは分かりません。広告には関わっていないので。
おそらく、広告が表示される可能性はあると思います。たとえば「Google Discover」も最初はどうなるか知らなかったんですが、昨日初めて広告が表示されているのを見ました。そんなふうに、私たちもすべてを把握しているわけではないので、可能性はあると考えています。
市川:その可能性は高いと思いますか?
Gary Illyes:正直どう答えたらいいか分かりません。広告には関わったことがないので、それがそもそも広告を載せるべき領域なのかどうかも分からないんです。
市川:この質問をした理由なんですが、たとえば今のところAI Modeはまだユーザーが情報検索のメインで使っているわけではないですよね?でも、もしAI Modeがもっと普及して、多くの人が検索にそれを使うようになったら、従来の検索で得ていた広告収益がGoogleとしては減ってしまうと思うんです。
その収益をどうやって補うのでしょうか?
Gary Illyes:そこは分かりません。
それは僕の仕事ではありません。そういうことを考える担当の人がいるので、正直に言って、僕の関わる問題ではないんです。
Googleがどうやって収益を得ているか、ということは僕の管轄外です。僕の仕事は、広告ではなく、技術的な質問に対して、できる限りきちんと答えることなんです。それが全てです。
ゲイリー氏、AIがあまり好きじゃない!?
市川:ところで、個人的にAI Modeがあまり好きじゃないって言ってましたよね?
Gary Illyes:いえ、AIそのものがあまり好きじゃないんです。
生成系AIはあまり好きじゃないです。でも、予測系AIはとても価値があると思っています。昨日(イベント内で)キムラさんが、AIを使ってサイト全体の品質を改善する事例を紹介していましたよね。ああいうのは本当にすごいと思います。
要約機能もいいですね。たとえば鈴木さんが紹介していたように、ポッドキャストを聞く代わりに、AIモデルに入れて要点だけをまとめてもらう。しかもちゃんと要点になっていることを願いながら。
そういう使い方ならAIは良いと思います。でも、実際にはAIが得意じゃない用途にも使われがちで、そこには懸念があります。簡単に悪用されてしまうからです。
それが一つの問題ですね。そしてもう一つは、AIがよく知らない話題になると、途端に変なハルシネーションを起こし始めることです。
昨日も話題になりましたが、AI生成画像に含まれる文字って、いつもスペルミスがあったり、変になっていたりしますよね。
あれはモデル自体に原因があるんです。AIはそれが「文字」だということをそもそも理解していないんですよ。
AIにとっては単なる「とがった形」でしかなくて、「左にある‘I’の次は右にある‘I’が続く」くらいのルールで配置してるんです。でもそれが「文字」だとは分かっていません。実のところ、何も理解していないんです。
市川:ということは私の「生成AIを使う話」のセッション、気に入らなかったってことですか?
Gary Illyes:……うん(笑)
それは冗談として、あのセッション、すごくよかったと思ってますよ。結論を出しすぎなかったというか、「やっぱり人間の関与が大事だ」と伝わる内容だったので。人間が大切だという点に共感しました。
鈴木:最後に!ぜひ、今年中に「Search Central Live」を日本で開催してくださいね。
Gary Illyes:10月?挑戦してみます。どうなるか分かりませんが、ぜひ実現したいです。
#SEO #AI #MEO #LLMO