生成AIとは、人間が入力した内容をもとに、テキストや画像を生成することができるAIのことです。従来のAIと比べて、生成AIはより多くの種類のタスクを実行でき、またその入力の自由度も高くなっています。本記事では、主にテキストを生成するタイプの生成AIについて、基本的な仕組みから、その特徴、具体的な応用例、さらには検索に与える影響や今後の可能性について詳しく解説します。
目次
筑波大学ビジネスサイエンス系准教授。自然言語処理や計算社会科学に関する研究に従事。ウェブ・SNSの大規模なデータ収集や分析・機械学習を強みとし、WI-IAT ’21(Best in Practice Paper Award)、Webインテリジェンスとインタラクション研究会(優秀研究賞・萌芽研究賞)、人工知能学会(研究会優秀賞)などで数々の賞を受賞している。
生成AIとは
生成AIとは、「入力したものとは別のものを出力する」ことに長けた人工知能
生成AIとはその言葉の通り、人間が入力した内容に対する回答として、画像やテキストを「生成」することができるAIのことです。もっとわかりやすく言えば、「入力したものとは別のものを出力する」ことに長けた人工知能だと言えるでしょう。
こう聞くと、「そこまで凄いことなの?」と疑問に思われる方もいらっしゃるかもしれません。実際、従来のAIでも、一部の生成作業はすでにできるようになっており、生成自体はそこまで大きな特徴ではありません。
では、生成AIは具体的に、どういった点で、従来のAIよりも優れているのでしょうか。生成AIが進化した点は、大きく分けて2つあります。
生成AIの特徴① 生成できる範囲の広さ
1つ目の特徴は、生成できる範囲が非常に広いという点です。
これまでのAIは、生成能力そのものは持っていましたが、機械翻訳などの非常に限られた作業でしか、その技術を利用することができませんでした。これに対して生成AIは、生成できる範囲が大きく広がり、多様な文章を作成できるようになりました。「新サービスをリリースした際のプレスリリースを考える」や、「長い文章を要約する/わかりやすく言い換える」などといった、全く異なるフォーマットの文章でも、自由自在に生成できるようになったのです。
生成AIの特徴② 入力の自由度の高さ
生成AIのもう1つの特徴は、「入力の自由度が高い」という点です。
従来のAIが行なっていた生成は、あくまで機械的なものであったため、ルールに則って入力しないと、想定したものとは異なる答えが返ってくることが多くありました。また、望む答えを出力させるために専門知識が必要な場合も多く、知識や技術を持たない一般の方々が使うには、まだまだ不便なところもたくさんありました。
これに対して生成AIは、入力の自由度がかなり高くなり、アプリケーションによっては、メッセンジャー感覚で入力することができるようになりました。自然な会話文で入力ができるようになったのはもちろんのことですが、使う人の言語の癖や使い方にかかわらず、高品質な結果を出力できるようになったのです。「〇〇してください」のような敬語で質問しても、「〇〇して」というようにラフに質問しても、意図が同じであれば、大体同じ出力結果が表示されるようになりました。
生成AIの仕組みは2段階
生成AIの仕組みは、大まかに2つの段階に分かれます。今回は、テキストを生成するタイプの生成AIの仕組みについて解説します。
1.単語や文を予測する能力を身につける「事前学習」
まず最初に、事前学習と呼ばれる段階で、「次にどんな単語が続くかを予測する」という能力を身につけていきます。具体的には、学習元として入力された大量の文の一部をマスクし、そこに何が入るかを予測し、答え合わせをするものです。
例えば、「今日は良い天気だ」という文章があった時、「今日は良い◯◯◯」というふうに、文の一部をマスクします。そして、◯◯◯には「天気だ」という言葉が適切である、と予測し、再度に、その予測を元の文と照合して、正しいかどうかを確認するのです。
この予測を繰り返すことで、言語のルールや文脈を学び、次に来る単語を正しく推測する技術を磨くことができます。生成AIが自然な文章を生成することができるのは、こうした予測を何度も繰り返しているからだと言えるでしょう。
2.出力結果を調整する「ファインチューニング」
単語や文を予測する能力、すなわち一般的な言語能力を身につけたら、次にファインチューニングという段階に進みます。
ファインチューニングは、事前に身につけた言語能力を、特定の分野や文章形態に特化したタスクにも対応できるようにトレーニングするものです。
ファインチューニングにも、おおまかに分けて2つの段階があります。人間からの指示に答えられるようにするための調整(「指示チューニング」)と、回答の質を高めるための調整です。
人間からの指示に答えられるようにする調整「指示チューニング」
事前学習を行なっただけの生成AIは、「次にくる単語の予測能力」しか持っていません。つまり、自然な文章を生成することはできますが、「SEOについての記事を書いてください」という人間の指示に応えることはできないのです。そこで、指示と回答のセットを大量に学習させることで、人間からの指示に的確に答えられるような能力を身につけさせていきます。これを、「指示チューニング(Instruction Tuning)」と呼びます。
回答の質を上げるために、さらに細かく再調整
指示チューニングを行なった生成AIは、「SEOについての記事を書いてください」という指示に対して、「わかりました。以下にSEOについての記事を書きます。・・・」という回答を返すことができます。しかし、あくまで指示に答えられるだけで、SEOという特定の分野に特化した文章や、記事という特定の形態に従う必要のある文章は、まだうまく生成することはできません。つまり、SEOに関係のないトピックが混ざっていたり、記事の形になっていなかったりなど、回答の質が低いままなのです。
そこで、インターネット上にあるさまざまなサイトのSEO関連記事や、あるいはミエルカジャーナル上のSEO関連記事に絞って学習することで、どんなトピックが含まれやすいか、あるいは記事の形態とはどんなものかを覚えることができます。これにより、「SEOについての記事を書いてください」という指事を受けたときに、内容や形態の面で、より質の高い回答を返すことができるようになるのです。
いくら自然な文を生成することができても、人間の入力(要望)に適切な形で答えることができなければ、使い物になりません。生成AIはファインチューニングを行うことで、特定の文脈や目的に応じた適切な応答を生成する能力を身につけることができるのです。
なおミエルカSEOでは、それぞれの企業さまのサイトの特徴を生成AIに学習させ、見出しやコンテンツの原稿を生成させる機能を搭載しております。ご興味のある方はぜひ一度お問い合わせください。
生成AIが得意なこと
生成AIは、基本的に自由入力です。できることの幅が広いぶん、AIが持っている力を100%発揮させることは難しいとも言えるでしょう。
生成AIを使いこなすポイントは、「出力の形が決まっているかどうか」と、「正誤の判断がしやすいかどうか」の2点です。
生成AIが一番得意なのは、「プログラム生成」
そういった意味で、生成AIがもっとも得意なのは、実は「プログラム生成」です。
生成されるべきプログラムは、文法のルールが明確に定まっているので、出力の形が決まっています。またプログラムは、実行して動かなければ失敗なので、正誤の判断も簡単です。生成AIは自分が生成したものが動くかどうかを自分で判断できるため、プログラムの作成は、人間のコストが最もかからない作業と言えます。
ただし、そのプログラムが想定通りに動いているかどうかは人間が確認する必要があります。生成AIは、そのプログラムをどういった意図で作りたいのか、というところまでは理解していないからです。とはいえ、生成AIにプログラムを書かせる際には、プログラムに対する入力と出力の仕様を定めることが必要なので、確認自体もそこまで難しいものにはならないでしょう。
翻訳や質問、要約などは、必ず正誤の確認を
一般的に広く利用されている翻訳や単純な質問文、要約なども、出力の形がある程度決まっているため、生成AIの得意とする分野です。しかし、生成AI自身では、内容の正誤の判断や検証ができないため、注意が必要となります。
例えば、ある論文を要約させるとき、「事前に全部読んで内容を把握しているものの、要約する作業が大変だから、生成AIに要約させよう」というものであれば、問題はありません。人間側で、要約内容が正しいかどうかを判断できるためです。
しかし、「全部読むの面倒だから要約させて簡単に内容を知りたい」という場合には向いていません。人間がその論文の内容を知らず、生成された要約が正しいのかどうかが判断できないためです。
正誤の判断が難しいものについては、あくまでサポートという観点で生成AIを利用すると良いでしょう。
生成AIは、「全く新しいものを作り出している」わけではない!?
また、「生成」が「まったく新しいものを作り出すこと」とは言い切れない点についても、注意が必要です。
生成のメカニズムはまだ全容が解明されておらず、人間が前もって学習させたデータがどこまで生成結果に影響しているのかわかっていません。したがって、生成AIを利用する際は、「全く新しいわけではない可能性がある」ということを念頭に置く必要があります。
生成AIによって、今後どんなことが可能になるか? 〜検索の場合〜
キーワードが一致しなくても、検索意図に沿った結果が表示されるように
生成AIによってできるようになることは無限にあります。
例えば、検索という面で考えてみると、「キーワードが一致していなくても検索意図を反映した検索結果が出るようになる」という変化が起こるかもしれません。というのも、生成AIを実現する現在の言語モデルでは、すでに、意図を予想することができるようになってきているからです。
例えば、appleという単語があった時、周囲に他の果物や食べ物の情報があれば果物のりんごを指していると判断し、周囲にmacやiphoneなどの情報があればIT文脈のアップル社を指していると判断することができるのです。
この技術を利用すれば、検索エンジンにおいて、キーワードが完全にマッチしていなくても、検索意図に沿った検索結果を表示できるようになります。
例えば、東京都内の学校一覧が欲しいとき、今までは「東京都 学校 一覧」「〇〇中学校 渋谷 一覧」のような入力の仕方をしていましたが、今後は、「東京にはどんな学校がありますか?」のように、「一覧」という言葉が入っていなくても、検索結果として一覧が表示されるようになるでしょう。
会話文で検索する時代が来るかも?
また海外には、”where is my phone?(私のスマホはどこ?)”のように、会話文に近い文章を入れて検索するのが一般的な国もあります。実際のところ、すでにそういった会話文での検索に対し、キーワードが一致していなくても検索意図に沿った結果が表示されるようになってきています。生成AIの登場によって、より高精度で検索意図に沿った結果を表示することができるようになるでしょう。日本でも、会話文のような文章で検索する人が増えるかもしれません。
Google検索で「where is my phone?」と検索した時の結果。 検索時のキーワードに「find」という単語は入っていないが、上位に来る記事にはいずれも「find」が入っている。「where is my phone?(私の携帯はどこ?)」という検索の意図を理解し、「find(見つける)」を導き出しているとわかる。
なお、MEO(マップ検索エンジン最適化)などの分野では、こうした会話文での検索がより早く発達するだろうと言われています。実際、音声検索を利用する際に、「ラーメン屋、神谷町駅、徒歩10分」とキーワードを並べて言うよりも、「ここから徒歩10分で行けるラーメン屋さんはどこ?」のように、会話文のまま直接話しかけることが多いでしょう。こうした検索に対しても、「ユーザーの現在地から徒歩10分で行けるラーメン屋」を結果として出せるようになることが予想されます。
当然ですが、こうした変化によって、SEO対策のやり方も変わってきます。会話文の形でどのように検索されることが多いのか調べたり、あるいは会話文での検索に合わせてコンテンツのキーワードを検討しなおしたりなど、検索意図の理解を軸に据えたSEO対策を行う必要性がより高まっていくでしょう。
生成AIによって、企業や世の中にどんな変化や影響がある?
生成AIによる社会的な変化は、大きくわけて3つあります。
経済に多大な影響を及ぼすかも!?〜電力と半導体の競争が激化〜
1つ目は、電力と半導体の競争が激しくなることです。生成AIの利用や研究には、大量の電力と半導体が必要になります。電力や半導体の業界での動向が、日本や世界の経済に影響を与えるようになるでしょう。
生成AI関連プロダクトを作る場合は要注意!〜法体系の変化〜
2つ目は、法体系が変化していくことです。 現状、生成AIの発展に法整備が追いついておらず、さまざまなところでトラブルや議論が起こっています。特に画像生成AIに関しては、学習の時点で著名なイラストレーターの作品が利用されるなど、クリエイターの利益と相反する問題が深刻化しています。生成AIによってつくられたものや、その事前学習に使われるデータについて、どういった権利を持たせるのか、議論を早急に進める必要があると言えるでしょう。
また、今後も生成AIに関連する技術が発展していくことを考えると、現行の法律をどう適用するかだけでなく、まったく新しい権利の形を考える方向に進む可能性もあります。生成AIを利用した事業を始める場合は、こうした法整備の動向をこまめにチェックしていきましょう。
「回答してはいけないデータ」は誰が作るのか?〜倫理面での対策〜
3つ目は、倫理面での対策が急務になることです。現在の生成AIは、事前学習の際にWeb上のデータを利用しているので、どうしても出力結果に偏りが出ます。そのため、何も対策しなかった場合、出力結果に偏見や差別的な要素が含まれることがあります。
出力結果に偏見や差別的な要素が含まれないようにしたり、そもそもセンシティブな質問に対して回答しないようにしたりするには、「回答してはいけない」データを別途作る必要があるのですが、このデータは機械的に判断できるものではないため、人間がひとつずつ判断しながら作成していっているのです。見るに堪えない出力結果を見せられ続けた作業員たちが、精神的に問題を抱えてしまうようなケースも報告されており、状況によっては、こうした作業をめぐる議論が激化するかもしれません。
まとめ:ミエルカでは、生成AIでコンテンツ制作をサポートしています
ここまで、生成AIの仕組みや特徴について解説してきました。
生成AIは、うまく使いこなせば、工数削減やクリエイティビティ向上につながる便利な機能です。ミエルカSEOでも、生成AIを使ってコンテンツ制作をサポートする機能を、次々開発・リリースしております。生成AIで工数を削減したい方や、生成AIを使ったコンテンツ制作がどんなものなのか興味を持たれた方は、ぜひ一度ご相談ください。
著者PROFILE
株式会社Faber Companyに新卒入社した後、自社ソフトウェアの開発ディレクション業務に携わる。
現在は、ミエルカヒートマップのUI・UX向上や、ABテスト機能の開発、リリースした機能のプロモーション業務を中心に担う。
監修者PROFILE
吉田 光男
筑波大学ビジネスサイエンス系准教授。筑波大学第三学群卒業、筑波大学大学院システム情報工学研究科博士後期課程修了。博士(工学)。学部在学中にロボット型ニュース検索エンジンCeek.jp Newsを開発し、2006年に有限会社てっくてっくを創業。2011年より日本学術振興会特別研究員(DC1)、2014年より豊橋技術科学大学助教、2021年より現職。ウェブのコンテンツやユーザの行動に注目し、自然言語処理や計算社会科学に関する研究に従事。ウェブ・SNSの大規模なデータ収集や分析・機械学習を強みとし、WI-IAT ’21(Best in Practice Paper Award)、Webインテリジェンスとインタラクション研究会(優秀研究賞・萌芽研究賞)、人工知能学会(研究会優秀賞)などで数々の賞を受賞している。
#生成AI #SEO #ミエルカ