画像生成AIの進化が止まらない中、筆者がとくに注目しているツールが『Ideogram』です。
画像生成AIツールのおかげで、コンテンツマーケティング現場における制作スピードとクオリティが大幅に向上しました。しかし、多くのマーケターは、まだその潜在能力を十分に活用しきれていないのが現状です。
本記事では、『Ideogram』がどのように使えるのか、他のツールとの違いとメリット・デメリット、実際の活用法を紹介します。
Ideogramとは?
Ideogramは、Google Brainや米国の大学でAIプロジェクトを率いてきたメンバーによって開発された、テキストを入力して画像を生成するAIツールです。
主な特徴は以下のとおり。
・スタイル(写実的、アニメ風など)や基調の色を自在に操れる
・生成した画像に複数のフォントによるテキストを出力できる
・文字を画像に挿入する精度が高い
・AIからフィードバックを受けることができる
・商用利用が可能 *
”フィードバック” とは、たとえばAIが「こういったプロンプトにすれば、もっと精度高く生成できますよ」と提案してくれる機能です。(後述します)
料金プランは3種類ありますが、無料プランでも1日あたり10枚のスロークレジット(最大40枚の画像生成に相当)が提供されるので、とりあえず触ってみたい方は無料版で十分です。アカウント作成だけで、すぐに使えます。
【商用利用についての補足 *】
2024年10月時点のIdeogramの規約に、「ユーザー入力やユーザー出力に対して所有権を主張せず、ユーザー出力を自身の目的(商業目的を含む)で使用することを制限しません。あなたとIdeogramとの間ではユーザー出力に対して何らかの権利を取得した場合、その権利、権原、利益はすべてあなたに譲渡されます」と記載されています。
Ideogramの使い方
テキストプロンプトだけで、ありとあらゆる画像が作れてしまいます。アートの才能がなくても大丈夫です。
こちらがTOPページ。
Exploreタブには、世界中で作られた画像がランダムに並んでいます。
※ちなみに、画像をクリックすると、基となったプロンプトが見れるので、プロンプトの勉強にもなります
論より証拠ということで、いくつか作ってみました。
【プロンプト】
若い女性が木製のテーブルに座っている水彩画。黒くてボリュームのある髪を持ち、淡いブルーの流れるようなブラウスを着ています。手を頭に乗せ、物思いにふけっているように見えます。背景は柔らかな青と白の色調で描かれ、曇った空や水滴が垂れる様子がかすかに表現されています。テーブルの上には、いくつかの本が積まれています。全体の雰囲気は静かで内省的。
イメージに近いものができました。十分なクオリティです。
生成された画像の横に、Ideogram側が提案してくれた別のプロンプトが表示されたので、それで再生成してみたら、少し変わりました。(これがAIによる”フィードバック”です)
これを使って再生成したのがこちら。
元の画像を活かしてチューニングしてくれるので、より狙った画像が作れますね。
遊び心を出してみたのがこちら。
【プロンプト】
現代のキャンプ用品を使ってキャンプを楽しむアリストテレス
まるでアリストテレスがタイムスリップしたかのよう。
道具の描写にややツッコミどころを残すものの、悪くありません。
【プロンプト】
55歳の白いひげを生やした日本人のおじさんの写真。青いジャケットにベージュのシャツを着ています。彼の後ろには、茅葺き屋根の伝統的な日本の建物があり、背景には緑が広がっています。
年齢がややズレている気もしますが、十分に合格です。
他の画像生成AIツールと比較してどうか?
画像生成AIでお馴染みの、Stable Diffusion、DALL·E3(ChatGPT) 、ImageFX(Google)と比較してみましょう。
公平を期すために、同じプロンプトで生成してみました。
【プロンプト】
若い女性が木製のテーブルに座っている水彩画。黒くてボリュームのある髪を持ち、淡いブルーの流れるようなブラウスを着ています。手を頭に乗せ、物思いにふけっているように見えます。背景は柔らかな青と白の色調で描かれ、曇った空や水滴が垂れる様子がかすかに表現されています。テーブルの上には、いくつかの本が積まれています。全体の雰囲気は静かで内省的。
Stable Diffusionの場合
・なぜか女性が水中(水彩画を水中画と誤解した?)
・左手の位置があり得ない
・右手だとしたら指がおかしい
・髪が切れている
・意味不明の文字が加えられている
・ブラウスがブルーではない
・テーブルも本もない
絵のタッチは見事なのですが、プロンプトをほぼ無視してきました。日本語の理解力が低すぎます。
DALL·E3 の場合
DALL·E3 はIdeogram同様、プロンプトから外れておらず、上々です。
しかし、水彩画らしさはありません。
ImageFXの場合
Googleアカウントがあれば誰でも無料で利用できます。
意気揚々と日本語で入力すると、「特定の種類の画像を生成する方法についてはまだ学習中のため、ご希望のものを正確に作成できないかもしれません」と返ってきました。(2024年10月18日時点)
え?人物画は架空であっても作れないのか?と驚きました。ちなみに、「Gemini Advanced で人物の画像生成を利用できるようになります」だそうです。どうやら、まだ日本語に対応していないため、そのせいかもしれません。
プロンプトを英語に翻訳して生成してみると、一応生成はしてくれますが、個人的にはIdeigramの圧勝かなと。
【プロンプト】
現代のキャンプ用品を使ってキャンプを楽しむアリストテレス
Stable Diffusionの場合
まさかの無人!(嘘だろ…)
そんなはずはないと、「哲学者のアリストテレスです」「昔の人物です」と何度も訂正しましたがダメ。ハンマーとか、鍋とか、道具だけの画像しか生成しません。
Stable Diffusion、劣化してしまったのか…?と心配になるほどの低クオリティです。
DALL·E3 の場合
アリストテレスっぽさは十分。ギターや左手のスマホといった小物演出も頑張ってくれています。ただ、いくら「写実的に」と指示しても、イラスト感は残ってしまいます。
ImageFXの場合
背景だけは生成しましたが、人物は拒否。
しかも、椅子とリュックの縮尺がおかしいので、ミニチュアのように見えるのが残念です。
【プロンプト】
55歳の白いひげを生やした日本人のおじさんの写真。青いジャケットにベージュのシャツを着ています。彼の後ろには、茅葺き屋根の伝統的な日本の建物があり、背景には緑が広がっています。
Stable Diffusionの場合
・ヒゲがない
・ベージュのシャツを着ていない
・茅葺の建物がない
写真のようなリアリティはまずまずなのですが、いくつかの指示を反映していません。
何度試しても改善はしませんでした。
DALL·E3 の場合
プロンプトには忠実です。
しかし、独特なAIイラストっぽいタッチが拭いきれないのはあいかわらず。
ImageFXの場合
拒否されて、何も生成されませんでした。
有料版の Gemini Advanced で使えるようになるのを待つしかないようです。
なお、ImageFXは動物や物体は問題なく描いてくれます。
※寿司
ガリとわさびはちゃんと描写されていますが、巻物と握りを区別できないのは、海外生成AIツールあるあるです。箸の縮尺もややズレています。
日本人のイメージする寿司を海外生成AIツールが完璧に再現できたとき、画像生成にブレイクスルーが起きる!と個人的には期待しています。
※タコス
ピザ、ハンバーガーなど、アメリカンな食べ物の描写は得意です。
※牛
クオリティ的には十分です。
ということで、
・Ideogram(無料版)
・Stable Diffusion(無料版)
・DALL·E3(有料版)
・ImageFX(無料版)
の4者の比較結果は、
Ideogram(無料版) >>>>> DALL·E3(有料版) > ImageFX(無料版) > Stable Diffusion(無料版)
と、Ideogramの圧勝でした。無料でここまでできるとは素晴らしい。
ちなみに、筆者が画像生成するときは、最近はほぼIdeogram一択ですね。
ただし、無料版だと1日あたりの生成枚数に制限がありますので、その点だけはご注意を。
筆者がオススメするIdeogram活用法
筆者は以下の用途で使うことが多いです。
・プレゼン資料の挿絵
・企画書に挿入するイメージ図
・原稿に挿入するイラストや画像
・バナー素材となる写真
画像素材サイトでいちいち探す必要はないし、無料だし、狙い通りの画像が一発で出るし、良いこと尽くめです。
たとえば、こんなプロンプトを投げると、
「Mieruca Japanese Great SEO Tool」というテキストが、渦巻く青の半透明の文字で書かれた3Dタイポグラフィーデザイン。文字はそれぞれ精巧に繋がり、柔らかな光を放っています。ゴールドの星が名前を囲み、魅力的な輝きを放ちます。風に舞うハートが魔法のような魅力を加えています。淡いグレーの背景が洗練された外観を際立たせています。
こんなものが作れます。
現状はIdeogramが個人的にイチオシですが、生成AIツールは日進月歩で進化しますし、性能もイタチごっこで変化するので、比較しつつ試し続けるのが良いと思います。
ミエルカSEOの『AI見出し生成機能』を試してみませんか?
ミエルカSEOに搭載されたAIが「検索上位に食い込む」見出しを自動生成します。
Faber Companyが15年以上のSEO・Webマーケティング支援で導き出した成功パターンを落とし込んだ「SEOプロモード」と、自社コンテンツを事前に学習させ、ターゲットに響く見出しを生成する「自社メディア特化モード」から選べます。