2022年にMidjourneyが公開されて以来、多くの人々が画像生成AIの力を目の当たりにしてきました。2023年9月現在、さまざまな画像生成サービスが存在している中で、どのサービスがどういった特徴を持っているのかを本記事ではご紹介します。最新の技術に触れてみたいけど何から始めればいいのかわからない…そんな方に向けて基礎から解説いたします。
画像生成AIとは
画像生成AIとはその名前の通り、人間が手を動かさなくても文章による指示から画像を創り出してくれるAIのことを指します。膨大な量のデータを学習し、指示された文章にもっとも近くなるように画像を出力するのです。2022年に発表されたサンフランシスコに拠点を置くMidjouneyや、イギリス発のStability AIのStable Diffusionが特に有名です。
画像生成AIの活用法
大きな可能性をもつ画像生成AI。これからますますの進化が予想される中で、活用できる場面はどのようなものでしょうか。ここでは初めて画像生成AIを使用する方でも取り入れやすい活用法をご紹介します。
アイデア出しへの活用
画像生成AIの強みの1つは、イメージに沿った画像を非常に短時間で出力してくれる点でしょう。頭の中にあるイメージをある程度の精度で画像として生成・記録しておくことによって、アイデアを効率的に発散させていくことが可能になるのです。ブレインストーミングを普段からしているクリエイターにとっては、画像生成AIの有効な使い方の1つでしょう。例えば、スマートフォンの広告をテーマにアイデア出しをしてみると以下のような結果となります。
素材探しへの活用
デザイン業務に携わっていると、素材を探している時間をもったいなく感じることもあると思います。画像生成AIはそういった課題を解決してくれる1つの解決策かもしれません。画像生成AIに適切な方法で欲しい画像のイメージを入力すれば必要な画像が得られるため、かなりの時短になります。最終的に商用利用などにつながる場合はきちんと使用したAIなどのクレジットを表示する必要がありますが、画像生成AIを使用すれば欲しい素材を即座に手に入れられるのです。
AIへの命令分(プロンプト)の書き方も本記事では扱っておりますので、気になる方はぜひ最後までお読みください。
広告などのクリエイティブへの活用
より具体的な実社会での活用例になりますが、画像生成AIで作成された画像は広告などにも活用できます。いわゆる商用利用にあたる使用方法ですので、使用したAIサービスの商用利用に対するスタンスをしっかり理解した上で使う必要があることは覚えておきましょう。以下は、話題になった画像生成AIの広告への活用事例です。
URBANHACKSという企業の電車広告でMidjourneyが使用されていたのが話題になりました。画像の左上をよく見てみると「Generated by Midjourney」というクレジットがあるのがわかります。
おすすめの画像生成サービス6選
それでは具体的にどのようなサービスが存在しているのか見ていきましょう。ここではスマホなどの携帯端末ではなくPCからアクセスすることを想定した画像生成AIサービスを6つご紹介します。
Midjourney
Midjourneyはサンフランシスコに拠点を置く画像生成AIを提供している企業、およびそのサービス名です。2022年のMidjourneyの発表を皮切りに、画像生成AIのブームが世界中で巻き起こりました。
特徴
Midjourneyの特徴は、ユーザーフレンドリーな操作性と生成される画像のクオリティの高さでしょう。Midjourneyで画像を出力するには、ユーザーとして登録した後Discordでプロンプト(どんな画像にするかの指示)を打ち込むだけという簡便さです。加えて、生成される画像のクオリティも非常に高く、Stable Diffusionと並んで多くの人に指示されているサービスです。
一方他の画像生成サービスと違い、無料では使用できません。月額10、30、60、120ドルのプランが存在しており、高額のプランになる程高速で生成できたり一月あたり生成できる画像の枚数が増えたりします。そのほかにも60ドルのプランからプロンプトを非公開にできたりとさまざまな特典があります。
商用利用について
Midjourneyで生成された画像は、どのプランであっても商用利用可能です。また注意事項として、フェイクニュースの作成を目的として使用するなど、人に危害を与えるようには使用できません。有名な事例として、「トランプ前大統領が逮捕された」といった画像をMidjourneyで生成した人物は利用禁止処分を受けるなどしています。
Stable Diffusion
Midjourneyと並ぶ画像生成AIの金字塔、Stable Diffusionをご紹介します。
特徴
Stable Diffusionの最大の特徴はオープンソースである、という点でしょう。Midjourneyはそのコードを公開していないのに対し、Stable Diffusionの開発元であるStability AIはStable Diffusionのコードを公開しています。これによって、Stable Diffusionを使用する際の選択肢は非常に多岐にわたります。ある程度のPCスペックと知識さえあれば、ローカル環境でもStable Diffusionを使用することも可能なのです。また、オープンソースということもあり、多くの画像生成サービスの内部で利用されているAIでもあります。
利用料金に関しては、使用するサービスによって様々です。公式サイトから誘導されているDreamStudioは、約13枚まで無料で画像を生成でき、それを使い切ったあとは最低10ドルから画像生成のクレジットを1,000クレジット(約500枚分)購入できます。
また、もっと手軽に使用したい場合はmage.spaceもおすすめです。無料で使用できる機能が多く、なおかつStable Diffusionの新しいバージョンを動かせるので、初めに触る画像生成AIとして非常に優れたサービスです。本記事で例として使用しているAIで生成された画像は、すべてmage.spaceで生成されたものです。
商用利用について
基本的には可能です。例外として、誤った情報を流す目的での画像生成などの、人に危害や損失を与える目的では商用利用できません。また、Stable Diffusionを動かせるサービスは多く存在しているため、使用しているサービスによってはクレジットを表示する必要があったり、そもそも商用利用ができない可能性もあります。DreamStudioやmage.spaceなどの外部サービスを使用する際はしっかりと利用規約などを読みましょう。
Adobe Firefly
次にご紹介するのはAdobeが提供するAdobe Fireflyです。
特徴
Adobe Fireflyの最大の特徴は、商用利用を前提とした画像生成AIである、という点でしょう。なぜそんなことが可能なのかというと、Fireflyに学習データとして使用されているデータは全て著作権的にフリーのものだからです。そのため、有名なキャラクターや特定の有名人のような画像を出力することはできません。そのため、著作権などの権利問題がある中で最も安全に使用できる画像生成AIと言えるでしょう。また、提供元がAdobeということもあり、普段から業務などでAdobe製のツールを使用している方にとってはもっとも馴染みやすい画像生成AIかもしれません。
また、利用料金としてクレジット制を採用しており、無料版では毎月25クレジット(テキストからの画像生成25回分)が提供されます。Fireflyに加えてAdobe Fontsも使用できる680円/月のプランでは毎月100クレジットが提供され、コンプリートプランなどのより上位のプランであればさらに多くの画像を生成できます。加えて、クレジットを超過していても画像生成機能を使用できるのも大きな特徴です。ただしクレジットを超過した場合での生成は、速度が遅くなることだけ覚えておきましょう。2023年9月14日現在、Adobe Fireflyは製品版としてリリースされたばかりです。どんどん新しい情報や機能が出てくることが予想されますので、楽しみに待ちましょう。
商用利用について
先に述べたように、Adobe Fireflyで作成された画像は問題なく商用利用可能です。
DALL・E2
DALL・E2はChatGPTでお馴染み、OpenAIが開発した画像生成AIです。
特徴
DALL・E2の特徴は、MidjourneyやStable Diffusionと並ぶほどの生成画像のクオリティです。加えて、OpenAI製というだけあって、UIも非常にシンプルで直感的に使用できます。MidjourneyのDiscordやDreamStudioやmage.spaceをはじめとするStable Diffusionの外部サービスなどと比較しても、単体で十分使いやすいサービスと言えるでしょう。そのほかにも、生成した画像から不要な部分を取り除いたり、画像はそのままで何かしらのオブジェクトを追加するなど、編集機能も備わっています。
商用利用について
DALL・E2で生成された画像の商用利用は可能です。一方で、他の画像生成AIサービス同様生成した画像を人間が作ったものと偽ったり、AIによって生成されたものであることを隠したりすることは禁止されていますのでご注意ください。
Bing Image Creator
Bing Image CreatorはMicrosoftが提供する画像生成AIサービスです。
特徴
Bing Image Creatorの特徴としては、DALL・E2のように外部のサービスを必要としないという点が挙げられます。また、Bing Image Creatorを使用する際にはMicrosoftアカウントが必要です。普段からBingを使用している方であれば、テキストAIのBing Bardと同様に手軽にはじめられるAIサービスと言えるでしょう。他にも、様々なサンプルのプロンプトが用意されており、画像生成AIを初めて使う人にも優しい仕組みになっています。Microsoftアカウントさえあれば無料で使用可能なのも嬉しいポイントです。
商用利用について
Bing Image Creatorで作成された画像は商用利用が許可されていません。ですので、アイデア出しなどの非商業目的でのみ使用しましょう。
Canva AI
デザインツール、Canvaの提供する画像生成AIです。
特徴
これまでご紹介してきたサービスは、画像生成に特にフォーカスしたサービスでしたが、Canvaの画像生成AIはデザインツールの一機能として搭載されたサービスです。デザイン中に必要な画像を探しに検索をかけるよりも素早くイメージに合った画像を生成してくれます。素材の作成からそれを用いたデザインの作成までCanva内で完結できるため、作業の効率化が期待できます。
商用利用について
Canvaが提示している条件や利用規約に違反しない限り、商用利用は可能です。実際にAIで生成した画像を使用する際は、他のサービス同様にAIによって作成された画像であることを忘れず示しましょう。
スマホから手軽に使える画像生成サービス3選
ここまでは主にPCからアクセスすることを想定した画像生成サービスをご紹介してきました。しかし、もっと手軽に画像生成AIを試したい場合はスマホアプリから使ってみるのも効果的でしょう。ここでは、スマホで動かせる画像生成サービスを4つご紹介いたします。
AIピカソ
特徴
AIピカソはスマホから使える画像生成AIの代表的なアプリの1つです。内部ではオープンソースの画像生成AIであるStable Diffusionが動いており、生成する画像のテイストなど、画像生成サービスとして十分な機能を備えています。公式にいらすとやとコラボしており、いらすとや風の画像が作成できるのも本サービスの特徴です。使用料金については、無料プランでも広告を見ることによって枚数に制限なく画像を生成でき、有料版であれば広告なしで使用することが可能になります。有料プランは600円/週か4,900円/年の2種類があり、顔写真からAIアバターを作成する機能も開放されます。
商用利用について
AIピカソで生成された画像は、Stable Diffusionの規約に基づいて使用することが求められています。つまり、人に危害を与えるような使用方法でない限り、商用利用は可能ということです。実際に生成した画像を商用利用する際はStable Diffusionの規約をしっかりと理解してから使用しましょう。
Picsart
特徴
PicsartはPCはもちろんスマートフォンなどのモバイル端末からも使用できるサービスです。画像加工や動画編集を主としたアプリで、画像生成AIの機能はCanvaのようにツール内の一機能として存在しています。無料プランでもAIを含め多くの機能を使用することができ、1日に使用できるAIの上限に到達しても翌日になれば再び使用できるようになります。また、有料版の機能の1つとして、10〜20枚ほどの顔写真をもとにアバターを作成する機能も備わっています。利用料金は使用する環境によって以下のように変わります。
月額 | 年額 | |
iPhone版 | 850円 | 3,800円 |
Android版 | 580円 | 3,800円 |
Windows版 | 850円 | 5,100円 |
ブラウザ版 | 850円 | 5,100円 |
商用利用について
PicsartのAIによって生成された画像は、基本的に商用利用が認められています。しかし、生成した画像が第三者の権利を侵害しているとみなされた場合、Picsartによる保証はありません。
お絵描きばりぐっどくん
特徴
お絵描きばりぐっどくんは、ばりぐっど大学というコミュニティが提供している画像生成AIです。他サービスと比較した際の大きな特徴は、LINE経由で画像を生成してくれるという点でしょう。Midjouneyのように外部のテキストコミュニケーションツールを使用したサービスは、普段からLINEやDiscordを使用している人にとって使い方が理解しやすいというメリットがあります。
基本的には無料でも使用できますが、1日10枚までという制限があります。有料プランは550円/月か、5,000円/年の2種類が存在しており、画像を送信するとその画像を再現してくれるようなプロンプトも生成してくれます。
商用利用について
商用利用は可能です。一方で内部で動いているのはStable Diffusionのため、他のStable Diffusionを利用したサービス同様、Stable Diffusionの利用規約に基づいて商用利用する必要があります。
プロンプトの書き方のススメ
様々な画像生成サービスをご紹介したところで、どのような命令文を使えばイメージに近い画像を作成できるのでしょうか?現在手軽に使用できる画像生成サービスの多くはStable Diffusionによって動いていますので、Stable Diffusionで使うことを想定した簡単なプロンプトのコツをご紹介します。
英語でプロンプトを書く
原則としてプロンプトは英語で書いた方がイメージに近い画像になります。基本的にAIサービスの多くは英語圏で開発されているためです。画像生成AIのみならずChatGPTなどでも同様ですが、日本語での文章よりも英語での文章のほうが現在のAIにとっては理解しやすいのです。ですので、より想像に近い画像を生成してもらうためには英語でプロンプトを作成しましょう。
文章よりは要素を単語で指示する
普段ChatGPTのようなテキストAIを使っていると、つい文章でプロンプトを渡してしまいがちですが、画像生成AIにとっては効果的ではありません。基本的には「単語, 単語, 単語, …」というように要素を1つずつ提示してあげた方が画像生成AIには適しています。1単語だけで表現できない要素も、なるべく少ない単語で、あるいは幾つかの要素に分解してプロンプトに盛り込みましょう。
それでは、ここからは実際にStable Diffusionを動かしながら「満月の夜に黒い猫が街を歩いている様子」を例として描画しつつ、プロンプトを書く際のコツを見ていきましょう。
重要な要素は最初に書く
原則として画像生成AIにプロンプトを送る際、プロンプトのはじめにある要素が優先されて描画されることがわかっています。
以上の2つの画像を生成するのに使用したプロンプト内の要素は同じですが、順番を変えています。左の画像が「black cat, walking on a wall, night, urban city, full moon」というプロンプトであるのに対し、右の画像が「full moon, night, urban city, black cat, walking on a wall」です。プロンプトの初めの方から優先的に要素が反映されているのがわかります。一方、「walking on a wall」という指示は無視されてしまいました。
括弧を使って要素を強調する
特に無視してほしくない要素がある場合は、要素を表す単語を括弧でくくっておくと効果的です。
先ほどの画像と比較して、右の新たな画像は、「full moon, night, urban city, (black cat, walking on a wall)」というプロンプトで生成されたものです。括弧を入れるだけで、要素の重要度を操作することができるのです。しかし、「full moon」の要素が小さくなってしまっているので、どの部分を強調すべきかは実際にAIを動かしながら試してみるのがいいでしょう。
ネガティブプロンプトを活用する
さて、猫が増えてしまいました。確かにこれまでのプロンプトには猫は何匹いてほしいかの記述はありませんでした。プロンプトに「only one cat」などを加えるのも手ですが、ここではネガティブプロンプトを活用してみましょう。基本的にどの画像生成サービスにも存在している機能で、多くはSettingや設定画面から入力できます。
ネガティブプロンプトを簡単に言うと、何を画像に入れてほしくないのか、を表したプロンプトです。今回であれば複数の猫という要素を省きたいので、ネガティブプロンプトを記入する欄に「multiple(複数の) cats」というプロンプトを書き込みます。
どうでしょうか。1つ前のものと比較してプロンプトに対してかなり忠実な画像を生成してくれたと思います。猫が1匹なのは偶然じゃないか、という考えもありますが、ネガティブプロンプトを入力したまま何回か画像を生成してみましたが、複数の猫が描画されることはありませんでした。生成される画像を制御する方法の1つとして知っておくと非常に便利です。
数値を使って要素に重みづけをする
これまでの方法だけでイメージ通りの画像を生成できなかった場合、要素に数字で重みづけをしてみるのが効果的かもしれません。例えば「black cat: 1.5」とした場合、black catという要素が1.5倍ほどに重み付けされます。対して、「urban city: 0.5」とした場合、urban cityという要素は0.5倍の優先度で描画されるということです。
「full moon, night, (urban city: 0.5), (black cat: 1.5), walking on a wall」というようにプロンプトを変更してみました。以前の画像よりも黒猫の要素は強くなり、都会の街という要素は弱くなったと思います。要素間に詳細に重み付けをしたい場合は直接数字で指示してみましょう。
ChatGPTとの合わせ技
プロンプトを書く際に気をつけるべきポイントを見てきたところで、もっと楽にプロンプトを書く方法がないか気になっている方もいらっしゃるのではないでしょうか。AIに指示を出すための文章は、AIに考えてもらうというのも1つの手段です。ここではもっとも有名なテキストAI、ChatGPTを使ってより効率的にプロンプトを考える方法をご提案します。
プロンプトの下書きを作る
画像生成AIに使用する際、初めのハードルはその独特なプロンプトでしょう。イメージに近いものにするには、文章ではなく要素ごとのキーワードでプロンプトを作成する必要があるのはこれまでお伝えしてきた通りです。ここを乗り越えるために、ChatGPTに以下の指示をすれば要素を概ね含んだプロンプトとして返答してくれます。ぜひ活用してみてください。
画像生成AIに使用するためのプロンプトを作成します。以下のテーマを描画するために必要な要素をフォーマットに従って羅列してください。フォーマットは以下のものです。キーワードはすべて英語で羅列するようにしてください。
キーワード, キーワード, キーワード, キーワード…
要素の数は10~20個までとします。また、優先する要素がある場合は要素の初めに優先してキーワードを置くようにしてください。
・テーマ
—文章でテーマを指示する(ここを変更)—
・優先する要素
—特に優先する要素がある場合、要素を指示する(ここを変更)—
「赤いオープンカーが晴れた日に南国のビーチ沿いの道路を走っている様子。」というテーマを指示した際に出力されたプロンプトは以下のようなものでした。
「red, convertible, sunny day, tropical, beachside, road, driving, palm trees, blue sky, sunlight」
そして、それを元にStable Diffusionで生成した画像は以下のものです。
運転席に人がいなかったり改善の余地はありますが、ChatGPTを使用することによって1からプロンプトを考えるよりは効率的にプロンプトを生成できます。ここからより理想のイメージに近づけるためには、先ほどご紹介した括弧を使用する方法やネガティブプロンプトなどを活用するのがおすすめです。
他にも、実は本記事の初めの画像もChatGPTを用いたプロンプトで作成されたものでした。テーマはシンプルに「ロボットが絵を描いている様子。」で、それをもとにChatGPTが作成してくれたプロンプトは以下のようなものでした。
「robot, drawing, canvas, paintbrush, palette, art studio, focused expression, mechanical arm, easel, color swatches, paint tubes, sketchbook, pencil, creativity, light source, detailed fingers, wires, metal surface, artist apron, paint splatter」
その他にも、「信号機の上にカラスが1羽とまっている様子。」、「人型のロボットが草原を走っている様子。」、「イルカが夜の海で遊んでいる様子。」という3つのテーマでChatGPTに作成してもらったプロンプトを使用した画像がこちらです。
プロンプトの草案を出力するのに役立つと思いますので、ぜひ先ほどのChatGPT用テンプレートを使って遊んでみてください!
生成された画像の著作権について
画像生成AIと切っても切れない関係にあるのが著作権に関する課題です。結論から言うと、基本的には画像生成AIを使用して生成された画像に著作権は発生しません。より具体的に法律と照らし合わせて確認したい方は、法律に関して専門的なページや、文化庁などの公的機関が流布している資料などに目を通しておくとより安全にAIを使用できるでしょう。以下の2つのリンクはAIと著作権に関するおすすめの資料です。
文化庁:AIと著作権(PDF)
画像生成AI、あるいは生成系AI全般はまだまだ新しい技術であり、法律やルールが十分に定められているとは言えません。特にAIを営利目的で使用することを考えている場合は、リスクを最小限にするためにも日々AIに関する法規制などの動向に注目しておくことが求められます。
おわりに
本記事では画像生成AIに関する9つのサービスと、プロンプトの書き方の基礎的な方法をご紹介してきました。まだまだグラフィックに関する人間の仕事は無くならないとは思いますが、遊び感覚で試してみるのも非常に面白い技術ですので、ぜひ試してみてください。