人工知能「Stable Diffusion」にも無茶ぶりしてみた！【Midjourneyの生成画像との比較】

Midjourneyに続き、Stable Diffusionにも無茶振りしてみたよ！(･ω･)ﾉ

youtu.be

本記事のYouTube版はこちら

Stable Diffusionにも無茶振り
Stable DiffusionとMidjourneyの両方を使ってみた感想
- ハムスターをモチーフとした可愛いキャラクター

Stable Diffusionにも無茶振り

以前、「Midjourney」という、画像を自動で作ってくれる人工知能に
「実現可能な永久機関を描いてくれ！」だの、「まだ発売されていないPlayStation 6を描いてくれ！」だの、いろいろな無茶振りをしてみました。

ijigen.net

今回は、「Stable Diffusion」という別の人工知能に、無茶振りをしてみたいと思います。
「Stable Diffusion」は、こちらも話題沸騰中の人工知能です。

「Stable Diffusion」にも「Midjourney」と同じように、文字から絵を生成してくれる機能がありますので、これを使って無茶振りに答えてもらいたいと思います。

人工知能に与えるテーマは「Midjourney」の時と同じテーマを与えます。

「Midjourney」で生成した画像と、どれくらい差が出てくるのか、楽しみですね。

Google Colaboratoryで学ぶ！あたらしい人工知能技術の教科書機械学習・深層学習・強化学習で学ぶAIの基礎技術

作者:我妻幸長
翔泳社

Amazon

まずは「Midjourney」の時と同じように「iPhone14のデザイン」というテーマで、画像を作ってもらおうと思います。
「iPhone14」は、この動画が作成、公開された時点では、まだ公表も発売もされていません。

Appleの関係者以外は、その姿形はわかりません。
やり方は、「Midjourney」の時と同じように、テーマを英語に翻訳してから「Stable Diffusion」に送ります。

テーマを送ると「Stable Diffusion」は、その言葉に沿って画像を自動で作ってくれます。
「Stable Diffusion」は１つずつ画像を生成出来るのですが、今回は「Midjourney」の時と同じように4つずつ画像を生成してもらうことにしました。
それでは見てみましょう。
「iPhone14のデザイン」というテーマで「Stable Diffusion」が生成した画像はこちら。

iPhone14のデザイン

長い！
長いですねぇ。

あと、レンズが増えていますね。
確かにiPhoneはどんどん大きく、そしてレンズもどんどん増えていますから、あり得なくはないですね。

縦長の画面で、Twitterがとても見やすそうです。

2枚目はこちら。

前面にどでかいレンズが2個も居ますね。

自撮りが綺麗に撮れそうですが、ジョブズがブチギレそうですね。

3枚目。

なぜか壊れてる？

4枚目。手が怖い。

指が宙に浮いています。

こっちは指が、くっついちゃっています。

iPhone自体は、どちらかというと前の世代っぽい形をしていますね。

ちなみに、以前「Midjourney」に生成してもらった「iPhone14」の画像はこちらです。

「Midjourney」の時は建築物になったり、木製になっていたりしていました。

「Stable Diffusion」は与えられたテーマに大して、あまり大きく外さない印象です。
なお、「Stable Diffusion」には、どれくらいテーマに忠実に画像を生成するか、という値を設定することが出来ます。

今回はデフォルトの値のまま使用しております。

マンガでわかる人工知能

作者:藤木俊明,山田みらい
インプレス

Amazon

宇宙の外側の景色

次のお題は「宇宙の外側の景色」です。

こちらも、まだ誰も見たことのないものです。

「Midjourney」の時は、ネチャネチャな"なにか"が大量に生成されました。

「Stable Diffusion」の場合はどうでしょうか？

1枚目、ぽん。

宇宙の外側というより、宇宙そのものですね。

あるいは、宇宙の外側は、また別な宇宙ということなのでしょうか？

2枚目。

これまた宇宙ですね。

3枚目。

これもまた宇宙ですね。
一貫性があるとも言えます。

4枚目。

惑星の地表のようなものが見えますね。

青いのは海でしょうか？

これもまた宇宙の外側という感じはしないですね。

別冊ゼロからわかる人工知能完全版 (ニュートン別冊)

ニュートンプレス

Amazon

「Midjourney」は、画風などを特に指定しない場合、画家が描いたような画像を生成することが多いように感じました。
「Stable Diffusion」は、特に画風を指定しない場合、写真テイストのものが多く出てくるように感じます。
写真を多く学習しているのでしょうか？

「実現可能な永久機関」

次は、「実現可能な永久機関」をテーマに、画像を作ってもらいました。

「Midjourney」が描く「永久機関」は、部屋に飾りたくなるほど美しかったですね。

「Stable Diffusion」はどうでしょうか？

1枚目、どん。

うーん、実現可能な感じはしないですねぇ。

2枚目。

白黒映画のような雰囲気の画像です。

3枚目、スケッチのようなテイストの画像が出てきました。

4枚目。
鉛筆画のような画像が出てきました。

魅力的な絵ではあります。

こうやって見てみると…「Midjourney」の絵は、特に細かい指示をしていなくても、構図やライティング、色使いが素晴らしかったですね。
キービジュアルやメインビジュアルを作らせるならば「Midjourney」かな。
という印象です。
実現可能な永久機関か、と言われると、両方とも実現可能な永久機関では無いと思います。

SUBTLE 物理学振り子永久機関おもちゃ振り子ボール衝撃玉永久運動ステンレス教育玩具ストレス減らすインテリア卓上型科学教育おもちゃ装飾品

SUBTLE

Amazon

Nintendo Switch2

次のお題は「Nintendo Switch2」です。

「Midjourney」の時はこんな感じの画像が生成されていました。
こちらもまだ、発表も発売もされていないデバイスですね。

「Stable Diffusion」は、果たしてどんな画像を生成するのでしょうか。

1枚目。どん。

ほぼ初代のNintendo Switchですね。

また指が浮いていて、心霊写真みたいになっています。
怖っ。

2枚目。

長い！
また極端に長いデバイスが出てきました。

3枚目。

どういう状況？

4枚目。

怖い怖い。

子供泣いちゃうから。
指が浮いちゃったりしていましたが、形の破綻は「Stable Diffusion」のほうがわずかに少ないように感じました。
破綻はするっちゃするんですけどね。

人工知能は「手」が弱い？

ちなみに、「手」だけ生成してみるとこんな感じです。

「手」は人工知能にとって難しいモチーフのようですね。
「Midjourney」も手がよくおかしくなっていました。
見慣れたモチーフなので違和感に気付きやすいですし、関節が多いというのもありそうです。

Nintendo Switch 本体 (ニンテンドースイッチ) Joy-Con(L) ネオンブルー/(R) ネオンレッド

任天堂

Amazon

人類が滅亡した理由

次のお題は「人類が滅亡した理由」です。

「Midjourney」は、これらの恐ろしい風景を描き出しました。

「Stable Diffusion」はどうでしょうか？

1枚目。

木の破片のようなものが散らばっています。

右のほうに、人のような形のものが見えますね。

2枚目。

古い書物に描かれたイラストのようなテイストです。

文字が書かれているのですが、読めませんねぇ…

3枚目。

球体のようなものが爆発、崩壊しているようにも見えます。

これひょっとして、地球ですか？

こちらにも文字が書かれていますが、意味がよくわかりません。

4枚目。

木のような"
なにか"
がたくさん描かれています。
そういえば、「Midjourney」が描いた「人類が滅亡した理由」にも、木のような"
なにか"
がたくさん描かれていましたねぇ…

…ゾゾゾ

人類滅亡直前なのにニート勇者が働かない 1巻 (デジタル版ガンガンコミックス)

作者:槻影,カネツキマサト
スクウェア・エニックス

Amazon

世界一美味しい料理

次のテーマは、「世界一美味しい料理」です。

「Midjourney」は小洒落たカフェで出てきそうな、美しい料理の画像を作ってくれました。

「Stable Diffusion」が作る「世界一美味しい料理」の画像はどうでしょうか？

1枚目。

「Midjourney」と真逆の方向で笑ってしまいました。

確かにこれは絶対美味い。
美味いけど、絶対太る。

2枚目。

パーティーのような場面で出てきそうな料理ですね。

全体的にこちらも脂っこそうです。

3枚目。

「Stable Diffusion」は脂っこいのが好きなのかな？

4枚目。

ついにピザが登場。

もう完全にデブ飯ですね。
個人的には「Midjourney」よりも、親近感を感じる料理たちでした。

全体的にパーティー感が多かったように思います。

パーティーでみんなで食べるご飯が、世界一美味い！
ってことかな？

「Midjourney」が描き出した料理は、どれもプロのカメラマンが撮ったような構図の画像が多かったですが

「Stable Diffusion」が作り出した画像は、アマチュアの人が撮ったような構図の画像が多かったですね。

学習させたデータの差なのでしょうか。

世界一美味しい手抜きごはん　最速！　やる気のいらない100レシピ

作者:はらぺこグリズリー
KADOKAWA

Amazon

人工知能から見た人間

次のお題は「人工知能から見た人間」です。

「Midjourney」が描く人間は、なんだか後ろ向きな人が多かったですね。

「Stable Diffusion」から見た人間はどうでしょう。

1枚目、ぽん。

なんだか謎の文字がたくさん浮いていて、怖いのですが…英語っぽいものもあるのですが、存在しない単語なんですよね。
ゾゾゾ。

2枚目。

こちらもたくさんの文字が描かれています。

真ん中には、人のような形の”光るなにか”が描かれています。

3枚目。

こちらも、背景に文字がいっぱい描かれていて、光る人のようななにかが描かれています。

そういう感じのイメージなんですかね？

4枚目。

地図のような、粘菌のような線で、人のような形が描かれています。
こちらも料理の時と同じように、4枚とも一貫性が感じられました。

全体的に、人の頭部や文字のようなものが描かれることが多かったですね。

どちらかというと、人工知能をイメージした画像のようにも見えます。

AIの遺電子全8巻新品セット

作者:山田胡瓜
秋田書店

Amazon

PlayStation 6

さて、次のテーマは「PlayStation 6」です。

こちらもまだ、発表も発売もされていない機種ですね。

「Stable Diffusion」が描いた「PlayStation 6」はこちらです。

1枚目、どん。

なんだかとっ散らかっていますね。

どちらかというと”PlayStation4に近いなにか”という感じがします。

2枚目。

プレステ2とプレステ4を無理やりくっつけたような感じになっていますね。

こちらも、とっ散らかっちゃっています。

3枚目。

ゲーム機本体自体が、大型のコントローラーのようになっていますね。

4枚目。

もうめちゃくちゃだよ！

「Midjourney」の時は、抽象的な感じでしたが、「Stable Diffusion」は具体的な形を捻り出そうとしている感じがしました。

「Midjourney」は抽象的な絵も得意でしたね。

ソニーゲーミングヘッドセット INZONE H9: WH-G900N:bluetooth/ノイキャン搭載/立体音響/低遅延/長時間使用しても疲れづらい/ブームマイク付き/Perfect for PlayStation5 白普通

ソニー(SONY)

Amazon

人間の魂の形

次のテーマは、「人間の魂の形」です。

「Midjourney」の描き出す「人間の魂の形」は、不吉な雰囲気が漂いつつも、魅力的でしたね。

「Stable Diffusion」はどうでしょう。

1枚目。

なにこれ、怖っ！

部屋には絶対飾りたくない絵です。

「Stable Diffusion」はこういう画像も生成出来るんですね。
カバー範囲が広いです。

2枚目。

よくわからない表情をした…虹色の…パーマのおばちゃんでしょうか？

「Midjourney」の描く人の顔は、形がよく崩れていたのですが、これはあまり崩れていないですね。

3枚目。

うーん。
解釈が難しい。

なんだか…難解な…絵です。

4枚目。

虫歯を抜いて、顔がめっちゃ腫れた時の私みたいな顔をしています。

まさにこんな感じでした。
ここにも謎の文字たちがありますね。

「SHAPE」や「THE」といった文字はわかるのですが、ほかの単語はよくわからないですし、文章としての意味も不明です。

amiibo テレサ (スーパーマリオシリーズ)

任天堂

Amazon

Stable DiffusionとMidjourneyの両方を使ってみた感想

色々な画像を生成して感じた印象としては…

Stable Diffusionは”道具”として”使う”イメージ

Midjourneyは”画家”に”頼む”イメージです。
「Stable Diffusion」は、比較的、形状の破綻が少なくて、イメージに近い画像を出しやすく、ツールとして使いやすい印象です。
一方で、魅力的な絵にするには、色々と試行錯誤する必要がある印象です。

「Midjourney」は魅力的な絵にするのは簡単なのですが、イメージ通りのものを描いてもらうには苦戦する印象です。

そして、「Stable Diffusion」の一番の強みは、オープンソースであることだと考えています。

これがオープンソースだというのは、正直信じられないですね。

オープンソースだと、多くの人が使えますし、さまざまな応用に使うことができます。
画像編集ソフトや、動画編集ソフトといった、他のソフトと組み合わせると、さらに強力なツールになるでしょう。

個人的には、早くクリスタと連携してほしいと思っています。

そして、オープンソースということもあり、「Stable Diffusion」は、使用コストが安いです。

これもまた「Stable Diffusion」の大きな強みです。
たくさんのパターンを試せたほうが、自分のイメージに近づけやすいですからね。

また、今回は触れなかったのですが、「img2img」という、画像を元に画像を生成する機能がありまして、こちらの機能も強力なようです。

一方、「Midjourney」は、なんといっても構図やライティング、色使い、ボケ感が素晴らしいですね。

本の表紙やCDジャケット、ポスターやコンセプトアートにも使えるレベルだと思います。

まるで、プロの画家に絵を描いてもらっているような感覚です。
とても想像力を刺激する絵を生成してくれるので、イメージを膨らませるためのツールとしても活躍できます。
これらが今回、「Midjourney」と「Stable Diffusion」を使用してみて感じた、個人的な印象です。

とはいえ、二つとも進化のスピードがものすごく速いAIですので、もしかしたら、この印象はすぐに覆されるかもしれませんね。
例えば現在開発中の新しいバージョンの「Midjourney」は、すでに形の破綻が減っているらしいですから。

ハムスターをモチーフとした可愛いキャラクター

それでは最後に、「Midjourney」の時と同じように「ハムスターをモチーフとした可愛いキャラクター」を生成してみたいと思います。

「Midjourney」の時は、こんな感じでしたが、今度こそは、最高に可愛いキャラクターを頼むぞ！

本当に頼むぞ！

どん。
えーと、はい…。

最後まで見てくれて、本当にありがとう！

よければチャンネル登録やTwitterフォローなどお願いしまーす(･ω･)ﾉ!

じゃんがりあん物語 - Switch (【パッケージ版限定特典】「Mottoもふもふセット」(1オリジナルペーパークラフト「ジャンガリアンハムスターのおうち」2「じゃんがりあん物語」特製ステッカーセット3ゲーム内デジタルアイテム「ピンクのくま」(ケージアイテム)) 同梱)

サクセス

Amazon

TOPに戻る