画像生成AI

画像生成AIの最新動向(2023年3月)

皆さま、画像生成AIの「Stable Diffusion」が公開された日を覚えているでしょうか?
なんと2022年8月22日、まだ半年しかたっていません。

しかし、すでに大昔のように感じます。それというのも、画像生成AI業界の進歩はめざましく、どんどん進化しているからです。

そこで今回は、画像生成AIの歴史と最新トレンドについてご紹介したいと思います。

まず、歴史についてですが、DeNAの方が作成された「DiffusionによるText2Imageの系譜と生成画像が動き出すまで」という資料が参考になります。
こちら200ページ越えの大作スライドかつ、専門的な内容も含まれています。

過去のことはどうでもいいよ、という方には最新トレンドをご紹介いたします。

以下の3つの単語を知っているだけで、トレンドをほぼ抑えることができます。

①ControlNet(姿勢や構図を制御)
②Lora(簡単に追加学習)
③Chilloutmix(実写系モデル)

こちらを解説していきます。

①Control Net
画像の構図を決められないという、画像生成での欠点を解決。この技術でAI生成画像の質が大きく変化しました。棒人間のデータから好きなポーズの画像を生成できる、とても凄いことです。Pose Dataを作れるサービスや配布しているウェブサイトもあります。

②Lora
特定のキャラクターを生成したいor既存のモデルでは気に入った画像ができない→特化したモデルを作ろう! というものです。既存の学習方法には大きな欠点がありましたが、それをクリアしてくれています。中でもVRAM 8GBあれば学習できるようになったのが大きく、大抵のゲーミングパソコンなら動かせるようになりました。

③Chilloutmix
有名な実写系モデルです。いろいろあった結果の進化です。

参考:
「#ChilloutMix」でTwitter検索
商用利用可能なChilloutMixのジェネリックAIモデルの紹介と作り方を解説

NSFW画像の生成は基本的にオフライン推奨です。
モデルを配布しているCivitaiというサービスがあるので活用してみるといいかと思います。
すぐに役立てることができます。

タイトルとURLをコピーしました