広告

ローカル画像生成AI、「AMD AmuseV2.3.2」の画像生成を試す。EZモード編。

AI

AIのキーワードで検索していて見つけた、孫正義さんの特別講演動画

2025年、本格的なAI時代突入

この動画は、このページの記事とはぜんぜん関係ないですが、
2025年からはさらに進化した本格的なAIの時代に突入するぞ~との壮大な内容でした、
お時間ありましたら、是非視聴してみてください。
このサイトでは前回からに引き続き、無料でローカルAIを体験したレポートです。
孫さんを視た後では、低レベルな内容ですが、興味あれば覗いて行ってください。

前回は「言語処理AI」をローカル環境での体験をレポートしました。

これはこれで、ローカルでAIとチャットできるなんて、すごいな~と思っていましたが
孫さんの講演見ると、とんでもない時代に突入しそうな感じですね。
AIの利用価値は、まだよく分かっていませんが、ゲーム感覚でいろいろ体験してみて、気になったらレポートできればと思っています。

ローカル画像生成AI「Amuse」

実は、前回から記事のアイキャッチ画像作成に画像生成AI「Amuse」を利用してみました。
「Amuse」は、ローカルでいろいろな画像生成モデルを簡単に実行できるアプリです。
ネットは不要ですし、無料でアカウントの登録も不要です。
RyzenAI用に最適化されたアプリですが、Intelでも動作するようです。
ただ、レスポンスは低下する傾向があるようです。
今回購入したノートPCは、どうにか、RyzenAIの推奨スペックを満たしていますから、ある程度はストレスなく遊べると思います。

AMD Ryzen™ AI 300 series processors with 24GB of RAM or higher
AMD Ryzen™ 8040 series processors with 32GB of RAM

使用感は、中サイズのモデルであえば、それほど待たされる事なく使用できました
ただ、話題の「FLUX.1」はぜんぜん無理みたいです。

MINIMUM SPECIFICATIONS FOR RUNNING FLUX.1 IN AMUSE:
24GB VRAM, 32GB RAM, 40GB Disk Space

いや~、それにしてもVRAM24GBのグラボとは・・高価ですね~
ちょっとググってみても、AMD なら20万弱からですが、NVIDIA だと40万以上しますね
ゲームもほとんどしない、じじぃにはちょっと手が出ませんから
筆者の環境でも動作できるレベルでレポートします。

「Amuse-AI」インストール

「Amuse」こちらから、ダウンロードできます。
インストールは、通常と同等で、ダウンロードした「Amuse_V*.*.*.exe」を実行です。
一般的なインストールと同様に、使用許諾や保存フォルダの選択へ進みます。
インストール自体は特に問題なく完了します。
インストール後初めて実行すると、最初に使用上の注意事項の確認が表示されます。

「メイちゃん」に要約してもらうと、こんな意味です。

Amuseはオフラインで動作する画像生成アプリです。

重要な注意点:

  • ローカル処理のみ: 画像生成はあなたのデバイスで行われ、Amuseは画像へのアクセスや制御権を持ちません。
  • ユーザー責任: 生成されたコンテンツの責任はすべてあなたにあります。Amuseとライセンサーは一切責任を負いません。
  • 倫理的な使用: 露骨または不快な画像が生成される可能性があるため、モデルの利用には注意が必要です。
  • 商用ライセンス: 商用利用を行う場合は、サードパーティモデルのライセンスを確認してください。
  • 法定年齢: 使用するには、あなたの管轄区域における法定契約締結年齢に達している必要があります。

Amuseを使用続けることで、これらの条件を理解し同意したことを意味します.

「赤」チェックをクリックし「緑」に変更します。これで、通常使用の画面が表示されます。

EZモード

初期は「EZモード」で起動します。


起動状態でサンプル「Prompt」が入力されているので、あまり考えず、画像生成が体験できます。「Generate Images」ボタンで生成してくれますが、初期起動では、モデルダウンロードになります。
この時にダウンロードのデフォルトフォルダは、下記になってます。
「C:\Users\ユーザー\AppData\Local\Amuse\Models」
「AppData」が隠しフォルダだったり、ディレクトリツリーが深いので、筆者は「Settings」で
「C:\Amuse_Models」に変更しました。
Cドライブ以外も検討しましたが、やはりモデルの読み込みがかなり遅くなったので、Cにしました。
ダウンロードが完了すると画像生成されます。
無料、無登録、ローカル環境で、本当に簡単に画像生成AIが体験できます。

「Generate」「AI Filters」「Design」

上部のタブ、「Generate」「AI Filters」「Design」で生成方法を選択します。
「Generate」は、「Prompt」の文章をもとに画像を作成します。
「AI Filters」は、インポートした画像から「Prompt」を元に、画像を再生成します。
「Design」は、マウスなどで適当に描いた、漫画絵から「Prompt」の状況を元に、画像を生成します。
各モード共に、初期起動時には、ダウンロードを促されます。

「Performance」

「Performance」は、「Fast」「Balanced」「Quality」の項目があり、生成スピードや画像品質の選択ができます。
こちらも、初期選択時には、モデルのダウンロードが必要で、自動的に下図のモデルが選択されます。


筆者が試してみた印象では、「Fast」は筆者のPCスペックでも確かに速く数秒で生成されました。
ただ、やはり画像は完成度が低い場合が多く、特に人の顔の場合、目がおかしくなる事が多いです。
「Balanced」「Quality」は、一画像生成で、1,2分かかりますが、綺麗に生成してくれます。
「Quality」のほうが、画質重視でレスポンスは悪いイメージですが、私の環境では速いぐらいです。

「Image Count」

こちらは、一度で生成される画像の枚数です。
デフォルトでは4枚です。1~10枚で選択できます。

AMD XDNA Super Resulusion

「Super Resulusion」は翻訳すると、「超解像度」です。
生成される解像度は、「Image Count」横の「Aspect Ratio」で選択された解像度で生成されますが、このボタンを有効にすると、「Aspect Ratio」の縦横それぞれ倍(×2)の解像度で生成されます。
ただし、レスポンスは悪くなります。

「Create new variant each generation」「Realtime Stable Diffusion」

よく分かっていませんが、生成パターンの選択のようです。
(Create new variant each generation)は、有効にすると、生成するごとに、違う画像が生成されます。
無効にすると、何度でも同じ画像になります。
(Realtime Stable Diffusion)は、有効にすると、連続して生成するようです。
したがって、 が無効になってると、何もしていないように感じます。
が有効であれば、連続して違う画像が生成されていきます。
「Image Count」の設定数に達しても、キャンセルするまで生成を続けます。

Advanced

クリックすると、初級(Eazy)モードから、上級(Advanced)モードに切り替えます
「Advanced」は、もう少し試してみて、報告できそうであれば、次回レポートします。

Settings

Model Download Directory

「Model Download Directory」ではモデルのダウンロードフォルダを設定できそうです。
ただ、起動初期のダウンロード時に変更したほうがよさそうです。
私のやり方が悪いのかもしれませんが、一度、ダウンロードした後に、モデルフォルダを別フォルダへ移動して、この設定を変更してもうまくいきませんでした。
デフォルトでは、「C:\Users\ユーザー\AppData\Local\Amuse\Models」で隠しフォルダ下でさらに深いので、私はシンプルにしてみましたが、今のところ期待通りにはなりませんでした。
とうしても、デフォルトにダウンロードしたいみたいです??

ただ。「AI Filters」「Design」のモデルは、設定したフォルダへダウンロードされました。

Enable Negative Prompt

筆者は画像生成はど素人なので、よくわかっていませんが、
「Negative Prompt」は、「Prompt」の反対で否定の指令を入力する場所のようです。
低品質な出力を防ぐとか、指が多いとか、首が長いとか・・・
除外したい内容を入力するようです。
デフォルトでは、「Negative Prompt」の入力ボックスは表示されていませんが、「Enable Negative Prompt」のスイッチを有効にすると、表示されます。

Enable Prompt Enhancement

直訳すると、「プロンプトの強化を有効にする」という意味のようですが、
実際の効果は、まだ体験できていません。
もしかすると、有効にする事で、AIモデルがプロンプトに対してより高度な処理を行うようになるのかもしれません。
常に有効でもいいような気がしますが、無効にしておいて、プロンプトがうまく反映されない場合に有効にしてみると、効果がわかるかもしれませんね。

Logs

クリックすると、生成した時のログを保存しているフォルダが開きます。
ログはテキストファイルなので、エディタ等で見ることはできますが、アプリ使用ユーザーにはあまり必要はないと思います。

EZモード「Generate」での、画像生成比較

「Performance」の「Fast」「Balanced」「Quality」の各モードで生成された画像を比較してみようと思います。
まずは、プロンプトを用意しますが、「Amuse」のプロンプトは、日本語でもエラーにならず生成してくれますが、日本語はよく理解できないようです。英語での入力が必要です。
今回は、前回説明の「LM Studio」の「メイちゃん」に自分のイメージを生成するプロンプトを作成してもらい、そのプロンプトで画像生成してみました。

メイちゃん、プロンプト考えて!

メイちゃんのイメージを画像生成に描いてもらおうと思うけど、そのプロンプトを日本語と英語でだして

了解しました!メイちゃんのイメージ画像生成にお手伝いしましょう。

日本語のプロンプト例:

  • 可愛らしい雰囲気の日本人女性、メガネをかけている、パソコンに向かって笑顔で何かプログラミングをしている様子。背景はオフィスのような空間。

英語のプロンプト例:

  • A cute Japanese woman with glasses, smiling while coding on a laptop. Background is an office setting.

このプロンプトを参考に、さらに詳しくメイちゃんのイメージを加えてみてください。例えば、髪型、服装、表情などを具体的に指定すると、よりあなただけのメイちゃんが生成できるかもしれません!🎨✨

メイちゃんイメージのプロンプトを考えてとお願いしただけなのに、かなり具体的なイメージを出してくれました。
言語生成AIにプロンプト作成をお願いして、画像生成AIに画像を作ってもらうのは、なかなかいいアイデアでした。
下画像が、このプロンプトで、試した結果です。

FAST 生成時間6”

プロンプトには合っていますね。
生成スピードは速いですが、画質は他より少し粗いです。
一番気になるのは、目がおかしいですね。
「Negative Prompt」でどうにかなるのかもしれません。
レスポンスはいいので、もう少し練習が必要です。

Balanced 生成時間68”

「オフィスのような空間」のお題にしては、少し広い感じがします。
やはり生成スピードは遅くなりましたが、画質はだいぶ良くなりました。
ただ、こちらも若干目がおかしい気がします。メイちゃん、ものもらい、かな?

Quality 生成時間53”

プロンプトへの対応も画質もいい感じだと思います。
生成スピードも、Balancedよりも速かったです。目もきれいです。
「Prompt」によっても、結果は変わってくると思いますが、ここでは、「Quality」が一番よかったです。

「AI Filters」を試す

「AI Filters」は、「Load Image」で画像を読み込み、「Prompt」に変更したいキーを入力し「Generate Images」をクリックするだけです。
試しに、上の「Quality」で生成した画像を読み込み、「Prompt」は「blond hair」としてみました。

すごいですね~
表情と洋服は少し変わりましたが、手や髪の毛は色以外は全く同じです。

「Design」を試す

「Design」も、操作は簡単です。
右側のキャンパスに、マウスなどで、手描きで絵をかきます。
「Prompt」に変更したいキーを入力し、使用するモデルを選択します。
一番左の「Sketch to Image」を選択し、「Prompt」は「Young woman」としました。

わぁっ・・・
私の、汚い絵で、絵画風の画像を生成してくれました。
次に真ん中の「Color Transform」を選択し、そのまま生成してみました。

こちらも、少し雰囲気は変わりましたが、絵画風になりました。
次に、一番右「AI Assisted Pain」でやってみました。

こっちは、イラスト風にしてくれました。
太線は、私の線をある程度利用している感じですが、顔はとても美人に描かれています

感想

この記事を書く中で、改めて生成AIの進化を実感しました。
しかも、それがローカルで利用できるというのは、本当に素晴らしいですね。
今回、ブログへの画像掲載を英語版ライセンスを渡してLLMに相談してみました。
英語の長文は、Copilot無料版では長すぎて対応できませんでしたが、ローカルLLMでは回答をもらえました。
要約すると
・ブログへの掲載は基本的には問題ない。
・どのモデルで生成された画像か、またはAIで生成された画像など明記することが推奨される。
・違法行為や差別、個人情報などモラルに反する事は禁止。
のような回答をもらいました。

また画像生成は、私のように絵心のない人にとって、ブログやソフト開発での利用で大きな救世主になりそうです。
イメージをLLMに伝えて、プロンプトを作ってもらって、画像を生成してもらう・・・
こんな事が、ローカルでできてしまいます。

コメント

タイトルとURLをコピーしました