動画生成技術は目覚ましい進化を遂げていますが、根幹を支えるVAE(Variational Autoencoder)の設計と訓練には依然として多くの困難が伴います。AIラボのLinumが画像と動画の両方に対応するVAEの開発に挑んだ過程で直面した課題や得られた貴重な知見について自社 ...
今回はLDM、VAE、ControlNet、LoRAの導入について解説します。これらを知ることでAIイラスト生成の理解が深まり、ComfyUIの学習速度が向上します。 AIイラスト生成の流れ LDMは図のように画像を生成します。 今回取り扱う題材は上図では「モデル読み込み」と ...
vae decodeでRGB化してPNGとして保存 学習時にPNGを読み込み、vae encodeでlatents化する と、vae decode/encodeを通す事になってしまいます。 画像にlatentsが埋め込まれているならば、vae encodeする必要がなくなるという訳ですね。 画像フォーマットを考えてみる ...
2022年8月に一般公開されたStable Diffusionは、入力した言葉に従って画像を自動で生成してくれるAIです。そんなStable Diffusionを画像生成AIだけではなく強力な非可逆画像圧縮コーデックとして使う方法について、ソフトウェアエンジニアのマシュー・ビュー ...
画像生成AIのStable Diffusionは「潜在拡散モデル」と呼ばれるAIで、テキストを入力するだけで高精度な画像を生成することが可能です。このStable Diffusionに使われている「VAE」に致命的な欠陥があるという報告が、オンライン掲示板サイトのRedditに投稿されてい ...
米Microsoftは2月15日(現地時間)、ビデオ関連の演算をGPUでハードウェア処理するためのAPI「Video Acceleration API」(VA-API)がWindowsで利用できるようになったと発表した。 「VA-API」はもともとIntelによって開発されたオープンソースのライブラリ(libva)およびAPI ...
ポジティブワン株式会社(本社:東京都渋谷区)は、OpenCV,エンコード、デコードなどの画像処理に関するシステム開発に ...
ジャパンマテリアル株式会社(代表取締役社長:田中久男、三重県三重郡)は、カナダMatrox社の新しいエンコーダー・デコーダー 「Matrox Monarch EDGE S1」を2022年1月17日(月)に発売いたします。 本製品は、4KリモートプロダクションやWebキャスティング用 ...
現在アクセス不可の可能性がある結果が表示されています。
アクセス不可の結果を非表示にする