SadTalkerでの顔アニメーションの作成¶
SadTalkerで一枚の人物画像と音声ファイルで動画作成できる。
stable diffusion webuiにプラグインがあるので利用してみる。
ベース画像¶
以前作ったおっさん画像を転用。
音声¶
VOICEVOXで適当に作成。
sadtalker¶
stable diffusion webuiにプラグインがあるのでインストールする。
https://github.com/OpenTalker/SadTalker
モデルはここに公開されているものをダウンロードしてextension/SadTalker/checkpoints
に配置。
https://drive.google.com/drive/folders/1hgPt7dx4bCi74u_R24Eaapt6QeCHuVb_
生成実行¶
- face model resolution は 256 で設定
- Still Mode を有効化してあまり動かさないようにする
- GPFGAN as Face enhancer を有効化にする
所感¶
- 画像一枚と音声ファイルで簡単にディープフェイクが作れつつある
- ボイスチェンジャー系の技術と組み合わせるとフェイク動画になりそう
- VALL-E Xあたりが面白そう
- 画像を無理やり動かしている感も残っているが上々。
- 全身のモーションまで補完できるようになるなら顔ハメ感減りそう。
- フォトリアル系ではよく機能するものの、イラスト系はあまり機能しなかった。
- 顔が検出できなかったり、イラスト調の補完にならなかったりする。