【完全無料】AIによるYoutube動画生成~Bing AI、Stable Diffusion、VOICEVOX利用

ここ数ヶ月、GPT4を始め各種生成系AIが続々リリースされています。

これらAIを使ってYoutube動画を生成してみました。シナリオ、イメージ映像、音声読み上げを全て無料ソフトで作成します。

Youtubeタイトル案生成

作成する動画は「中国での日本人駐在員のトラブル」。

タイトル・シナリオ作成には

  • Microsoft Bing AI

を使います。GPT4をベースとした無料で使えるAIツールです。

▼Microsoft Bing AIの過去記事

ai-china.hatenablog.com

ai-china.hatenablog.com

「上海駐在員のトラブルに関するYoutube動画のタイトル」で考えてもらった案は下記。

  1. 上海駐在員がタクシー運転手に暴言を吐いて大炎上!
  2. 上海駐在員の奥さんが現地の男性と浮気してバレた衝撃の一部始終
  3. 上海駐在員が食べたものを当てるクイズに挑戦!(ヒント:生きている)
  4. 上海駐在員が現地の文化に挑戦!紅白歌合戦でカラオケ大会!
  5. 上海駐在員がコロナ禍で帰国できなくなったらどうなる?笑えない現実に迫るドキュメンタリー

Youtubeシナリオ生成

これらタイトル案をベースにYoutube動画のシナリオを「Bing AI」で生成。

ただ、1番目の動画シナリオ生成は何度試しても失敗します。

▼途中で過激な言動となり、シナリオ作成がエラー。

GTP4では、暴力的な表現・性的な表現はNGなので完成できませんでした。

仕方がないので「ボッタクリや行き先の間違いトラブル」でシナリオ生成。完成したのは以下の動画。「Bing AI」が出力した内容をそのまま利用しています。

▼【AI生成動画】中国での日本人駐在員のトラブル~タクシーボッタクリ

youtu.be

音声読み上げ

作成したシナリオを音声読み上げソフトで読み上げます。

使用したのは

無料で使える日本語音声読み上げソフトです。※クレジット表記が必要なので公式サイト要確認

▼AIが生成した会話を貼付け。

無料動画編集ソフト「DaVinci Resolve」と連携するとVOICEVOXで出力した音声をアニメ画像に喋らせる事も簡単にできます。

▼【AI生成動画】中国での日本人駐在員のトラブル~中国人女性との恋愛

youtu.be

テキストから画像生成

シナリオに関連する画像をAIで生成します。

「Stable Diffusion 2.1」をMage (https://www.mage.space/)上で利用。

  • ラベルが斜めに貼られた商品
  • 中国工場の女性作業員とスーツを着た日本人駐在員

等シナリオにあった画像を生成します。生成した画像は以下の動画で利用。

▼【AI生成動画】中国での日本人駐在員のトラブル~工場の品質管理

youtu.be

画像生成AI「Bing Image Creator」の方が高品質のイメージを生成出来たのですが、商用利用NGなので、「Stable Diffusion 2.1」を使っています。また「midjourney」は今月から無料トライアル生成が不可となりました。

画像から動画生成

次に作成した静止画から動画を生成。

▼【AI生成動画】中国での日本人駐在員のトラブル~社員との言い争い

youtu.be

↑の動画は紙芝居の形ですが、「Creative Reality Studio(Talking Heads Videos | Create E-learning video | D-ID)」で画像の人物がしゃべる動画を生成します。

▼画像と音声をアップする、音声に合わせてクチパクしたり、瞬き、顔を傾けたりと違和感がない映像となりました。

本物の人間が話しているように見えます。

残念ながら無料プランでは商用利用不可なので、「Creative Reality Studio」で生成した動画はYoutubeにアップしていません。

また、有料ツールですが、fiiki(Fliki - Turn text into videos with AI voices)を使えば、もっと簡単に動画が生成できます。(テキストを入力するだけで「音声読み上げ」や「テキストに関連するイメージ動画の作成」を自動で行う)

まとめ

各種AIソフトを使ってYoutube動画を作成しました。今回の動画はAIが1回目に出力したシナリオをそのまま利用しています。

何度か条件を変更して生成すれば、もっと面白い内容となりそうです。無限にアイディアやシナリオ作成をしてくれるので、誰でも簡単に動画を量産できます。

人間が作るコンテンツより、AIが自動生成するアニメや映画の方がクオリティが高い。という事が数年後には有り得そうです。