ゼロから始めるAI Vtuber作成~コメント取得から音声回答まで

最近生成系AIに興味があり色々試しています。

今回はAIが自動応答するVtuberを作ってみます。AIにキャラを学習させYoutubeライブに寄せられたコメント・質問に音声で回答します。

Youtube「AI Vtuber」生成に必要なモノ

Youtubeライブで動作するAI Vtuberを生成する上で必要になるモノ・機能は

  • Vtuberの画像(各種表情)
  • Youtubeライブからコメント取得
  • Vtuberのキャラ設定
  • コメントへの回答生成
  • 回答テキストを音声に変換

最低限動作するよう準備します。

AI Vtuberキャラ画像生成

まずは、Vtuberの画像を生成。

今回使ったのは無料で商用利用可能なイラストを生成できる「Leonardo.Ai」

leonardo.ai

▼「漢服を着た中国人女性のアニメ絵」で4枚生成。

右下の絵をVtuberのベースにします。

1.背景の削除

Vtuberの背景は別で用意するので、「Leonardo.Ai」のremove background機能で背景を削除。

2.異なる表情を生成

「Leonardo.Ai」のimage to image機能で先程生成した画像をベースに口を閉じたパターンを生成。音声応答時の口パク画像として使います。

Youtubeライブからコメント取得

Youtubeライブからコメントを取得するにはGoogle Cloudの申込が必要です(要クレジットカード)。Google CloudのYoutube APIを利用します。

ただ、Youtubeライブ配信はすぐには利用できません・・。初回利用時はアカウント確認が必要で最大24時間待ち。

まだYoutubeライブは使えないので、ブラウザ上で動作するVtuberを作成することにします。

AI Vtuberキャラ設定

AI Vtuberキャラ設定とコメントへの回答は「miibo(ミーボ)」サービスを利用。

miibo.jp

「10個の質問」に答えるだけで、自然な会話ができる高精度な会話型AIのキャラクターを生成できます。

実際の回答生成はchatGPTが行っていますが、直接chatGPT APIを呼出すより簡単に利用できます。また、一定の会話数までは無料利用可能。

▼中国駐在員にアドバイスするVtuberとし、AIで生成した自己紹介文を設定。

「こんにちは、私はVtuberの桜花です。中国駐在員の皆さんにアドバイスをするのが好きです。中国での生活や仕事について、役に立つ情報やコツを教えます。」

コメントへの回答生成

雑談配信用のAI VTuberを作成するためのサンプルプログラムが公開されていたので、そのまま使用。

github.com

  • Vtuberの表情変更
  • Youtubeライブからコメント取得(Youtube API連携)
  • コメントへの回答生成(miibo API連携)
  • 回答テキストを音声に変換(VOICEBOX API連携)

の各機能が網羅されています。

AI Vtuberとの会話

設定が終わったので早速試してみます。

▼「自己紹介して」と入力。

回答はテキストだけでなく、VOICEBOXの音声でも返ってきます。

▼VOICEBOXについて

ai-china.hatenablog.com

ただ、テキスト入力から応答まで20秒以上かかりました。

▼いくつか質問

キャラ設定にあった回答が返ってきます。ただ、簡単な内容でも回答できないことも・・。

まとめ

AI VTuberを生成しました。各生成AIを組み合わせることで、これくらいの内容であれば簡単に無料で作れます。Youtubeライブ配信が使えるようになったら、このVtuberを使った配信を試してみようと思います。

また、以前紹介した「Web Speech API」を使えば音声で入力し、音声で応答するAIとの会話が実現可能です。

ai-china.hatenablog.com

今後は、自分の声から合成音声を生成したり、自分の顔写真から学習データ生成して私のクローンAIでも作ってみようかと考え中・・。実家の両親の話し相手になるかも。