前回、百度やアリババの大規模言語モデルAIの性能を検証しました。
今回は、テンセントが提供する「腾讯智影」を使ってみます。AIデジタル人間によるライブコマース販売にも対応している高性能AI映像生成・編集ツールです。
腾讯智影について
腾讯智影は、テンセントが提供するAI映像ツール。
AIを利用した画像生成・原稿生成・テキスト音読・デジタル人物による会話等をサポートしています。
料金は利用する機能により異なり、一番高いコースは3,599元/1ヶ月(AIデジタル人間と本物の人間を併用したライブコマース機能「数字人直播 真人接管版」)。
無料でも各種機能をお試しで使うことが出来ます。(無料では商用利用不可)
AIによる画像生成
まず、AIによる画像生成「AI绘画」を検証。
プロンプトに「长袖汉服」、テーマに「人物写真」を入力して画像生成。
出力された画像は1024×1024ピクセルと解像度高め。
生成のレベルは「Stable Diffusion」と同程度。
バックグラウンドでは「Stable Diffusion」が使われているのかもしれません。
AIによる原稿・映像生成
次に「文章转视频」を検証。
テーマを入力し「AI创作」ボタンを押すだけで、テーマに基づいた文章が生成されます。
▼テーマに「豫园历史简介」を入力し生成
次に、文章を音読するAIデジタル人間や音声音色、BGM等を選択し「生成视频」を押すと映像が生成されます。
▼自動生成された映像
最後に「合成」ボタンを押すと、AIデジタル人間が文章に合わせた表情・動作で生成文章を読み上げます。
テーマを入力するだけで、自動で映像を生成することが出来ます。
動画編集
動画編集は基本的な機能を一通り網羅しています。
カット、編集、オブジェクト・BGM追加等など。
特徴はAIデジタル人間の追加。自分が撮影した動画にAI人間を追加して喋らせることが可能。
音声読み上げは方言、各種感情を指定可能。
口の動き、瞬き、手の動作など本物の人間と区別が難しいレベルです。
▼生成した動画をYoutubeにアップしました。
利用規約を見ると、無料版でも商用利用ではないメディアにアップロードするのはOKとなっています。
个人自媒体 非商业盈利
个人以分享为目的在抖音、快手、视频号等网络自媒体传播使用
NG行為は下記。
商业自媒体
个人或机构以盈利为目的在抖音、快手、视频号、头条号、西瓜视频等商业自媒体使用
ライブコマース用AIデジタル人間生成
ライブコマース用AIデジタル人間生成機能は下記2コース。
- AI自動応答のみ
- AIと本物の人間の併用
まず、AIデジタル人間を使った商品紹介映像を生成します。
▼サンプルで生成されている映像を見ると、AIとは思えないクオリティです。
映像生成後、ライブコマースでどのように応答するかを事前に登録します。
▼例えば、チャットで「质量怎么样」を含む文字が入力されたら、「这个产品的复购率真的是没的说,这是个好评率非常高的一个产品,大家完全可以放心」とAIデジタル人間が回答します。
対応しているライブコマースは抖音,淘宝,快手など。
まとめ
テンセントのAI動画生成ツール「腾讯智影」の無料で使える機能を試してみました。
AIで生成された人間の映像は、音声の発音・顔の表情・体全体の動作など、本物の人間と区別するのが難しいくらいです。ここ数ヶ月の生成AIの進化のスピートはかなり早いです。
ただ、今のところ「腾讯智影」で対応しているのは英語・中国語のみ。日本語は使えません。