【中国AI】アリババの生成AI「通义千问」検証~日本語にも対応

前回、中国百度AIの性能を検証しました。

ai-china.hatenablog.com

今回はアリババの大規模言語モデルAI「通义千问」を試してみます。(2023年09月時点)

対話

まずは、大規模言語モデルAIの基本機能「対話」を検証。

▼前回の百度AI検証時と同じ質問

回答内容は百度と大差がないですが、アリババAIは日本語にも対応。

回答を中国語→日本語に翻訳すると、全く違和感のない正しい日本語になりました。

また、日本語でプロンプトを入力すると、日本語で応答があります。

百度は中国語、英語しか対応していないですが、アリババAIは日本語を含む多言語対応です。

AI助手

アリババにもAIに対する命令を使いやすく纏めたツール「百宝袋」が用意されています。

歌詞生成

「写歌词」ツールを使って、タイトル「我爱北海道」の歌詞を生成。

大自然、美食、ラベンダー畑など北海道らしさを取り入れた歌詞が生成されました。

企業分析

「行业分析」ツールを使って、「科大讯飞」を企業分析。

簡潔に纏めた情報が出力されます。

画像生成

画像生成は「通义万相」システムから起動。

2050年の上海外滩と入力し生成。

縦横比1:1で生成すると1024×1024ピクセルの画像が4枚生成されました。品質はまずまず。

百度AIとアリババAIの比較

百度AIとアリババAIの性能を比較します。

  • 銀行利子に対する個人所得税の支払いは必要?
  • 株の配当に対する個人所得税の支払いは必要?
  • どのように税金を払う?

を聞いてみると・・

▼百度

▼アリババ

百度の方が質問に対する結論を先に記載していてわかりやすい。

ただ、2番目の質問は百度AIの回答は不正確、3番目の質問はアリババAIの回答は誤り。

▼税金、納税方法について

ai-china.hatenablog.com

このように、たまに間違った回答はあるので完全に信用するのは危険です。とは言え、両方とも中々精度がいい印象。(そもそも中国ではAIを使わず検索サイト「百度検索」で調べても正しい答えを検索するのが難しい・・)

▼中国の人工知能開発大手「科大讯飞」の大規模言語モデルも試してみましたが、性能がイマイチでした。

日本語翻訳は10年前の機械翻訳レベル。

まとめ

アリババの大規模言語モデルAI「通义千问」を検証しました。

簡単な応答に関してはGPT4と大差がなく、かなり高性能という印象です。

また、百度AIと違って日本語完全対応なのも良い点です。

ただ、日本語でプロンプトを入力すると日本語サイトで学習した結果を回答するので要注意。「銀行の利子に対する所得税率は?」と質問すると、日本の所得税についての回答が帰ってきます。