わかりましたやん??素のChatGPTが使う大阪弁は何かがおかしい(提供:miso_butter/イメージマート)わかりましたやん??素のChatGPTが使う大阪弁は何かがおかしい(提供:miso_butter/イメージマート)
  • 各国のIT企業は自国の母国語に強いLLM(大規模言語モデル)の開発を進めている。その中で、登場しつつあるのが方言に対応したLLMだ。
  • 方言AIは貴重な文化や知識を時代に継承する有力な手段になる上に、その言語を話す人々から信頼や親近感を得る手段になり得る。
  • だが、政治家のスピーチなど、方言AIによる多言語対応を悪用するケースも考えられる。「方言ロボット」とともにリスクを議論しておく必要がある。

(小林 啓倫:経営コンサルタント)

 先日、MicrosoftがフランスのAI企業、Mistral AI(ミストラルAI)と提携するというニュースが流れた。MicrosoftはChatGPTの開発企業であるOpenAIとも提携しているため、「どうして?」と思われた方もいるだろう。

 しかし、いまや飛ぶ鳥を落とす勢いのOpenAIとて万能ではない。Microsoftとしても、さまざまな可能性を手に入れておく方が望ましいと判断するのは、企業として当然だろう。

 そして、Mistralが提供してくれる可能性の一つが、同社が開発するLLM(大規模言語モデル)だ。

 LLMとは、チャット型AIの頭脳やエンジンに当たる部分で、ChatGPTはGPT-3.5やGPT-4といったLLMが裏側で動いている。チャット型AIがどのような機能を持ち、どのくらい正しい回答をしてくれるかは、LLMの性能や精度が左右する。

 Mistralは社名と同じ、Mistralという名前のLLMを開発・提供している。その特徴の一つは、欧州系の言語に強いという点だ。

 LLMを開発する際には、大量のテキストデータが必要になる。それをAIが「学習」して自らの頭脳とするわけだ。であれば当然だが、そのテキストデータの中に含まれていない知識は習得できないということになる。

 英語ばかり勉強してきた人に、いきなり「同じ外国語なのだから中国語を話せ」と言っても無茶な話だ。

 OpenAIの開発しているLLM、GPTシリーズは、主に英語で学習を行っている。もちろん、日本語を含めたさまざまな言語に対応しているが、やはりどうしても、英語以外の言語を使った場合には若干の精度低下が起きることが指摘されている。

 そこで、世界各国のIT企業は自国の母国語に強いLLMを開発しようと尽力しており(日本でもNECなどが日本語LLMの開発に動いている)、Mistralは欧州系言語に優れたLLMを完成させたのだ。

 そのような状態なので、英語以外の言語、そのさらに方言となると、いくら優秀なチャット系AIに喋らそうとするとなかなか難しい。たとえば、大阪弁で実験してみると、次のページにような回答になる。