ビル&メリンダ・ゲイツ財団(写真:ロイター/アフロ)
  • 世界中で利用が進む生成AIだが、AIの学習用データは欧米の言語や文化的コンテンツが中心であり、ChatGPTの回答も英語圏とそれ以外で偏りが見られる。
  • こういった格差をなくすため、ビル&メリンダ・ゲイツ財団は、中低所得国の研究者やイノベーターを対象としたプロジェクト支援を進めている。
  • 生成AIという大きな技術的進歩が、世界中のあらゆる場所で価値を生み出せるようになるには、こうした取り組みがもっと増える必要がある。

(小林 啓倫:経営コンサルタント)

ChatGPTは「英語を話すリベラルな人」に優しい

 今年8月、データ分析ソフトなどを手掛ける米企業Teradataから、グローバルで行われた生成AIに関するアンケート調査の結果が公表された。

 IDCが実際の調査を担当し、「生成AIの可能性と現実」というタイトルで発表されたレポートによれば、調査対象となった企業の経営陣のうち89%が、生成AIが持つ価値と可能性を理解していると回答したそうだ。

 既に生成AIは、世界各国の企業が最優先で取り組むテーマになっていると言えるだろう。

IDC: The Possibilities and Realities of Generative AI(生成AIの可能性と現実)

 一方で、高度な生成AIのサービス、またその基盤となるAIモデルを開発する企業の多くが欧米企業であり、そのAIには言語的・文化的な偏りが見られるとする声も大きい。

 たとえば、話題の対話型AI「ChatGPT」については、日本語よりも英語で質問した時の方が、回答精度が上がるという指摘がなされている。

 これについて、ChatGPTの開発企業であるOpenAIのサム・アルトマンCEOは、今年4月に来日した際に、日本語対応を優先的に進めることを政府関係者に約束したと報じられている。

 裏を返せば、OpenAI側も英語以外の言語に関する対応が必要であることを認識しているということだ。

 こうした偏りが生まれてしまうのには、現代において主流となっているAI開発手法に一因がある。

 最近のAIは、機械に大量のデータを与えて、その中に含まれる一定のパターンを自ら学習させるという「機械学習」の手法で開発されることが多い。それ自体は問題ないのだが、当然ながら与えるデータに偏りがあれば、誕生するAIも偏りを持つことになる。

 そして、欧米企業がAIの学習用に集めてくるデータも、当然ながら欧米の言語や文化的コンテンツによるものが中心となるため、それ以外の言語や文化に対する配慮が薄くなってしまうというわけだ。

 余談だが、英国のイースト・アングリア大学の研究者らが最近発表した調査結果によれば、ChatGPTの「思想」にはリベラルな傾向が認められたそうだ。

ChatGPT leans liberal, research shows(The Washington Post)

 ChatGPTにさまざまな質問をしてみたところ、「米国では民主党、ブラジルではルーラ、英国では労働党への有意かつ組織的な政治的偏向が見られた」とのことだ(いずれも各国でリベラル色の強い政党あるいは政治家として認識されている)。

 これもOpenAI社が意図したことというより、彼らがChatGPTの学習に使用したデータの中に、リベラルの傾向を持つコンテンツが多かった結果だと見られている。

 いずれにしても生成AIは、世界中の人々から注目される一方で、その真価を発揮できるのはまだ一部の人々に限られていると言える。