AIは思わぬ形で文化やコミュニケーションに影響を与えている

 論文ではこうした現象が、言語学や社会心理学の概念である「同調(エントレインメント)」に関係していると説明している。

 同調とは、人間が会話相手に対し、無意識のうちに発話のリズムや抑揚、言葉遣いを寄せていく傾向のことを指し、AI相手でもそれが起こりうるというのである。

 つまり、標準的なアクセントで話すAIと日常的に対話していると、ユーザー側も知らず知らずのうちに発音をAIに「寄せて」しまい、結果として独自の方言や訛りが薄れていく可能性があるというわけだ。

 研究チームはこのような音声AIによる言語的影響を放置していれば、地域の言語多様性を損ないかねないと警鐘を鳴らしている。

 同様のことを主張する論文が、他にもいくつか存在している。

 たとえば、米カリフォルニア大学デービス校の音声学者Michelle Cohnと、スウェーデンKTH王立工科大学の音声技術者、Jonas Beskowらの研究においても、実験を通じ、人間がAIの話し方に無意識に合わせてしまう現象が確認されている。

 興味深いことに、この実験では「外観が人間に与える影響」も考慮されている。

 被験者に対し、スピーカー(音声のみの機器)、小型ロボット、人型ロボットという3種類のデバイスから発せられる合成音声と対話してもらったところ、どの場合でも、人間の話者が自分の発話のピッチや発音を、相手の音声に少なからず近づける傾向が観察された。

 ところが、この際、特に人間らしい外見を持つロボットから発せられる声に対して、最も強く声の特徴を同調させる(アクセントや抑揚を真似る)傾向が顕著だったそうだ。

 既に生成AIは、本物そっくりに見える画像を瞬時に生成する能力を獲得している。人間そっくりのアバターを生み出す生成AIと、人間そっくりの音声でコミュニケーションしてくれる音声AIが組み合わさったら、私たちは相手の口調に「寄せて」しまうのを回避できるだろうか?

 AIの進化は私たちの生活を便利にする一方で、思わぬ形で文化やコミュニケーションの様式に影響を与え始めている。音声AIによる方言消滅の懸念は、決して荒唐無稽な空想ではなく、実際の研究が示す現実的なリスクと言えるだろう。

 言葉は単なる情報伝達の手段ではなく、地域やコミュニティのアイデンティティそのものといっても過言ではない。社会全体として、音声AIの設計者や開発者と協力し、言語多様性の保護とAIの公正な運用に取り組む必要があるだろう。

人間の姿で人間のように会話するAIの口調に、人々は「寄せる」ようになる?(筆者がChatGPTで生成)

小林 啓倫(こばやし・あきひと)
経営コンサルタント。1973年東京都生まれ。獨協大学卒、筑波大学大学院修士課程修了。
システムエンジニアとしてキャリアを積んだ後、米バブソン大学にてMBAを取得。その後コンサルティングファーム、国内ベンチャー企業、大手メーカー等で先端テクノロジーを活用した事業開発に取り組む。著書に『FinTechが変える! 金融×テクノロジーが生み出す新たなビジネス』『ドローン・ビジネスの衝撃』『IoTビジネスモデル革命』(朝日新聞出版)、訳書に『ソーシャル物理学』(草思社)、『データ・アナリティクス3.0』(日経BP)、『情報セキュリティの敗北史』(白揚社)など多数。先端テクノロジーのビジネス活用に関するセミナーも多数手がける。
Twitter: @akihito
Facebook: http://www.facebook.com/akihito.