感情がAIに悪影響を及ぼすメカニズム

 前述の通り、生成AIは人間の生み出した大量のデータを「学習」することで誕生する。そうしたデータの中には、ニュース記事やブログ、小説、SNSへの投稿など、さまざまな種類の文章が含まれており、それぞれ異なる感情が込められている。

 AIはこれらのデータを読み込む際に、単語やフレーズの組み合わせだけでなく、文章全体の雰囲気や感情もパターンとして学習する。

 たとえば、ネガティブな感情を表す言葉(「ひどい」「最悪」「失敗」など)は、ニュース記事やSNSの投稿などでは、事件や事故、批判的な意見などネガティブな出来事や情報と一緒によく使われる。

 AIは、このような言葉の結びつきを統計的に学習する。同様に、ポジティブな感情を表す言葉(「素晴らしい」「最高」「成功」など)は、レビュー記事や旅行記などにおいて、良い評価や肯定的な情報と一緒によく使われる。こちらも同じく、パターンとしてAIに学習される。

 こうして学習したAIに対して、私たちが感情的なプロンプトを使うと、そのプロンプトに含まれる感情的な言葉が、AIが学習したパターンを呼び起こされてしまう。

 たとえば、ネガティブなプロンプトの場合、AIは学習データの中でネガティブな言葉と関連付けられていた、批判的、悲観的、あるいは誇張されたような情報を出力しようとする傾向が強まる。その結果、事実に基づいた正確な情報よりも、感情的な方向に偏った情報が出力されやすくなる。

 ポジティブなプロンプトの場合も同様に、AIはポジティブな言葉と関連付けられていた、楽観的すぎる、あるいは少し美化されたような情報を出力しようとするようになる。楽観や美化は必ずしも悪いことではないが、厳密な事実が求められる場合には、やはり避けられるべき傾向だ。

 また、ポジティブなプロンプトは、AIに対して「もっと詳しく説明してほしい」「良い点をたくさん挙げてほしい」という期待感を伝える可能性があるという。するとAIは、情報を多く含んだ長い文章で応答しやすくなり、結果として冗長な出力になったり、不適切な内容が含まれる可能性を高めてしまったりするという。

 それに対して、中立的なプロンプトの場合には、特定の感情と強く結びついたパターンが活性化されにくいため、AIはより客観的な情報に基づいて応答しようとする。結果的に、感情的な偏りがないため、学習データ全体からよりバランスの取れた、事実に基づいた情報が抽出されやすくなるのだ。

 つまり中立的なプロンプトは、AIに余計な反応を引き起こす可能性が小さいわけということだ。

 このように、別にAIが人間のように感情を理解しているわけではない。ただ、大量のデータから感情的な言葉とそれに関連する情報のパターンを学習しており、プロンプトの感情がどのパターンを優先的に使うかの「手がかり」となるため、出力結果が左右されると考えられている。