- 機械学習のため、インターネット上の膨大な情報を読み込んでいる生成AI。それを著作権侵害だと主張した米NYタイムズの提訴は世界のメディアに大きな衝撃を与えた。
- 米国は「フェアユース(公正利用)」という概念の下、IT大国の地位を築き上げたが、生成AIの脅威が叫ばれる今、フェアユースのひと言では済まない状況になりつつある。
- 双方の和解によって機械学習の対価が支払われれば、それが対価交渉の基準となる。
(山崎 康志:フリージャーナリスト)
米紙ニューヨーク・タイムズが昨年12月27日、AI(人工知能)開発会社、米オープンAIを著作権侵害でニューヨーク連邦地裁へ提訴したことは、世界のメディアに大きな衝撃を与えた。NYタイムズは多くの記事が生成AIの学習に無断利用され、さらに複製されている事例を挙げ、その損害額は「数十億ドル(数千億円)にのぼる」と訴えた。
一方、オープンAIは反発する。生成AIが利用者の質問に対し、新聞記事をそのまま回答することは「稀に起こるバグ(不具合)」に過ぎず、NYタイムズが指摘した事例は、自らに都合よく生成AIを操作した結果だと反論した。さらに生成AIが新聞記事などの情報を学習することは合法と主張している。
「フェアユース」が培ったAI大国
この訴訟、果たしてどちらが有利か──。オープンAIが主張する合法の根拠は、米国著作権法が定める「フェアユース(公正利用)」の概念にほかならない。日本の著作権法にも似た規定があり、今回の訴訟の行方次第ではわが国のメディアにも同じ事態が起こり得るのだ。
では、フェアユースとは何か。ひと言でいえば、著作物をその権利者の許諾なく利用しても、公共の利益に資する公正な利用であれば、著作権侵害には当たらないとする法理である。この法理のおかげで、米国はIT大国の地位を盤石にしたと言っても過言ではない。
1990年代後半、インターネットの検索エンジンの開発が進み、ヤフー、グーグルなどのベンチャー企業が生まれ、とりわけグーグルはマイクロソフトに比肩するメガプラットフォーマーに成長した。
検索エンジンは、インターネット上にある膨大な情報を機械的に読み込んでいる。その中には新聞記事などの著作物も含まれるが、米国ではフェアユースに基づいて読み込み自由。その結果、いち早く優位に検索エンジンを開発できたのだ。
検索エンジンの普及当初、著作権者も自らのコンテンツ(情報内容)が上位に検索されれば、その販売増や広告収入につながり、ウィン-ウィンの関係を築けると期待した。新聞社、出版社、テレビ局は積極的にコンテンツの電子化を進めたが、皮肉にもWebメディアの台頭を許し、結果は発行部数とテレビCMの激減に終わった。
事態が深刻化した契機は2022年11月、オープンAIの生成AI「ChatGPT」の提供開始である。世界はその大規模言語モデルが回答する自然な文章、画像、音声に刮目したが、生成AIもインターネット上の膨大な情報を読み込んでいることは検索エンジンと同じ。すなわち「機械学習」が行われており、メディアは一方的に読み込まれるだけで何のメリットもない。
NYタイムズはこの“ただ乗り”の非を訴え、機械学習の対価を支払えと主張しているのだ。いや、NYタイムズにすれば、メリットがないどころか、自社の記事を含む誤った回答によって報道機関の信頼を傷つけられるデメリットすらある。
それが、生成AIの「ハルシネーション(幻覚)」である。