外国人が見た「ジャパンイメージ」
AIに常識は通用しない
別の例で考えて見ましょう。百人一首の第二番
春過ぎて 夏来にけらし 白妙の 衣干すてふ 天の香久山
を画像化してみます。

何となく、それらしい画像が出てきます。しかし、図をよく見てみると「画像」として「それらしく」見えて、実際には日本語として意味をなさないインクのシミにすぎないようなものが出力されています。

これ、つまり米国人など日本語文化圏の外にある人が見た「日本っぽい」イメージの、悪い意味での典型になっている。
これは動画にしてみるともっとひどくて、外国人の見る「日本っぽい音楽」に乗せて「日本語っぽい」発音が並ぶ、往年のタモリの宴会芸「4か国語マージャン」のような悪い冗談になっているのが分かります。
冒頭に載せた百人一首の十番、蝉丸の歌
これやこの 行くも帰るも分かれては 知るも知らぬも逢坂の関
を普通に出力しただけでも、

「それっぽい書」風の文字列(未満)は、やはり日本語として意味を成していません。
さらにこれを、一度英語に訳して、
So this is it—the place where people coming and going part ways; Where acquaintances and strangers alike meet at the Meeting Barrier.
として画像化してみると・・・この英文表記の文字列には「百人一首」も「和歌」も情報として含まれませんから、機械頭としては「大阪駅」と解してしまうようです。
