(2)日本語の音声認識力は非常に高い
日本語での音声・会話はほぼ100%認識できる。「きゃりーぱみゅぱみゅ」もきちんと聞き分ける。意図的にかなりの早口で喋っても何の問題もない。
逆に人間の方が、客観的でロジカルな言い回しをしているのか、アレクサに問いかけながら神経質になってしまうくらいである。
人間とAIのインターフェイスは、過去のSF映画で予見されてきたように、自然言語による対話形式になっていくのは間違いない。
内臓マイク(集音センサー)の感度も優秀なようで、例えばテレビがついたリビングでも、数メートル離れた場所からの質問をほぼ完璧に判別できる。
音声認識や解答をしている最中に、エコーのリムのLED部分が反応して青緑色に発光するのは、見た目の美しさだけでなく、UX/UIの観点からも秀逸な演出だと思う。
(3)しかし、まだまだできないこともたくさんある
アマゾンが想定するアレクサの基本的な機能は、以前に別の記事でも紹介させていただいたアマゾンのYouTube動画でイメージをつかむことができる。
【参考】Introducing All-New Echo Dot (2nd Generation)
この動画を踏まえた上で、日本語環境でのアレクサのできること・できないことを再度、整理すると、
・アラームを鳴らす、ニュースや天気予報を読み上げる、「おはよう」や「おやすみ」など日常の挨拶に反応する、というような定型的な応対は優秀。ただし天気予報は参照元の情報が古いのか、よく外れるので注意。
・ネットショッピングについては、音声で注文した商品をカートに入れることはできるが、実際の注文はPCやスマホでしかできない(アレクサアプリでのワンクリックショッピングの設定はまだ未対応のようだ)。*1
・驚いたのは音楽のストリーミング再生。アマゾン・プライム・ミュージックのライブラリと完全に連動でき、キーワードによる任意の編集(例:「アレクサ、明るめの音楽をかけて!」)も可能だ。ジャンルも幅広い。一方、松任谷由実(ユーミン)のような邦楽の昔の曲をリクエストすると、必ず会費月額380円の「アマゾン・プライム・ミュージック Unlimited」(4000万曲をカバー)への入会をリコメンドされる。
・「一般常識をやや超える程度」以上の知識量が少ない。例えば、富士山の標高は答えられるが、北アルプスの剣岳の標高は答えられない。映画「スターウォーズ」でハン・ソロの役を演じた俳優(ハリソン・フォード)の名前も回答できない。しばらくは「ごめんなさい。今は分かりません」「今は分かりませんが、もっと勉強しておきます」というアレクサの常套的な言い訳を聞くことになるだろう。
*1:ただし、アマゾンプライム会員は可能とのこと(12/18追記)