IoT(Internet of Things)の最新ニュースや企業&ベンチャー事例(ケーススタディ)ほぼ毎日掲載

テクノロジー
2017.11.06

スマートスピーカーは人間の「親友」になり得るか?
音声認識AIの「会話」面について考察する

BY

Googleの「Google Home」、LINEの「Clova WAVE」の発売を受け、ようやく日本でも盛り上がり始めたスマートスピーカー。11月8日には本命と目されるAmazonの「Amazon Echo」、12月9日(土)には、ソニーからGoogleアシスタント搭載のAIスピーカー「LF-S50G」が発売される予定となっている。

そんなスマートスピーカーの核となるのが、音声認識AI。今後スピーカーだけでなく、様々な製品に搭載されていくであろう、注目の技術だ。現在代表的な物はAppleの「Siri」にGoogleの「Googleアシスタント」。Amazonの「Alexa」、Microsoftの「Cortana」、そしてLINEの「Clova」だ。

これらのAIは皆、基本的に一問一答。予定の読み上げや天気の確認など、「秘書」としての役割を求めるのであればそれで十分だが、「話し相手」として見た場合は力不足と言わざるを得ない。しかし今回はあえて、この点に着目したい。

複雑な操作が不要で見た目もシンプルなスマートスピーカーは、あらゆる世代にアプローチできるポテンシャルを感じさせる。筆者の周りにいる80代の高齢者も、普段PCやスマートフォンは操作が難しそうと敬遠しているが、スマートスピーカーには興味津々。楽しそうにあれこれと話しかけていた。そんな様子を見ていると、これが普段の話し相手としても機能するのなら、家族と離れて暮らす高齢者の心のケアにもなるのでは? と感じさせるのだ。

「機械と会話する」というと、ともすれば不健康な響きにも感じるかもしれない。しかし、このニーズは案外多いのではないだろうか。高齢者だけでなく、「秘書」的な役割に期待してスマートスピーカーを購入した方の中には、使っていくうちに愛着が湧き、現状の必要最低限なやり取りに物足りなさを感じ始めている方もいるはずだ。

今回は音声認識AIの実用面ではなく、話し相手としての進化を見ていこう。

独自の進化が期待されるLINE「Clova」

スマートスピーカーが発売されたばかりのGoogleアシスタントとLINEのClovaに関して言えば、どちらも「しりとりをしよう」などの簡単なものなら雑談的なやり取りをすることも可能だ。しかしやはり基本的に「秘書」なので、雑談であっても一問一答。例えばしりとりをしようとした場合、即座に「ん」で終わる言葉を繰り出し会話を終了させるなどといった「塩対応」をされることもざらだ。

その点Clovaは、Clova WAVEの正式版発売と同時にアップデートされ、ある程度連続した会話をすることも可能となった。「ありがとう」や「さようなら」、「うるさい」などと話しかければ連続発話を終了させることができる。やり取りにはまだぎこちなさが残るという声も多いが、AIとの「対話」という面においてはGoogleアシスタントに一歩リードしていると言って良いだろう。

さらにLINEは2017年3月2日(木)、バーチャルホームロボット「Gatebox」を展開するGatebox(旧社名:ウィンクル)を連結子会社化したことを発表した。Clovaを活用してGateboxの共同開発を進めるとのことだ。

「人とキャラクターが共に暮らす世界の実現」を目指し2015年頭から開発が進められてきたGateboxは、従来の機械的なロボットとは一線を画す。同社が発表しているコンセプトムービーを見てもらえばイメージが湧くだろう。

Gatebox - Virtual Home Robot [ConceptMovie1st]

9月にはクリプトン・フューチャー・メディアが展開する人気キャラクター「初音ミク」のイベントにおいて、KDDIと連携した施策を実施したことでも話題を呼んだ。

Gatebox - 「Living with 初音ミク」‐ Magical Mirai 2017 report ‐

こうした日本独自のキャラクター文化は海外にもファンが多い。Clovaに日本独自の強みを与え、育てていこうとした場合、この分野に投資しようとするのは納得の動きと言えよう。

その上、LINEには日本国内で圧倒的シェアを誇るSNS「LINE」のユーザーから得られる膨大なデータがある。国内のトレンドを逐一Clovaの会話にも反映していけるようになれば、より自然で時流に合った「会話」ができるようになるだろう。

現在、冒頭で挙げたような海外産の音声認識AIの中で対話に特化したものは存在しない。SNSの「LINE」同様、Clovaが日本国内の音声認識AIやスマートスピーカー市場で覇権を握る余地は十分に残されていそうだ。

「口語=文語の代用品」ではない? 自然な会話を成り立たせるカギは

シーマン人口知能研究所(以下、SAIL)が2017年9月1日(金)より、これまで同研究所が構築してきた「会話型AIのための新口語文法体系」を九州大学と共同研究していくことを発表した。

SAILは、1999年に一世を風靡した「シーマン」という音声認識を使ったテレビゲームで代表の斎藤由多加氏が培った知見を活かし、発話者の抑揚などを理解してより正確な受け答えができる会話エンジンの開発を目指す、今注目の研究所だ。

SAIL公式サイトで読むことのできる「人工知能学会誌2017年3月号No2 172pー179P/シーマンは来るべき会話型エージェントの福音となるか?:斎藤由多加インタビュー」によれば、斎藤氏は従来の音声認識AIが文語ベースであることを指摘し、これを「抜本的に見直すべき」としている。自然な会話を実現させるには「口語のための文法をつくり直すしかない」とのこと。

確かに、普段私たちが周りの人と行なう会話を思い返すと省略に次ぐ省略。相手や自分の想像力に頼る部分が多く、主述も何もあいまいなことがほとんどだ。
もしも、終始SiriやGoogleアシスタントのような口調で話す人物が職場にいたら、煙たがられることは必至だろう。

前出のインタビューで、斎藤氏は以下のように語っている。

「家の中で人と自然に共存できる人工会話があるとしたら、それは『今日、ジャイアンツ勝ちましたか?』とか『今一番売れている本はどれですか?』(中略)という事務的なリクエストに答えるAIではなくて、『振られちゃった』と言ったときに『マジ?』と言ってくれるAIが、求められているものの半数を超えると思います。情報を取得する手段や、自分の代わりにインターネットで検索するものではなく、ただ聞いて感情を共有してくれるだけでいい」

よりユーザーに寄り添った「人間くさい」音声認識AIは、斎藤氏が語るようにSiriやGoogleアシスタントとは、全く別のアプローチから生まれてくるのかもしれない。

忠実な「秘書」として、海外では独走状態の人気を誇るAmazon EchoのAlexa。いよいよ国内での発売を控え、日本でもまず間違いなくヒット商品となるだろう。

しかし今後、日本人の「親友」の座を勝ち取るのはどの音声認識AIなのか。「秘書」と同一のAIなのか、それとも全く別のAIが台頭してくるのか。日本語という言語の難しさや海外との文化の違いを踏まえると、まだまだ結論は出なさそうだ。

JBPRESS

記事ランキング

  • 直近1時間
  • 昨日

話題のキーワード

注目連載

あわせてお読みください

IoTニュース

月額40円からのセルラーLPWA、KDDIがIoT向けに提供
au、スマホで家電を操作できる赤外線リモコンやGoogle HOME連携でホームIoTサービスを強化
KDDIがホームIoT「au HOME」を拡充――「Google Home」と連携
Google Homeで家電も操作、KDDIがホームIoT「au HOME」を本格スタート
「au HOME」サービス拡充で魅力増、ネックは月額料金:週刊モバイル通信 石野純也
スマートリモコン「sRemo」がIFTTTに対応、Google Homeから操作可能に
においを“デジタル化”してAIで判定するシステム
成功の反対は「何もしないこと」、まずはやってみよう――稲田修一氏が提言するIoT活用による価値創造の方法論
横河電機、IIoT用小型無線センサ「Sushi Sensor」開発 - 第1弾は振動・温度
IoT人気記事ランキング|センサーを使わず電波だけでIoTを実現するOrigin Wireless、第3回IoT/M2M展【秋】レポートなど[11/13-11/19]
KDDI、IoT向けに低コスト・低消費電力のLPWAサービスを提供
土壌センサー、地中に埋め込み直接モニタリング
機械学習機能や5G無線を実現する最新FPGA
小浜市・クラウド漁業・KDDI、鯖の養殖効率化にIoTを活用するプロジェクトを開始
テックファームグループ、IoT事業拡大に向け人材採用を強化
金融機関はRPAの<次>に移行すべき—アクセンチュアが新フレームワーク「ACTS」の提供を開始

IoTニュース”は、Mynd Engineを活用して、世の中のIoT関連の記事をまとめさせていただき、ご紹介させていただきます。