例えば、ニューラルネットワークに犬を認識させたければ、コンピュータに見せる写真に「犬」という正解(ラベルと呼ぶ)を付加しておく。すると、写真を見たコンピュータのニューラルネットワークは、そこに写っている犬の特徴を抽出する。それを犬の特徴として少しずつ学習しながら「これは犬なんだ」と覚え、やがて正しく犬かどうかを判断できるようになる。

 このように正解をセットにした写真データのことを、専門用語で「教師ありデータ」、教師ありデータを用いて学習する方法を「教師あり学習」と呼ぶ。

 一度コンピュータに見せた犬の写真と同じ写真をもう一度見せた場合、AIを使っていないシステムでも、それが同一の写真だと分かる。2つの写真が同一かどうかを判定するのは、コンピュータが得意とする作業の一つだからだ。しかし、写真に写っているのが別の犬だと、コンピュータは途端に犬だと判別する力を失う。

 AI、すなわちニューラルネットワークが従来のシステムと異なるのは、犬が写った膨大な枚数の写真から犬の特徴を自ら抽出して学習する点にある。写真そのものや、写真に写った犬そのものを「犬」としてとらえるのではない。特徴が合致すれば、写真に写っているのが犬だと判断するのだ。

 膨大な写真から犬の特徴を学習したら、同様に猫の写真を大量にコンピュータに見せ、特徴をニューラルネットワークで学ばせる。こうしてコンピュータは犬と猫それぞれの特徴を自ら学習し、写真に写っているのが犬か猫かを分類できるようになる(図3)。

図3 学習を積み重ねて犬と猫を判別する

ディープラーニングとビッグデータでブレークスルー

 ニューラルネットワークの研究や技術開発は、以前から進められてきたが、これまでは残念ながら目覚ましい成果が出なかった。最近になって目を見張るような成果が出るようになったのは、いくつかの技術の進歩が重なり、従来の課題を一気にブレークスルーできたためである。

 ブレークスルーに貢献した技術要素として無視できないもののひとつが、ディープラーニングだ。ニューラルネットワークによる学習能力を飛躍的に高めた。