先にお見せした図1と図2に、構造の違いがあったことにお気づきだろうか。図2はニューラルネットワークの中間層が複数の列(層)になっており、図1に比べて情報を分析するためのニューロンの数が増えている。このように中間層を何層にも増やすことで、ニューラルネットワークはより「深く」考え、特徴を詳しく理解するディープラーニングの能力を身につけた。

 中間層を増やして学習能力を高めるディープラーニングは、開発者やサイエンティストが試行錯誤を繰り返し、目的や解析する対象によって適切な層やニューロンの数などの構成を突き詰めてきた結果だ。

 ブレークスルーに欠かせない第2の技術要素がビッグデータである。ニューラルネットワークは学習の経験が増えるほど判断や判別の正確性が上がる。そのため犬や猫の特徴を正しく理解できるようにするには、膨大な量の学習データが必要になる。加えて、セントバーナードのような大型犬や、モコモコの毛をまとったプードル、ダックスフントのような細長い体形の犬などさまざまな写真を見せることで、「こうした特徴の犬もいるんだ」ということを学習していく。

 犬や猫などの特徴を理解し、十分に正しく判別できるように学習するには数10万枚というような規模の犬や猫の写真とラベル付けが必要になるかもしれない。以前はそれだけの数の画像を用意するのが極めて困難だった。しかし、最近はソーシャルメディアをはじめインターネット上で、膨大な数の犬の画像が公開されており、それらを学習データとして利用することが可能だ。膨大な量の学習データを用意するハードルは格段に下がった。

 コンピュータの計算能力が飛躍的に向上したことも、ニューラルネットワークの進化を支えた。従来、ニューラルネットワークの学習にはスーパーコンピュータ並みの性能を持つハードウェアが必要だった。しかも、少し学習するために数日から数カ月を要した。

 ところが、今は画像処理を高速に行える高性能の「GPU」(Graphics Processing Unit)が身近になり、ニューラルネットワークは従来の数10倍も短い時間で学習を重ねられる。これにより学習能力が格段に高まったのである。

 ディープラーニングとビッグデータ、コンピュータの計算能力。これらの技術要素が歩調を合わせるように進化し、ニューラルネットワークは一気に進歩した。そして高い学習能力を備えたニューラルネットワークの実現により、AIはさまざまな用途で一気に花開いたのだ。