「ノイズだらけのデータ」を活用できないか?

 では、どうしたらよいか。これは思いつきのアイディアでしかないのだが、「きれいなデータ」の取得を諦めてはどうか、と私は考えている。

 テレビを見ていて、面白い技術があることを知った。金属を回転ヤスリに押し付けて出てくる火花の色や形、長さを見ると、ベテラン技術者は、その金属に含まれる成分や含量についておおよそ見当がつくのだという。成分が明らかな金属で日々練習しながら、火花を観察することを繰り返すことで初めてマスターできる、熟練の技だ。この方法なら、熟練さえすれば、いちいち複雑で面倒な分析をしなくても、金属を削るだけでおおよその成分や含量を言い当てることができる、実に優れ技だ。

 このベテランが行っている作業はまさに、人工知能が行う深層学習そのものだ。「雑なデータ」と「精確なデータ」の両方をにらめっこしているうち、火花の色や形という「雑なデータ」を眺めるだけで、おおよそ正しい数値を推定することができる。これと同じことを、農業でも行ってはどうだろう。

 というのも、人工知能の研究のうち、深層学習というのは、「ノイズ」から必要な情報を抽出することに長けているからだ。たとえば映像に関しては、雑然とした町並みの写真の中からネコを発見する、胸部X線写真からガンの可能性のある小さな影を見出す、といったことに強みをもつ。「ノイズだらけのデータから、意味のあるデータを抽出する」ことに優れている。

 ならば、人工知能にきれいなデータを学ばせるのではなく、ノイズだらけのデータを学ばせてはどうだろう。ただし、目的のデータを間違いなく包含しているデータを。

 たとえば、土に金属の棒を刺し、得られた振動のデータを、人工知能に学ばせたらどうだろう。他方、固形物の量(固相)、水分量(液相)、通気性のよさ(気相)といった、正確な情報も同時に入力する。そうした学習を終えた人工知能は、今度は棒を土に刺すだけで、土壌の諸性質の数値を示せるようになるのではないか。

 たとえば少量の土壌を燃やしてみて、その炎の色や煙の様子を「見る」ことで、人工知能は、それに含まれる成分を推定できるようになるかもしれない。