2021年度前期第5回細胞生物学セミナー

日時:518() 1600 場所:総合研究棟6

Using Deep Learning for Image-Based Plant Disease Detection

Mohanty, S., P., Hughes, D., P., Salathé, M. (2016)

Front. Plant Sci. 7:1419

深層学習を用いた画像ベースの植物病理診断

 

農作物の病気は食料安全保障にとって大きな脅威だが、必要なインフラが整備されていないため、世界の多くの地域では迅速な原因特定が困難な状況にある。世界的なインターネットやスマートフォンの普及と深層学習技術の進歩により、スマートフォンのカメラを利用した病理診断が可能となれば早期に対処が可能となることから、本研究では深層学習による病害の画像認識に着目した。

 植物病害診断に適した画像分類器を開発するためには、病気の状態と健康な状態の植物の画像を集めた大規模な検証済みデータセットが必要となる。これまで本研究の目的に沿った画像データベースは存在しなかったが、PlantVillageプロジェクトの画像データベースによってこの問題は解決した。このデータベースにある54306枚の画像を用いて14種類の作物と26種類の病原菌の分類を畳み込み型ニューラルネットワーク(CNN)による学習を行わせた。

 CNNの学習を行う前に異なる3つの画像処理を行った。一つ目は元の画像をダウンサンプルし、2つ目はこの画像をグレースケールに処理した画像、最後にダウンサンプルした画像の背景のみを除去した画像を用いた。これらを用いて学習を実施するためにAlexNetGoogLeNetという2つのCNNモデルを用いて転移学習またはゼロからの訓練を行い、診断精度の比較を行った。学習を行う際に過学習を防ぐために、PlantVilleage内の画像のうち、訓練データとテストデータ画像割合を80%20%60%40%50%50%40%60%20%80%6グループに分けて学習効率の差を検証した。

 その結果、PlantVilleage内の画像を利用した診断精度は85.53%から99.34%の間だった。AlexNetGoogLeNetどちらのモデルもダウンサンプルしたカラー画像の学習とテスト割合が80%20%の場合が最も高く、ゼロからの訓練よりも転移学習させた方が診断精度は高かった。また、学習を行う頻度を増やせば診断精度も向上した。しかし、PlantVilleage以外の画像でテストを行った場合、精度が最高65.61%と著しく低下してしまった。これらの画像はPlantVilleageの画像と比較して背景や撮影手法が統一されてなかったことが原因だと考えられる。

従来からも深層学習を用いた手法は存在したが本研究はそれらよりも仕組みが簡素化され、分類可能な病害数が増え、大きな進歩が見られた。学習をする際はハードウェアによる制限をある程度受けるものの、その後の作物の種判別と病害の特定は素早く簡単になった。今後は実際の現場で撮影された画像を用いた学習を行って認識精度向上を目指す必要がある。本研究で用いた画像認識技術は既存のシステムの補助を目的としている。この手法が浸透し、作物への被害を最小限に抑えることが期待される。

 

興味を持たれた方は是非ご参加ください。 川ア 光