トップページトピックス【博物館】AI画像認識システムを用いた植物の種名判定システムを開発

【博物館】AI画像認識システムを用いた植物の種名判定システムを開発

[記事掲載日:22.06.17]

  • topics-SDGs-04(質の高い教育をみんなに)
  • topics-SDGs-15(陸の豊かさも守ろう)

 総合研究博物館の田金 秀一郎特任助教は、島根大学生物資源科学部生命科学科の秋廣 高志助教、総合理工学部知能情報デザイン学科の白井 匡人助教、島根県立三瓶自然館サヒメルの井上 雅仁博士、兵庫県立大学/兵庫県立人と自然の博物館の高野 温子博士、福島大学共生システム理工学類の黒沢 高秀教授、株式会社TRWorkers、株式会社アルファ水工コンサルタンツらの研究グループにて、AI画像認識システムを用いた植物の種名判定システムを構築しました。
 本研究成果は、国際学術誌『Scientific Reports(サイエンティフィック・リポーツ)』に5月16日にオンライン公開されました。
 なお、本研究は、住友電工グループ社会貢献基金、科研費(21K06307 田金.,19K06832 高野., および18H04146 黒沢)の支援を受け、実施されたものです。


■本研究のポイント
・大学や博物館には植物標本がたくさん収蔵されています。これらの植物標本をスキャナーやカメラでデジタル画像化し、その画像をAIによる画像認識システムにより学習させることで、植物分類群の名前を当てることのできるシステムを構築しました。
・本研究で構築したシステムは2,171分類群について96.4%の正答率を誇ります。
・本研究は、生物学と情報工学の融合により得られた成果です。また、複数の博物館や大学、民間企業の知識と技術の組み合わせによって得られた成果です。


■研究の背景
 世界の約3,000の博物館や大学の収蔵庫には、約3億8000万点の植物標本が保管されています。植物標本は、これまで主に植物分類学の研究者が利用してきましたが、最近になり標本のデジタル画像がウェブデータベースで公開されるようになり、多くの分野の研究者がこれらのデータを使うようになってきました。一方で残念ながら、収蔵庫に保管された植物標本の同定が誤っていることは多々あります。植物の名前を判定する"同定"という作業は長年の鍛錬と膨大な知識がないとできませんが、近年正しく植物の同定ができる人が減っているのが一因です。しかし分類学を専門としない人では同定間違いに気づかないため、ウェブ上に公開された誤った標本情報をそのまま使ってしまうことになります。
 近年になり画像認識技術が発展し、AIによって人物を特定することなどが可能になっています。AIならば植物の種名を正しく判定することもできるかもしれないと考えたのが、本研究の背景です。最近では、携帯のカメラで撮影した植物の写真から種名を判定してくれるアプリもたくさん作成されています。これらは身近な植物、特に花を撮影すると高い確率で正解を教えてくれます。一方で、葉だけや茎だけでは判定は難しく、また珍しい植物は判定できません。我々は国内で採集された約57万点の植物標本の画像を使って、種名を判定するシステムを構築しました。このシステムを用いることで、誤同定された標本を選び出すことも可能になりました。


■研究の成果
 57万枚の標本画像を収集し、それらをAI画像認識システムを用いて学習させ、種名を判定するシステムを構築しました。対象となるのは約2,000種であり、96.4%と極めて高い判定精度で正しい種名を選び出すことができます。どういった標本画像が判定に向かないか、専門家がよく間違える種をAIも同じく間違えている事などもわかりました。

20220617aigazou05.jpg標本の中には葉が取れてしまってないものや、葉に虫食いの穴が沢山空いているものがあります。
このような標本約3万点を学習対象から外すことで判定成功率が上昇しました。

20220617aigazou0007.jpg

学習に用いた画像ファイルの解像度299×299Pixel。
元の画像と比べると粗いですが、AIは正しく判定できていることがわかりました。

20220617aigazou008.jpg AIがどの部分を見て判断しているのかを可視化することができるGrad-CAM解析。
人間が判定に使っている部分をAIも使っていることがわかりました。
一方で、種によっては人間が判定には使わない部分を使って判定していることもわかりました。


20220617aigazou009.jpg
鹿児島大学の標本画像。
写っている竹の定規を、AIは植物(竹)として認識してしまうこともわかりました。

 学習には高性能のパソコンが必要ですが、島根大学総合理工学部に設置されているパソコンを使うことで、約1週間で解析が終わりました。作成した植物の種名の判定システムはhttp://tayousei.life.shimane-u.ac.jp/ai/index_all.phpにて公開しています。



■作成した植物の種名を判定するシステム

20220617aigazou11.jpg
http://tayousei.life.shimane-u.ac.jp/ai/index_all.php
ファイルを選択するボタンに画像をドラッグアンドドロップし、送信ボタンを押すと、候補が1位から5位まで標本の画像とともに表示されます。コンピューターがその可能性も算出し表示します。



■今後の展望
・植物種の同定には各分類群に精通した専門的な知識が必要です。本システムを用いることで、一般の方でも正しい種同定をするサポートができるものと考えられます。
・現時点では2000種程度ですが、今後は学習に用いる標本点数を増やし、対象種を増やすことで、日本国内に分布する植物(約8,000種)を網羅する形で判定が可能になると考えられます。
・大学や博物館に収蔵されている標本の中には、間違った名前が付けられている標本(誤同定)が少なからず存在しています。そういった標本を今回構築したシステムを使って選び出し、大学や博物館の収蔵標本の整理に寄与することが可能となります。
・コンピューターが判定に使っている部位を調査したところ、これまで専門家が使ってこなかった部位も判定に使っていることがわかりました。正確な判定を行う技術や知見の向上に利用可能だと思われます。
・今回は植物標本画像を用いて判定システムを作りましたが、今後は生の植物の写真を使って判定ができるシステムを構築したいと考えています。


【論文タイトル】
Development of a system for the automated identification of herbarium specimens with high accuracy
(植物標本の種名を自動かつ高精度で判定するシステムの開発)

【著者】
白井匡人*1、高野温子*2、黒沢高秀*3、井上雅仁*4、田金秀一郎*5、谷本朋也*6、小金山透*7、佐藤平行*7、寺澤知彦*7、堀江岳人*7、萬代 功*8、秋廣高志*6
*1島根大学総合理工学部 *2兵庫県立大学/兵庫県立人と自然の博物館 *3福島大学共生システム理工学類*4島根県立三瓶自然館サヒメル *5鹿児島大学総合研究博物館 *6島根大学生物資源科学部*7株式会社アルファ水工コンサルタンツ *8株式会社TRWorkers

【掲載誌】
Scientific Reports

【DOI】
https://www.nature.com/articles/s41598-022-11450-y