Časopis vydává Agentura ochrany přírody a krajiny ČR ve spolupráci se Správou jeskyní ČR a Správou NP Šumava, Krkonošského národního parku, NP Podyjí a NP České Švýcarsko. V tištěné podobě vychází již od roku 1946.

cs / en

Výzkum a dokumentace

Ochrana přírody 1/2023 23. 2. 2023 Výzkum a dokumentace Tištěná verze článku v pdf

Co může databázím přinést automatické rozpoznávání rostlin?

autoři: Ondřej Vild, Ondřej Veselý, Karel Chobot

Co může databázím přinést  automatické rozpoznávání rostlin?

Analýza obrazu pomocí hlubokých neuronových sítí se postupně dostává z odborných konferencí do běžného života. Mezi její aplikace patří i rozpoznávání rostlin z fotografií. Aplikace fungují jednoduše: požadovanou rostlinu vyfotíte na smartphone a za pár okamžiků dostanete název rostliny. Jednou z nejúspěšnějších aplikací v oboru je aplikace Plant.id brněnské firmy FlowerChecker. Tuto technologii je ale také možné využít pro identifikaci většího počtu fotografií a celých jejich databází.

1_2023 str28_29 obr1 Výběr 20 fotografií

Výběr 20 fotografií, u nichž si byl Plant.id model nejjistější, ale autor záznamu měl jiný názor.

Databáze fotografií v NDOP

Jednu takovou databázi vlastní a spravuje Agentura ochrany přírody a krajiny ČR. Je součástí Nálezové databáze ochrany přírody, která obsahuje data o výskytu rostlin, hub a živočichů v České republice. Záznamy v ní pocházejí nejen od expertů, ale skrze veřejně dostupnou aplikaci BioLog do ní mohou přispívat i amatérští přírodovědci. Tyto záznamy jsou méně spolehlivé, a proto je zde na místě jejich ověření experty. Tato kontrola je ale časově poměrně náročná a využití technologie Plant.id se zde nabízí. Zajímalo nás, jestli by bylo možné pomocí této technologie usnadnit kontrolu záznamů. 

Použití modelu Plant.id

Pro analýzu jsme použili všechny dostupné záznamy s fotografiemi cévnatých rostlin, pořízené mezi lety 2014 a 2020. Celkem se jednalo o 10 131 záznamů s 1552 unikátními taxony, nejčastěji v druhové úrovni. Všechny fotografie jsme následně analyzovali modelem hluboké konvoluční sítě Plant.id. Výsledkem pro každou fotografii byl seznam nejpravděpodobnějších druhů. 

Porovnání autorů záznamu a modelu

To nám umožnilo porovnat, do jaké míry se data z NDOP shodují s výsledky modelu. Podívali jsme se na procentuální shodu na rodové a druhové úrovni. Kromě shody u prvního výsledku modelu jsme také zaznamenávali, jestli existuje shoda v nějakém z prvních pěti výsledků modelu. Při vyhodnocení jsme zohlednili synonyma. Výsledky ukázaly, že shoda na druhové úrovni u prvního výsledku byla u 55 % fotografií a na rodové úrovni u 70 % fotografií. Shoda v jednom z pěti výsledků pak byla na druhové úrovni u 71 % fotografií a na rodové úrovni u 81 % fotografií. Vzhledem k tomu, že model Plant.id „nezná“ všechny taxony z NDOP, nebyla shoda možná v 9 % případů u druhové úrovně a v 1 % případů u rodové úrovně. Jednalo se především o vzácnější a kritické taxony. Je tato míra shody „úspěchem“? Při podobném přístupu, na fotografiích rostlin britské flóry, se Plant.id trefilo do druhu v prvním výsledku u téměř 70 % případů (Jones 2020). Tento 15% rozdíl může být způsoben rozdílnou kvalitou fotografií, ale také právě vyšší jistotou identifikace v britské studii, pokud připustíme, že v databázi fotografií v rámci NDOP mohou být pozorování s chybným určením.

1_2023 str28_29 obr2 Ukázka výsledku modelu

Ukázka výsledku modelu: jednotlivé taxony seřazené podle pravděpodobnosti.


Revize fotografií

Abychom zjistili, jestli k takovým k neshodám dochází, potažmo v jakých případech, seřadili jsme si záznamy podle míry jistoty modelu. Prvních 
20 záznamů následně Ondřej Vild a Ondřej Popelka revidovali na základě fotografií a znalosti rozšíření druhů. Ve čtyřech případech jsme dali za pravdu autorovi záznamu a ve 14 případech Plant.ID modelu. Ve dvou případech se na fotografii vyskytovaly oba druhy. Revize ukázala, že pokud si je model jistý, má často opravdu pravdu. Dá se nicméně předpokládat, že s klesajícím sebevědomím modelu se bude jazýček na vahách přesouvat ve prospěch autora záznamu. To bude nejspíše platit u méně častých a kritických taxonů, dále u méně kvalitních fotografií a nekvetoucích jedinců. 

1_2023 str28_29 automatické rozpoznávání rostlin tabulka

Závěr

Výsledky ukazují, že technologie rozpoznávání rostlin z fotografií může usnadnit revizi záznamů v rozsáhlejších databázích, jako například NDOP. AOPK ČR uvažuje i o tom, že tento nástroj začlení i do aplikace BioLog. Tím by mohl být uživatel upozorněn na možnou záměnu ještě před vložením záznamu, v důsledku čehož by se celá databáze stala spolehlivější. Mohlo by to též zvýšit ochotu záznamy o výskytu druhů do databáze vkládat, zvláště u opatrnějších uživatelů. 

Díky aplikaci Insect.id vydané v lednu 2023 bude možné podobně vyhodnotit i bezobratlé živočichy a postupně i různé skupiny obratlovců.     ■

- - -

Titulní graf: Podíl celkové shody u NDOP a modelu Plant.id. 

- - - 

Odkazy:

Jones, H. G. (2020). What plant is that? Tests of automated image recognition apps for plant identification on plants from the British flora. AoB PLANTS, 12(6), 1–9. https://doi.org/10.1093/aobpla/plaa052 

Článek vznikl také s pomocí prostředků podporujících dlouhodobý koncepční rozvoj výzkumné organizace – RVO 67985939.