🔻 L’intelligence artificielle réveille les vieux herbiers

Photo d'illustration © Ander Unibaso Villaverde de Pixabay

1750
⏱ Lecture 3 mn.

La numérisation des herbiers ouvre la voie à l’utilisation de l’intelligence artificielle pour caractériser le développement de centaines de milliers d’espèces végétales recensées de par le monde. L’analyse de ces données pourrait permettre de créer un modèle d’anticipation des changements climatiques.

Depuis des siècles, chaque nouvelle plante découverte est systématiquement cataloguée dans des herbiers. Aujourd’hui ce sont plusieurs millions de spécimens représentatifs de près de 400 000 espèces végétales qui sont ainsi archivés dans quelques milliers d’herbiers. La numérisation en cours de ces catalogues naturalistes les transforme progressivement en outils modernes de recherche. « Il est à présent possible d’investir dans des approches d’intelligence artificielle pour identifier automatiquement des spécimens numérisés et extraire des données telles que la présence et le nombre de bourgeons, de fleurs et de fruits », explique Pierre Bonnet, botaniste au Centre de coopération internationale en recherche agronomique pour le développement (Cirad). Ces informations permettent notamment d’étudier la phénologie des végétaux, c’est-à-dire leur dynamique de développement en fonction des variations saisonnières du climat. [ihc-hide-content ihc_mb_type= »show » ihc_mb_who= »1,2,3,4,5″ ihc_mb_template= »1″ ]

« En accédant à l’ensemble des herbiers connus, nous pourrions alors obtenir des données sur des échelles géographiques et temporelles très importantes qui nous permettraient de développer des modèles phénologiques capables de prédire les comportements des plantes vis-à-vis des changements climatiques actuels. » Modèles qui pourraient aider notre société, notamment l’agriculture, à s’adapter au réchauffement climatique.« Dans ce but, nous venons avec l’INRIA (Institut national de recherche en sciences et technologies du numérique) et nos partenaires états uniens de proposer un ensemble méthodologique qui se base sur le « machine learning », et plus précisément sur le « deep learning ». « Cet ensemble de techniques informatiques et statistiques permet en effet d’automatiser la classification et l’analyse de vastes ensembles de données, en particulier visuelles », continue Pierre Bonnet. Mais ce type d’approche nécessite des infrastructures informatiques pour héberger et rendre accessible ces volumes importants de données, constituées notamment d’images de haute résolution. L’analyse de ces images requiert par ailleurs des processeurs spécifiquement conçus pour le traitement de données graphiques. À l’heure actuelle, il n’existe pas de telles plateformes de stockage dédiées à l’application du machine learning aux domaines de la biologie en général et à la botanique en particulier. Et la plupart des centres de calculs actuels sont équipés de processeurs qui ne sont pas adaptés au traitement de données graphiques. Pour pallier ce manque, il est donc impératif que des organisations ou des institutions supranationales mettent en place de manière pérenne de telles cyberinfrastructures de traitements et d’hébergement des données de la recherche.

Au-delà du développement d’infrastructures, ce projet ambitieux au long cours devra aussi rassembler les acteurs en mesure de rendre exploitables les informations contenues dans les herbiers. « Une collaboration interdisciplinaire étroite entre préparateurs d’herbiers, botanistes, écologues et chercheurs en sciences informatiques est essentielle pour développer et affiner les algorithmes capables de tirer profit des collections numérisées », estime Pierre Bonnet. Bien que des preuves de faisabilité aient d’ores et déjà été réalisées sur un nombre restreint d’espèces archivées dans des herbiers numérisés, il existe encore de nombreux défis à relever.« Les échantillons des herbiers n’ont pas été pensés pour être numérisés et analysés par des approches automatisées. » Financer des projets de recherche alliant botanique et sciences informatiques pourrait inciter les spécialistes de l’intelligence artificielle (IA) à s’intéresser à ces problèmes. Leur résolution aura d’ailleurs des répercussions importantes dans d’autres cadres d’application de l’IA.

Enfin, pour assurer une portée globale à ce projet, les botanistes doivent avoir accès au maximum de spécimens d’espèces végétales. Dans le monde occidental, des initiatives privées et publiques ont permis la numérisation de millions d’entre eux. Mais de nombreuses collections, notamment dans les zones tropicales où la flore est très riche, n’ont toujours pas été numérisées faute de moyens. « Ces herbiers sont des témoins du passé irremplaçables », insiste Pierre Bonnet. Leur numérisation représente une tâche colossale, mais, au-delà de nourrir des algorithmes de machine learning, ce travail permettrait aussi de préserver ces herbiers, d’en décupler l’utilisation et de garantir la transmission aux générations futures de cette masse énorme d’informations sur la biodiversité végétale.

[/ihc-hide-content]