Une nouvelle manière d’évaluer la fiabilité des observations de Flora Data

La semaine dernière, une coupure temporaire des services de Flora Data (Carnet en Ligne, IdentiPlante, PictoFlora, etc.) nous a permis de travailler sur la base de données afin d’y ajouter un « indicateur de fiabilité » pour chaque donnée d’observation.

Pour commencer, un petit rappel sur ce que l’on entend par « donnée d’observation botanique » dans l’article suivant :

En quoi consiste cet indicateur ?

Afin d’évaluer plus facilement les données d’observations, des grades de fiabilité ont été définis en fonction de leur caractère complet ou non et de la fiabilité de l’identification taxonomique.

Les critères utilisés pour calculer ces grades sont les suivants :

1. Donnée incomplète et/ou incohérente

  • Un critère (ou plusieurs) du grade 2 n’est pas rempli

2. Donnée complète

  • Observation liée à une adresse mail valide
  • Date non nulle
  • Lieu renseigné (coordonnées ou localité)
  • Nom du taxon non nul et ne continent pas de « ? »
  • Le cas échéant, cohérence entre code INSEE et coordonnées géographiques

3. Donnée complète et fiabilité de l’identification minimale

  • Tous les critères du grade 2
  • Certitude de l’identification ni « douteuse » ni « à déterminer »
  • Note de l’identification sur IdentiPlante ≥ 0

4. Données complète et probablement bien identifiée

  • Tous les critères du grade 3
  • Note de l’identification ≥ 10 ou identification validée sur IP
Ces critères ont été choisis notamment pour des raisons de simplicité, mais il est possible que les grades évoluent au cours du temps, suivant les usages et les besoins des membres du réseau et de l’association.

Pourquoi calculer un tel indicateur ?

Le travail de réflexion ayant mené à la mise en place de cet indicateur a débuté en 2018 – après de nombreux échanges sur le sujet au sein du Conseil Scientifique et Technique de Tela Botanica. Il a porté notamment sur les différentes manières d’évaluer la fiabilité d’une observation, les critères à prendre en compte, la pertinence de l’usage des grades, etc.

L’évaluation de la fiabilité des données d’observations publiées sur le site de Tela Botanica a plusieurs intérêts :

  • permettre à tout un chacun de juger de la confiance que l’on peut accorder à une donnée ou un jeu de donnée
  • permette à Tela Botanica de filtrer les données affichées suivant les interfaces (dans eFlore par exemple, masquer les données les moins fiables)
  • permettre aux contributeurs de connaitre les critères importants, auxquels il faut prêter attention lors de la saisie ou l’utilisation de données d’observation

Comme son nom le laisse présager, cet indicateur ne fait que donner une indication quant au caractère complet et valide de l’observation, ce n’est en aucun cas une preuve définitive de qualité.

Un atelier de travail lors du rassemblement du CST en 2019
Atelier de travail au soleil pour le CST 2019

Quelles conséquences sur les données ?

Les grades de l’indicateur sont consultables lorsque vous exportez des données (champs avancés).

Lorsque le grade 3 au moins est atteint par une données d’observation, celle-ci est considérée comme « standard ».

Cette notion est utilisée :

  • Sur eFlore : les photos affichées sont seulement celles liées à une observation standard
  • Sur les cartes des observations : par défaut les cartes n’affichent que les données standards
  • Dans l’export : filtre sur les observations standards

Pour aller plus loin

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *