Premier versement des données Tela Botanica à l’INPN
L’INPN (Inventaire National du Patrimoine Naturel) est un dispositif national mis en place afin d’assurer de manière standardisée la restitution de données de synthèses nécessaires à l’expertise, l’élaboration de stratégies de conservation et la diffusion d’informations et de rapports nationaux et internationaux sur le patrimoine naturel français (espèces végétales et animales, milieux naturels et patrimoine géologique). L’INPN a été initié en 2003 et lancé officiellement en 2005 sur la base des données gérées depuis 1979 par le Secrétariat de la Faune et de la Flore (SFF) du Muséum National d’Histoire Naturelle (MNHN).
L’un de ses objectifs est notamment « d’assurer le développement d’une banque nationale de référence sur la biodiversité française, permettant la mise en cohérence de données d’origines diverses ». Dans ce cadre, il a pour vocation d’intégrer les données naturalistes collectées par les différents programmes et structures partenaires – dont Tela Botanica fait partie.
Depuis sa création, l’une des ambitions de Tela Botanica est de contribuer à l’amélioration des connaissances sur la flore grâce à la collaboration, le partage et l’ouverture des données. Il était donc logique pour l’association d’intégrer les données issues du réseau à l’INPN.
Afin de permettre les échanges de données naturalistes entre acteurs et avec l’INPN, le SINP (Système d’Information sur la Nature et les Paysages) a défini un protocole d’échange qui contraint notamment le format des données transmises.
Pour nous conformer au mieux à ce protocole, les données de Tela Botanica ont été qualifiées en amont du versement selon des « grades de fiabilité ». Seules les données remplissant les critères suivants (grade 3 et 4) ont été transmises :
- Observation liée à une adresse mail valide
- Date non nulle
- Lieu renseigné (coordonnées ou localité)
- Nom du taxon non nul et ne continent pas de « ? » du référentiel BDTFX
- Le cas échéant, cohérence entre code INSEE et coordonnées géographiques
- Certitude de l’identification ni « douteuse » ni « à déterminer »
- Note de l’identification sur IdentiPlante ≥ 0
Suite à l’intégration, l’INPN nous a fourni 3 rapports d’analyse des données d’observations transmises : conformité et cohérence, validation scientifique et description
1/ Conformité et cohérence
Les résultats de conformité sont présentés par concept du standard de l’INPN. Pour chacun des concepts, le détail des résultats est donné selon trois catégories :
- les champs obligatoires du standard sont renseignés et les données sont conformes aux valeurs attendues;
- les champs obligatoires sont renseignés mais certaines valeurs ne font pas partie des nomenclatures du standard;
- un ou des champs obligatoires du standard ne sont pas renseignés, ce qui rend la donnée non conforme.
La cohérence des données n’est également contrôlée que pour les concepts utilisés dans les données transmises. Il ne s’agit pas de contrôles par rapport au standard, mais de la cohérence des données au sens logique du terme. Exemples : la date de début d’observation est-elle bien antérieure à la date de fin ? La donnée fournie est-elle bien sur le territoire français ?
Nombre total de données transmises : 629302 (8383 taxons)
Nombre de données conformes : 628744 (8379 taxons)
Nombre de données cohérentes : 611888 (8101 taxons)
Nombre de données conformes et cohérentes, soumises aux contrôles de validation scientifique : 611335 (8094 taxons)
97.14% des données transmises sont conformes et cohérentes
2/ Validation scientifique
La validation scientifique consiste en des processus d’expertise visant à renseigner sur la fiabilité (le degré de confiance accordé à la donnée). Ces processus font intervenir des bases de connaissance et/ou de l’expertise directe.
On distingue :
- La validation scientifique dite automatique qui consiste en une validation faisant appel à des résultats d’expertise préalable, (des référentiels, des bases de connaissances, etc.). Ce processus est réalisé de manière automatique (informatique) dans le cadre du SINP.
- La validation scientifique dite manuelle qui consiste en une validation des informations faisant appel à une expertise directe (avis d’expert suite à l’analyse des informations transmises). Ce processus est réalisé par un ou des experts dans le cadre du SINP.
Nombre de données diffusables (conformes, cohérentes et valides) : 607438 (7847 taxons)
96.53% du jeu transmis satisfont aux contrôles pour la mise en diffusion sur l’INPN
3/ Description
Ce rapport décrit la composition du jeu de données fourni, dans sa quantité et sa qualité, une fois les contrôles de conformité, cohérence et de validation scientifique effectués (il porte sur les données diffusables).
Il précise également l’apport des données transmises en matière de connaissance par rapport aux données déjà disponibles au niveau de l’INPN en tant que plateforme nationale du SINP.
Les enregistrements du jeu de données sont rattachés à :
- 13268 communes dont (commune – nombre de données) :
- Beaumont (63032) – 14773
- Marseille (13055) – 8676
- Montpellier (34172) – 7777
- Paris (75056) – 6772
- Grenoble (38185) – 5928
- Montferrier-sur-Lez (34169) – 4680
- Nimes (30189) – 4596
- Angers (49007) – 3570
- Strasbourg (67482) – 3544
- Roanne (42187) – 3016
- 96 départements dont (département (nombre de données)) :
- BAS-RHIN (67) – 69357
- HERAULT (34) – 53802
- HAUT-RHIN (68) – 30935
- ISERE (38) – 26681
- PUY-DE-DOME (63) – 22229
- BOUCHES-DU-RHONE (13) – 20816
- GARD (30) – 19543
- MAINE-ET-LOIRE (49) – 12118
- AUDE (11) – 11890
- PYRENEES-ATLANTIQUES (64) – 11689
- 2529 mailles 10km x 10km
- 117143 points
Les dix taxons les plus cités au sein des données transmises sont (par ordre décroissant de données par taxon) :
- Hedera helix L., 1753 (4283)
- Taraxacum F.H.Wigg., 1780 (3953)
- Poa annua L., 1753 (3901)
- Plantago lanceolata L., 1753 (3852)
- Senecio vulgaris L., 1753 (3804)
- Sonchus oleraceus L., 1753 (3659)
- Stellaria media (L.) Vill., 1789 (2782)
- Erigeron canadensis L., 1753 (2746)
- Urtica dioica L., 1753 (2638)
- Galium aparine L., 1753 (2574)
Le jeu de données contribue pour 0.82% au nombre total de données actuellement diffusées dans l’INPN. Le jeu de données contient 223 taxons pour lesquels aucune occurrence n’était mentionnée jusqu’à présent dans l’INPN dont :
- Anemone hupehensis (Lemoine) Lemoine, 1910 (25)
- Abies koreana E.H.Wilson, 1920 (12)
- Erythrostemon gilliesii (Wall. ex Hook.) Klotzsch, 1844 (10)
- Ipomoea lobata (Cerv.) Thell., 1919 (10)
- Rubus insectifolius P.J.Mull. & Lefevre, 1859 (9)
- Firmiana simplex (L.) W.Wight, 1909 (8)
- Graptopetalum paraguayense (N.E.Br.) E.Walther, 1938 (8)
- Agapanthus africanus (L.) Hoffmanns., 1824 (7)
- Prunus cerasifera f. cerasifera Ehrh., 1784 (7)
- Tilia henryana Szyszyl., 1891 (7)
Le jeu de données apporte 1.61% de données de moins de 5 ans à l’INPN.
Le jeu de données contient 6011 taxons dont aucune occurrence n’était mentionnée jusqu’à présent dans 9043 communes.
Le jeu de données contient 3347 taxons dont aucune occurrence n’était mentionnée jusqu’à présent dans 119 départements ou secteurs marins.
5 commentaires
C’est une bonne nouvelle que nos données soient prises en compte par l’INPN ! Bravo pour ce travail.
Bravo pour l’initiative !
Quelle tristesse toutefois de constater qu’une espèce exotique envahissante figure dans le top 10 des espèces les plus citées …
223 nouveaux taxons, bien joué ! Excellente nouvelle que ce partage de données.
Pas forcément une bonne nouvelle la présence de nouveaux taxons exogènes allochtones, ces derniers se développant le plus souvent au détriment des espèces autochtones les plus intéressantes en termes de biodiversité …
J’en ai vraiment ras-le-bol de ce genre de commentaire…