- A :
- florecoste@t...
- De :
- Jean-Pascal MILCENT <jpm@t...>
- Sujet :
- Re:[florecoste]Laqualité est dans les chiffres...
- Date :
- 06 Juin 2012 17:54
Le 05/06/2012 07:55, m.bennett@i... a écrit :
> Il y a deux ans, lors d'une rencontre (dans les locaux de Tela) qui a eu lieu suite au 'sabordage' du projet "Bonnier sur PDA", j'avais présenté deux logiciels que j'avais concoctés.
>
> Depuis ce temps, mais surtout depuis cet hiver, le logiciel est ressorti de ces cartons et est maintenant utilisé par un cercle limité à une quinzaine de personnes dans l'espoir de réduire les dégâts lors d'une mise à disposition plus générale. Il regroupe les deux logiciels présentés en un seule; je crois qu'ils sont harmonieusement reliés entre eux.
>
> Pour résumer (mais il n'y avait présent que Jean-Pascal à ce moment-là), j'ai donc un logiciel qui, parmi d'autres, permet:
> - une détermination à partir des données élaboré dans le cadre du projet "Bonnier sur PDA";
> - les textes de Coste formatés agréablement au sein de la hiérarchie nomenclatural.
>
> Ce qui me manque, et ce que j'espère intégrer dans une prochaine version sont la numérisation des clefs de Coste. Actuellement, ce n'est pas bien grave, car les fac-similés de ces pages intégrés dans la structure nomenclatural, est plutôt satisfaisant.
>
> Ayant donc un minimum d'expériences en la matière ;-), je souhaiterais exprimer ce que je pense être l'aspect par loin la plus importante dans l'élaboration des numérisations.
>
> C'est très simple, c'est tout simplement l'exactitude des chiffres... Le problème, c'est que ce n’est pas facile!
>
> J'utilise les données en provenance du superbe travail de Jean Zissler, un travail qu'il a fait il y a maintenant quelques années. Jean m'avait expliqué que la qualité de ses résultats était due à l'utilisation d'un technique de correction avec dictionnaire. La qualité des outils de numérisation a avancé pendant ces dernières années et peut-être est-il qu'un post-traitement n'est plus nécessaire (ils sont integrés dans l'outil).
>
> Le problème est qu'aucune technique de postcorrection n’est possible quand il s'agit des chiffres.
>
> Il faudrait mettre le paquet sur la qualité du résultat du document qui est scannérisé (la version de 1901-1906 que je possède était bien imprimée sur un bon papier, mais quels était les changements dans les éditions ultérieures?) et faire et refaire les phases d'apprentissage en insistant sur les chiffres.
>
> Tenter de faire une détermination à partir d'une clef avec quelques chiffres erronés n'est vraiement pas une bonne idée; il faudrait a priori les vérifier tous (mais qui le fera...).
Bonjour,
L'idée est de pouvoir avoir les retours d'un maximum de personnes.
La mise à disposition sur le wikini de l'ensemble des textes permet au
plus grand nombre de participer.
Sans faire de "pub" pour le projet, deux personnes, Oivier et Patrick,
se sont mis à participer. Une fois l'ensemble des textes repris sur le
wiki nous pourrons faire un appel à participation pour solliciter la
relecture des textes...
--
Jean-Pascal MILCENT
Chef de projets
Tela Botanica
http://www.tela-botanica.org/