
Commençant à trier les photos de vacances, je tombe sur la première, prise sur le site d’Iliz Koz (« la vieille église » en breton) : celle d’un panneau listant les catastrophes naturelles en Bretagne depuis des siècles. Et il y en a eu : pluies diluviennes, tremblements de terre, sécheresse (si si !), la mer qui gèle ou pire qui recouvre les terres, ou encore l’été qui commence en février. Cette dernière est-elle vraiment une catastrophe d’ailleurs ?
Pourquoi ne pas en faire un article sur le blog me dis-je ? et plutôt que tout taper à la main, essayer une reconnaissance optique de caractères (ROC ou OCR en anglais) à partir de la photo… N’ayant jamais eu à faire cela, je pars donc de la page consacrée à ce sujet sur la documentation française d’Ubuntu, très bien faite comme toujours. Les premiers logiciels indiqués sont logiquement ceux de scan.
Logiciel de scan
En partant directement de ma photo, et en utilisant scan2pdf, le résultat n’est pas fameux. D’accord, mon image non plus… Après un peu de transformation de celle-ci avec Gimp (passage en noir et blanc, puis abaissement du seuil), j’obtiens quelque chose de beaucoup plus lisible. Cela va-t-il marcher ? seconde tentative toujours avec gscan2pdf, mais le résultat toujours aussi mauvais :


Solution Web
Vu le résultat avec les logiciels de scan (j’aurai pu en tester d’autres, comme toujours sous Linux, il y a pléthore), je préfère alors m’orienter alors vers une solution web, Free OCR en l’occurence. Vous pouvez lire cet article qui liste six solutions orientées web. Cette fois le résultat est tout à fait correct, même s’il y a quelques corrections à apporter :

Voilà, le prochain article, ce sera donc les catastrophes naturelles en Bretagne au cours des siècles !