MonOCR

MonOCR est un programme de reconnaissance de caractères gratuit basé sur Tesseract.

Il a été développé par Alain Lapierre pour récupérer, en quelques étapes faciles, le texte d’un document PDF, de fichiers image (png, bmp, tif, jpg, pcx, gif, ppm et tga) ou d’un numériseur, pour ensuite l’afficher en format texte en utilisant l’éditeur de texte par défaut de Windows.

Les explications qui suivent se basent sur Windows XP mais vous devez pouvoir faire les même opérations sous les dernières versions de Windows.

Ce programme nécessite l’environnement .net 3. Vous pouvez le trouvez en cliquant sur ce lien : http://www.microsoft.com/fr-fr/download/confirmation.aspx?id=21

Vous pouvez télécharger sur ce site une version allégée (pas chinois, japonais ou coréen).  La taille du fichier auto-extractible est de seulement 13,5 Mo (contre 102 Mo avec les langues orientales) afin de permettre le téléchargement depuis une connexion modeste.

Lien de téléchargement : http://cybercitizen.free.fr/dl/MonOCR.exe

Enregistrez ce fichier sur votre bureau Windows.

Appuyez ensuite sur la touche Windows et en maintenant cette touche appuyée sur la touche M pour revenir sur votre bureau de Windows.

Tapez ensuite la lettre M jusqu’à entendre MonOCR.exe

Appuyez sur Entrée.

NVDA annonce alors « 7zip archive auto-extractible Dialogue ».
Extraire vers
Edition Alt+X
Sélectionné C:\Documents and Settings… »
Appuyez sur Entrée pour lancer l’extraction.

Vous entendez des bips pendant l’extraction mais il n’y a pas de message final. Attendez quelques instants puis revenez sur le bureau en tapant sur la touche Windows+M.
Appuyez sur M jusqu’à entendre MonOCR.
Appuyez sur Entrée.

Appuyez sur TAB pour atteindre la liste des fichiers.
Appuyez 2 fois sur M jusqu’à entendre MonOCR.exe
Appuyez sur Entrée.

NVDA vous annonce le lancement de « MonOCR par Alain Lapierre… »

Sélectionnez le fichier à traiter en appuyant sur F2.

Vous êtes par défaut dans le dossier Mes Documents.
Le curseur se trouve dans la zone d’édition du nom de fichier.
Appuyez sur Maj TAB pour vous rendre dans la liste des fichiers.
Déplacez-vous au moyen des touches Flèche Haut et Flèche Bas jusqu’à entendre le nom du fichier image à reconnaître.
Appuyez sur entrée pour le sélectionner.

Pour plus d’explication sur la sélection d’un fichier, vous pouvez consulter : http://angouleme.avh.asso.fr/fichesinfo/fiches_jaws/debuter/mes_documents_xp.htm

Vous revenez alors dans l’interface de MonOCR.
Appuyez sur F5 pour lancer la reconnaissance de caractères.
Vous entendez des bips pendant la durée de cette opération.
Le texte reconnu est ensuite affiché dans le bloc-notes de Windows.
Vous pouvez le modifier puis l’enregistrer.