FreeOCR

logiciel pour extraire le texte d'une image



Télécharger et installer FreeOCR

télécharger:FreeOcr

Pour tout dépannage ou conseil s'adresser sur le forum de PC land
PC land


pour suivre le tuto,
clic gauche avec votre souris
et déplacez la main à l'endroit désiré



Télécharger et installer FreeOcr

Extraire le texte d'une image

Extraire le texte d'un fichier PDF

Extraire le texte d'un document scanné

Améliorer la pertinence de la reconnaissance

Télécharger et installer FreeOcr

Cliquez sur le bouton Enregistrer.
et rechercher votre dossier de téléchargement
et cliquez une nouvelle fois sur le bouton Enregistrer.

freeocr

Une fois le téléchargement terminé,
cliquez sur le bouton Ouvrir.

freeocr

le fichier téléchargé est une archive .zip,
dézippez ce fichier avec votre dézippeur.

Sélectionnez le dossier dans lequel vous allez
décompresser l'archive
et cliquez sur Suivant.

freeocr

Double cliquez sur le fichier freeocr25.exe décompressé.

freeocr

Cliquez sur le bouton Exécuter.

freeocr

L'assistant d'installation de FreeOCR s'ouvre alors.
Cliquez sur le bouton Next.

freeocr

Sélectionnez l'option
I accept the terms of the license agreement.

freeocr

Cliquez sur le bouton Install.
freeocr

Cliquez enfin sur le bouton Finish.

freeocr

Ajouter le dictionnaire français



Reconnaissant par défaut les textes en anglais,
vous pouvez facilement ajouter le dictionnaire
pour reconnaître les textes en français.

Dans votre navigateur Web, rendez-vous à cette adresse :

liste FR

Téléchargez French language data for Tesseract.

freeocr

Lancez le téléchargement du fichier.

freeocr

Enregistrez le fichier sur votre disque dur.

freeocr

Ouvrez le fichier avec Winzip ou winRAR ou un logiciel équivalent
supportant les archives au format TAR.GZ.

freeocr

Ouvrez le dossier tessdata.

Sélectionnez tous les fichiers de l'archive.

freeocr

Dans l'explorateur Windows, ouvrez le dossier
C:\WINDOWS\tessdata.

freeocr

Faites alors glisser les fichiers décompressés
de Tessdata
dans le dossier que vous venez d'ouvrir,
qui se nomme aussi tessdata
dans

C:\WINDOWS\tessdata.

freeocr

Le logiciel reconnait alors le texte des documents en français.





Extraire le texte d'une image


Que cela soit à partir d'un document scanné ou d'une brochure,
FreeOCR peut reconnaitre le texte présent dans une image.

Lancez FreeOCR en double cliquant
sur son icône sur le Bureau.

freeocr

Cliquez sur le bouton Open
freeocr

Sélectionnez sur votre disque dur l'image
dont vous souhaitez extraire le texte.
Cliquez sur le bouton Ouvrir.
freeocr

Cliquez sur la croix rouge
pour effacer le texte précédemment reconnu.

freeocr

Déroulez la liste OCR language
et sélectionnez l'option fra
afin de reconnaître le texte en français.
freeocr

Cliquez sur le bouton OCR.
Le logiciel analyse alors votre image.

freeocr

Le résultat est affiché dans le cadre droit de la fenêtre.

freeocr

Vous pouvez alors copier le texte reconnu
dans le logiciel (Word par exemple)
de votre choix ou l'enregistrer dans un fichier texte
en utilisant les contrôles au centre de la fenêtre.

freeocr

Vous pouvez ensuite corriger les éventuelles erreurs
dans votre traitement de texte.

freeocr

Le texte corrigé

freeocr

Extraire un paragraphe

Pour n'extraire le texte que d'une partie de l'image,
sélectionnez-la dans le cadre gauche de la fenêtre,
à partir de l'aperçu de l'image originale.
Vous pourrez ainsi délimiter précisément le texte à extraire
et exclure les éléments perturbateurs (bordures, images, …).







Extraire le texte d'un fichier PDF

Vous avez récupéré un PDF, FreeOCR peut vous aider à extraire
le texte de ce document pour pouvoir
le retravailler dans votre traitement de texte habituel.

Lancez FreeOCR
en double cliquant sur son icône sur le bureau.

freeocr

Cliquez sur le bouton Open PDF

freeocr

Sélectionnez sur votre disque dur le document PDF
dont vous souhaitez extraire le texte.
Cliquez sur le bouton Ouvrir

freeocr

Cliquez sur la croix rouge
pour effacer le texte précédemment reconnu.

freeocr

Vérifiez que la langue française soit bien sélectionnée.

freeocr

Sélectionnez le passage à examiner.
Vous pouvez utiliser les flèches pour passer
d'une page à une autre du document PDF.

freeocr

Cliquez sur le bouton OCR.

freeocr

Le résultat est affiché dans le cadre droit de la fenêtre.
Vous pouvez alors copier le texte reconnu dans le logiciel
de votre choix (Word par exemple)
ou l'enregistrer dans un fichier texte en utilisant
les contrôles au centre de la fenêtre.

freeocr

vous pouvez ensuite corriger les éventuelles erreurs
dans votre traitement de texte.

freeocr

texte corrigé dans Word

freeocr





Extraire le texte d'un document scanné


Pour reconnaitre le texte d'un document papier,
vous pouvez le scanner sous la forme d'une image
puis l'importer ensuite dans FreeOCR.
Vous pouvez également laisser FreeOCR le numériser pour vous.

Lancez FreeOCR
en double cliquant sur son icône sur le Bureau.

freeocr

Cliquez sur le bouton Scan

freeocr

Sélectionnez votre scanner dans la liste
et cliquez sur le bouton Sélectionner

freeocr

Numérisez votre document,
comme vous le faites habituellement.

freeocr

Une fois scanné, le document est importé dans FreeOCR.

freeocr

Cliquez sur la croix rouge
pour effacer le texte précédemment reconnu.

freeocr

Vérifiez que la langue française est bien sélectionnée.

freeocr

Sélectionnez le passage à examiner
puis cliquez sur le bouton OCR
pour lancer la reconnaissance.

freeocr

Le résultat est affiché dans le cadre droit de la fenêtre.
Vous pouvez alors copier le texte reconnu
dans le logiciel (Word par exemple) de votre choix
ou l'enregistrer dans un fichier texte
en utilisant les contrôles au centre de la fenêtre.

freeocr

Vous pouvez ensuite corriger les éventuelles erreurs
dans votre traitement de texte.

freeocr

Texte corrigé.

freeocr




Améliorer la pertinence de la reconnaissance

Vous avez sans doute remarqué que des erreurs viennent
souvent se glisser dans les reconnaissances de FreeOCR.
Suivez ces conseils pour limiter les erreurs
et améliorer la reconnaissance des caractères.

Numérisez vos documents en noir et blanc,
dans une précision entre 200 et 300 dpi.

Faites pivoter vos images afin que le texte soit horizontal.

Sélectionnez la partie à extraire en excluant tout ce qui
n'a aucun rapport avec du texte : les bordures, les images, ...

N'hésitez pas à travailler sur plusieurs petites parties :
d'abord le titre, un paragraphe, un second, etc.

Si un texte se trouve sur plusieurs colonnes,
travailler sur chaque colonne, en les sélectionnant
les unes après les autres.

La commande Adjust image constrast du menu OCR
vous permet d'augmenter le contraste afin de faire ressortir le texte.
N'hésitez pas à l'utiliser sur les images au texte clair.

Valid CSS!

Valid XHTML 1.0 Transitional

RETOUR