Logiciel OCR : aperçu des programmes de reconnaissance de texte

Des notes griffonnées ou la rubrique sportive d’un journal imprimé : lorsqu’il s’agit de traiter des informations humaines analogiques, chaque ordinateur atteint un jour ses limites. C’est là que la reconnaissance optique de caractères (ROC) …

Logiciel OCR : aperçu des programmes de reconnaissance de texte

Texterkennung mit Lupe
  1. Magazine
  2. »
  3. Article
  4. »
  5. Logiciel
  6. »
  7. Logiciel OCR : aperçu des programmes de reconnaissance de texte

Des notes griffonnées ou la rubrique sportive d’un journal imprimé : lorsqu’il s’agit de traiter des informations humaines analogiques, chaque ordinateur atteint un jour ses limites. C’est là que la reconnaissance optique de caractères (ROC) entre en jeu : elle reconnaît automatiquement les textes des documents et des images scannés, de sorte que ceux-ci puissent être numérisés et traités . Dans cet article, nous vous expliquons comment fonctionne la reconnaissance de texte et nous vous présentons un aperçu des meilleurs logiciels OCR.

  • La reconnaissance optique des caractères permet de convertir des documents imprimés en fichiers texte consultables et éditables.
  • Les programmes OCR travaillent généralement avec des dictionnaires et sont ainsi en mesure d’identifier différentes langues.
  • Un bon logiciel de reconnaissance de texte ne doit pas automatiquement être cher. Il existe également de nombreux logiciels gratuits sur Internet qui permettent d’obtenir d’excellents résultats.

1. qu’est-ce qu’un logiciel OCR et comment fonctionne-t-il ?

Mit OCR-Software vom Schreibblock auf den Computer.
Avec un logiciel OCR, vous transférez vos textes du bloc-notes à l’ordinateur.

OCR signifie „Optical Character Recognition“ (traduit en français par „reconnaissance optique de caractères“) et est généralement simplement appelé „reconnaissance de texte“ en français. Il s’agit d’une technologie qui permet de numériser des documents manuscrits ou imprimés (comme des pages scannées ou des cartes de visite). Le texte peut ensuite être recherché électroniquement, édité ou enregistré dans un format plus compact .

Pour que les informationsdes documents papier puissent être traitées par l’ordinateur, il ne suffit pas de les numériser. Dans ce cas, il ne s’agirait en effet que d’une copie d’image (ce que l’on appelle un graphique tramé) du document d’origine. C’est là qu’intervient le logiciel OCR : il assemble l’ensemble des points noirs et blancs en plusieurs étapes pour former des mots et des phrases logiques. L’image devient ainsi un fichier modifiable et interrogeable, que vous pouvez appeler depuis votre disque dur ou en ligne via le cloud et traiter à l’aide d’un programme de traitement de texte .

C’est bon à savoir : Le texte intégral de l’OCR est également nécessaire pour la classification de documents (non structurés). Pour cela, le logiciel reconnaît les attributs, les données ainsi que les différentes catégories d’un document et détermine automatiquement son type à l’aide de ces éléments.

2) Comparaison des meilleurs logiciels de reconnaissance de texte pour 2019

Il n’y a pas si longtemps, les logiciels OCR étaient encore très chers et compliqués à utiliser. Aujourd’hui, ils font partie depuis longtemps des outils de productivité et il existe également un grand choix de programmes performants à un prix adéquat pour les utilisateurs privés. Dans cette section, nous avons rassemblé pour vous les meilleurs programmes de reconnaissance de texte , du freeware à l’outil professionnel.

2.1. FreeOCR

FreeOCR est un programme de reconnaissance de texte gratuit pour Windows, basé sur le moteur d’OCR open source Tesseract. L’outil reconnaît le texte des fichiers PDF et TIFF et peut également ouvrir des documents scannés et les formats d’image courants (p. ex. BMP, JPEG, GIF ou PNG). Lors de la numérisation, seul le texte est pris en compte, le formatage est ignoré. Les fichiers de sortie sont affichés dans une fenêtre et peuvent être édités à partir de là, copiés dans le presse-papiers, enregistrés au format RTF ou exportés directement dans Microsoft Word. Outre les textes en allemand, FreeOCR peut également reconnaître les contenus en anglais, en espagnol ou en français.

FreeOCR Screenshot der Bentuzeroberfläche
Clair et bien structuré : L’interface utilisateur de FreeOCR.

Bon à savoir : Tesseract prend en charge de nombreuses langues et systèmes d’écriture, dont par exemple de nombreuses écritures fractales asiatiques. Si un pack de langue n’est pas encore inclus dans FreeOCR, il suffit de l’installer sur le site de Tesseract. Le fabricant fournit également les instructions correspondantes.

Pour la numérisation du texte, l’outil utilise la reconnaissance de formes. Vous pouvez également sélectionner des passages ou des extraits. C’est très utile, par exemple, si vous souhaitez exclure certaines parties de texte d’une page.

2.2. Abbyy FineReader

Abbyy FineReader est une solution complète et performante qui permet de traiter de manière globale la correspondance papier dans les entreprises. L’application offre de nombreuses fonctions, telles que des outils de numérisation et de conversion et différents outils OCR, qui permettent de numériser et de gérer les documents sans avoir recours à des logiciels supplémentaires. Le logiciel de reconnaissance de texte s ‚intègre dans toutes les applications Microsoft Office et fournit une vue originale des documents reconnus à Word.

Abbyy FineReader OCR-Software Scan
Abbyy FineReader est un programme PDF avec une fonctionnalité OCR intégrée.

L’outil est équipé d’une ADTR („Adaptive Document Recognition Technology“) qui reconstruit la structure et le formatage des documents de plusieurs pages et les reproduit dans le nouveau fichier texte. Ainsi, selon le fabricant, la saisie et le reformatage devraient à l’avenir appartenir au passé. FineReader prend en charge 189 langues et de nombreux formats tels que PDF, HTML, DOC/DOCX, RTF, Word XML, DBF, CSV, TXT ou ODT. Il permet également d‘extraire des textes d’images. Vous pouvez ensuite les modifier à l’aide des outils intégrés, par exemple en réglant le contraste et la luminosité ou en supprimant le flou de mouvement et le bruit ISO.

Abbyy FineReader Bearbeitungsmöglichkeiten
Le programme convertit les documents en fichiers PDF et PDF/A interrogeables pour l’archivage à long terme.

Une autre fonctionnalité pratique est également l’option de mise en place de macros et de tâches automatisées qui vous permettent par exemple d’effectuer plus rapidement des tâches répétitives ou d’attribuer des emplacements individuels aux documents.

La version actuelle d’Abbyy FineReader est disponible en trois versions

  • Standard
  • Corporate
  • Enterprise (licences en volume)

sont proposées. Celles-ci se distinguent surtout au niveau des processus de conversion et des possibilités d’automatisation.

2.3 OmniPage Ultimate

Le scanner de texte OmniPage Ultimate s’adresse lui aussi avant tout aux entreprises grâce à ses fonctions de conversion et à sa connexion au cloud. L’application dispose d’une très grande précision OCR et reconnaît l’ensemble de la mise en page, qu’elle contienne des tableaux, des colonnes, des graphiques ou des numérotations. L’outil prend en charge toutes les applications bureautiques courantes et plus de 120 langues différentes. Pour la numérisation, vous pouvez utiliser n’importe quel scanner du commerce (avec pilote TWAIN, WIA ou ISIS) ou , alternativement, photographier les documents.

https://www.youtube.com/watch?v=7N-6n_ffGco

OmniPage Ultimate dispose en outre de nombreuses autres fonctionnalités, telles que la mise en évidence de certains passages à l’aide d’une sélection de mots-clés ou le biffage automatique de certaines parties de texte (p. ex. données personnelles). Il suffit d’effectuer une seule fois les réglages pour que l’outil se souvienne des données que vous avez saisies.

OmniPage Ultimate peut traiter des fichiers image aux formats TIFF, PCX, DCX, BMP, JPG, GIF, PNG et MAX et décrypte également les fichiers PDF.

Très pratique : grâce à la technologie vocale intégrée, vous pouvez même faire lire vos documents sur des appareils compatibles MP3.

2.4 ReadIris

ReadIris est un logiciel OCR qui marque des points surtout grâce à son interface utilisateur simplifiée et à son grand confort d’utilisation. L’accent est mis sur les quatre fonctions principales

  • Importer
  • Organiser
  • Convertir
  • Traiter

Les champs correspondants vous redirigent vers la fonction correspondante. Quelques clics suffisent ensuite pour exécuter les différentes étapes.

Die OCR-Software ReadIris unterstützt viele Sprachen
ReadIris prend en charge plus de 130 langues, dont le russe et l’arabe.

ReadIris prend en charge plus de 130 langues (dont le russe, le chinois et l’arabe) convertit des images, des fichiers PDF, des documents MS-Office et des fichiers numérisés et les transforme à la demande en PDF, XLSX, DOCX, ODT, ePub, RTF, HTML, TXT, TIFF, JPEG, PNG ou audio. La mise en page originale du fichier est conservée lors de la conversion.

Le fabricant propose le logiciel dans les trois versions PDF, Pro et Corporate, cette dernière étant la seule à disposer de fonctions supplémentaires telles que la protection et la signature de PDF ou le traitement par lots de documents. Les trois variantes sont toutefois dotées de fonctions d’édition pratiques telles que la post-exposition ou la suppression des taches , qui permettent d’améliorer sensiblement la qualité des documents numérisés.

Screenshot von ReadIris Corporate
Dans ReadIris Corporate, vous pouvez également ajouter des signatures numériques à vos documents
.

ReadIris possède en outre son propre module de numérisation et est donc compatible avec tous les scanners TWAIN (par exemple de Brother, Canon ou HP), même sans logiciel externe. Il existe une version Windows et une version Mac du logiciel OCR.

Conseil : si vous travaillez avec Google Docs, vous n’avez pas besoin d’un logiciel OCR supplémentaire, car la solution de bureau en nuage comprend également un convertisseur gratuit. Pour appliquer la reconnaissance de texte en ligne, il suffit de télécharger le document souhaité dans Google Drive et de cliquer avec le bouton droit de la souris sur le nom du fichier, puis de sélectionner „Ouvrir avec -> Google Docs“ dans le menu contextuel. Un document Docs est ainsi créé (dans le même répertoire) et la fonction OCR lui est automatiquement appliquée.

Articles similaires