Univer
Institut Supérieur des Métiers du Patrimoine
Rapport de stage de fin d’études
Effectué à l’INP
Création d’une Bibliothèque Numérique
Réalisé par : Salhi Abir
Encadré par : Monsieur Ali Dabbaghi
Année universitaire 2010-2011
Un article de Wikipédia, l'encyclopédie libre
Reconnaissance optique de caractères , généralement abrégé en OCR , la mécanique ou électronique traduction de numérisés images de manuscrits ou imprimés en texte dactylographié-texte codé machine. Il est largement utilisé pour convertir des livres et des documents en fichiers électroniques, d'informatiser un système de tenue de dossier dans un bureau, ou de publier le texte sur un site Web. OCR permet de modifier le texte, rechercher un mot ou une phrase, le stocker de manière plus compacte, afficher ou imprimer un exemplaire gratuit d'objets d'analyse, et d'appliquer des techniques telles que la traduction automatique , text-to-speech et de text mining pour l'. OCR est un domaine de recherche en reconnaissance des formes , l'intelligence artificielle et vision par ordinateur . systèmes de reconnaissance optique de caractères doivent être calibrés pour lire un spécifique de la police ; les premières versions doivent être programmées avec des images de chaque personnage, et a travaillé sur une police à la fois. Systèmes «intelligents» avec un haut degré de précision de la reconnaissance pour la plupart des polices sont désormais monnaie courante.Certains systèmes sont capables de reproduire des fichiers de sortie qui se rapproche de l'original scanné page y compris les images, colonnes et autres éléments non-textuels. Table des matières [ cacher ] * 1 Histoire * 2 logiciels OCR * 3 L'état actuel de la technologie OCR * 4 Voir aussi * 5 Références * 6 Liens externes |
[ modifier ]Historique
En 1929, Gustav Tauschek a obtenu un brevet sur la reconnaissance optique de caractères en Allemagne, suivie par Paul W. Handel qui ont obtenu un brevet