Univer

Disponible uniquement sur Etudier
  • Pages : 12 (2831 mots )
  • Téléchargement(s) : 0
  • Publié le : 2 août 2011
Lire le document complet
Aperçu du document
Université de Tunis
Institut Supérieur des Métiers du Patrimoine

Rapport de stage de fin d’études
Effectué à l’INP
Création d’une Bibliothèque Numérique

Réalisé par : Salhi Abir
Encadré par : Monsieur Ali Dabbaghi

Année universitaire 2010-2011

Un article de Wikipédia, l'encyclopédie libre
Reconnaissance optique de caractères , généralement abrégé en OCR ,la mécanique ou électronique traduction de numérisés images de manuscrits ou imprimés en texte dactylographié-texte codé machine. Il est largement utilisé pour convertir des livres et des documents en fichiers électroniques, d'informatiser un système de tenue de dossier dans un bureau, ou de publier le texte sur un site Web. OCR permet de modifier le texte, rechercher un mot ou une phrase, le stocker de manière pluscompacte, afficher ou imprimer un exemplaire gratuit d'objets d'analyse, et d'appliquer des techniques telles que la traduction automatique , text-to-speech et de text mining pour l'. OCR est un domaine de recherche en reconnaissance des formes , l'intelligence artificielle et vision par ordinateur .
systèmes de reconnaissance optique de caractères doivent être calibrés pour lire un spécifique de lapolice ; les premières versions doivent être programmées avec des images de chaque personnage, et a travaillé sur une police à la fois. Systèmes «intelligents» avec un haut degré de précision de la reconnaissance pour la plupart des polices sont désormais monnaie courante.Certains systèmes sont capables de reproduire des fichiers de sortie qui se rapproche de l'original scanné page y compris lesimages, colonnes et autres éléments non-textuels.
Table des matières [ cacher ] * 1 Histoire * 2 logiciels OCR * 3 L'état actuel de la technologie OCR * 4 Voir aussi * 5 Références * 6 Liens externes |
[ modifier ]Historique
En 1929, Gustav Tauschek a obtenu un brevet sur ​​la reconnaissance optique de caractères en Allemagne, suivie par Paul W. Handel qui ont obtenu un brevetaméricain sur OCR aux Etats-Unis en 1933 ( brevet US 1,915,993 ). En 1935 Tauschek a également obtenu un brevet américain sur sa méthode ( brevet US 2,026,329 ). la machine a été Tauschek un dispositif mécanique qui utilise des modèles et un photodétecteur .
en 1949 RCA ingénieurs ont travaillé sur la primitive OCR ordinateur de type premier à aider les personnes aveugles pour la VeteransAdministration des États-Unis, mais au lieu de convertir les caractères imprimés en langage machine, leur appareil a converti en langage machine et a ensuite parlé des lettres. Il s'est avéré beaucoup trop cher et n'a pas été poursuivi après le test. [ 1 ]
En 1950 , David H. Shepard , un cryptanalyste à l' Agence des forces de sécurité armés dans les Etats-Unis , a abordé le problème de la conversion demessages imprimés en langage machine pour le traitement informatique et construit une machine pour ce faire, présenté dans Le Quotidien Nouvelles Washington le 27 avril 1951 et dans le New York Times le 26 Décembre 1953, après son brevet US 2.663.758 a été délivré. Shepard a ensuite fondé sur les machines intelligentes Research Corporation (IMR), qui a enchaîné en présentant une première mondialeles systèmes OCR plusieurs utilisé dans l'exploitation commerciale.
» en 1955 Le premier système commercial a été installé au Reader's Digest . Le second système a été vendu à la Standard Oil Company pour la lecture de carte de crédit empreintes des fins de facturation. D'autres systèmes vendus par IMR au cours de la fin des années 1950 inclus un lecteur de talon de la facture à la Bell TelephoneCompany Ohio et d'un scanner la page à l' US Air Force Unies pour la lecture et la transmission par téléscripteur messages dactylographiés. IBM et d'autres ont ensuite été licencié sur OCR brevets de Shepard.
En 1965 environ Reader's Digest et RCA collaboré à la construction d'un document lecteur ROC conçu pour numériser les numéros de série sur les coupons de Reader Digest retour de la...
tracking img