Traitement multiechelle
Wafa Boussellaa 1 − Abderrazak Zahour 2 − Bruno Taconet 2 − Abdellatif Benabdelhafid 2− Adel Alimi1
REsearch Group on Intelligent Machines (REGIM) Université de Sfax, ENIS, DGE, BP. W-3038 - Sfax – Tunisie Université du Havre, IUT du Havre, Place Robert Schuman, F-76 610 Le Havre Wafa.boussellaa@gmail.com, adel.alimi@ieee.org {abderrazak.zahour, bruno.taconet,benabdelhadid} @benuniv-lehavre.fr Résumé : Cet article présente une nouvelle méthode de segmentation d’images de documents couleur de type manuscrits arabes anciens. La méthode développée opère directement sur la luminance. L’analyse multiéchelle permet une séparation entre le fond et l’avant plan. Des caractéristiques statistiques ont extraites de l’avant plan obtenue et sont utilisées par l'algorithme de classification c-moyen floue pour la segmentation texte/graphique de l’avant plan. Notre méthode a été testée sur 50 images de documents manuscrits rares, à structure complexe, extraits d’une base de 2000 manuscrits de la Bibliothèque Nationale Tunisienne. Les tests menés montrent des résultats satisfaisants pour la segmentation avant/arrière plan. La segmentation de l’avant plan en texte/graphique reste à améliorer. Mots-clés : Segmentation, ondelettes, c-moyen floue, fond/texte/graphique, manuscrit arabe ancien.
2
1
1 Introduction
Les ouvrages anciens conservés dans la bibliothèque nationale de la Tunisie forme une bonne partie de son patrimoine culturel et scientifique. Le traitement automatique de ces documents en vue de leur restauration, indexation et exploitation offre un avantage certain. Cependant, on est confronté à de nombreuses difficultés dues au mauvais état de conservation de ces manuscrits et à la complexité de leur contenu. Les manuscrits composés de texte et de graphique forment une collection rare. Ils sont à structure complexe et ont de nombreuses particularités qui mettent en échec les algorithmes