My doc
Dans le cadre probabiliste, il n’existe pas `a proprement parler de r´esultats d’apprenabilit
´e ´equivalents. Le seul que nous pouvons citer concerne la possibilit´e d’apprendre des automates d´eterministes stochastiques `a partir d’un ´echantillon caract´eristique et des requˆetes d’´equivalence [57].
Nos exp´erimentations montrent que l’utilisation d’une r`egle de fusion plus restrictive semble plus appropri´ee pour g´erer des donn´ees bruit´ees. Ce comportement peut s’expliquer par le fait qu’en utilisant un test plus restrictif, on a tendance `a isoler les branches bruit´ees du reste de la distribution. Nous pouvons ´evidemment remarquer que le nombre d’exemples joue un rˆole important (comme dans toute approche statistique d’ailleurs). En effet, dans tous les tests appliqu´es, les bornes utilis´ees pour la r`egle de d´ecision prennent en compte le nombre d’exemples au niveau du d´enominateur des fractions consid´er´ees. Lorsque le nombre d’exemples est infini, les bornes tendent vers
0 et le test n’autorise la fusion que si les ´el´ements compar´es sont exactement ´egaux. Deux ont d´ej`a ´et´e ´etudi´ees pr´ec´edemment (Stacks et Bool), une troisi`eme – Art – a
´et´e g´en´er´ee par un automate que nous avons construit. Pour les exp´erimentations o`u l’automate cible est inconnu, nous avons exploit´e cinq bases. Nous avons r´eutilis´e les trois bases pr´ec´edentes. Nous y avons ajout´e un ´echantillon provenant du PKDD’02
Discovery Challenge 3 (converti en arbres comme d´ecrit dans [94]), ainsi que la base
Student Loan de l’UCI Irvine, repr´esent´ee initialement