Nisrine
Orange est un logiciel libre d'exploration de données (data mining). Il propose des fonctionnalités de modélisation à travers une interface visuelle, une grande variété de modalités de visualisation et des affichages variés dynamiques1. Développé en python, il existe des versions Windows, Mac et Linux.
ORANGE est développé par le Laboratoire d’Intelligence Artificielle de l’Université de Ljubljana, en
Slovénie (http://www.ailab.si/orange/). Il peut être utilisé de deux manières : via la filière, avec le schéma composants – lien entre composant (Figure 3) ; ou via des scripts en Python. Il est donc possible de programmer des analyses complexes, avec des vraies structures algorithmiques.
Pour qu’ORANGE fonctionne correctement, la machine virtuelle (l’interpréteur) Python doit être présente sur la machine. Le programme d’installation du logiciel gère cela très bien.
Figure 3 : Apprentissage et évaluation d’un arbre de décision sous ORANGE
ORANGE est clairement d’obédience « machine learning ». On y retrouve essentiellement la trilogie : méthodes supervisées, non supervisées et règles d’association. Particularité intéressante, il intègre des outils graphiques exploratoires interactifs, il est possible par exemple de sélectionner des individus dans un nuage de points et obtenir automatiquement la liste correspondante dans une grille de données.
Classification :
Induction de modèles à Orange est mis en œuvre par le biais d'un schéma à deux classes. Un algorithme d'apprentissage est représentée par une instance d'une classe dérivée de Orange.classification.Learner. L'apprenant enregistre tous les paramètres de l'algorithme d'apprentissage. Modèles induits sont représentés par des instances de classes dérivées de Orange.classification.Classifier.
Par conséquent, pour induire des modèles de données, il faut d'abord construire l'instance qui représente un algorithme d'apprentissage (TreeLearner, par exemple) et réglez ses paramètres. Appel