Tp sur r

Disponible uniquement sur Etudier
  • Pages : 5 (1115 mots )
  • Téléchargement(s) : 0
  • Publié le : 23 février 2011
Lire le document complet
Aperçu du document
TP 7
Analyse univariée de l’ensemble des notes :
Toutes les variables sont quantitatives et sont les noms de chaque matière auxquelles on étudie les notes pour chaque observation. Nous avons 72 observations et 13 variables. Pour Anova, Maths et Eco nous avons environ une moyenne de 11. Pour les sondages et l’ADD on a une moyenne de 9.5 environ, de 8 en test, 4 en programmation WEB et 13 environen études de cas R, Exposé de communication, en Anglais, en PT et stage.

Pour une meilleure analyse de la base de données, il a fallu regrouper les notes de BD Objet avec les notes de maths, ce qui enlève les valeurs manquantes dans la variable créée Option. Nous obtenons ce graphique : Cependant, il y a un souci dans les données, des élèves ont une note autant en DB objet qu’en maths, ce quicumule leur note dans la variable Option.

La classe modale est [12 ; 14]. L’ensemble des notes des options se concentrent autour de cette même classe.

La classe modale des notes d’économie est [8 ; 10]. L’ensemble des notes se concentre autour de cette classe.

Analyse bivariée
> cor(notes$Anova,notes$ADD) [1] 0.5551829 > cor(notes$ExpCom,notes$EtudeCasR) [1] 0.4093381 >cor(notes$Sondages,notes$Test) [1] 0.5387748 Pour ces trois correlations on se rend compte que les variables Anova et ADD, ExpCom et EtudesCasR, Sondage et Test semblent plutôt corrélées.

On trouve une confirmation du lien entre ADD et Anova car plus les notes d’Anova augmentent et plus les élèves ont des notes élevées en ADD => relation linéaire.

Nuage de point 2 à 2 :

On remarque que les notes deprojet n’ont pas de lien linéaire avec les autres matières, de même pour les notes de stage. En effet, les calculs de coefficient de corrélation le démontre bien. > cor(notes$Stage,notes$Option) [1] -8.814005e-05 > cor(notes$Stage,notes$EtudeCasR) [1] 0.1342189 > cor(notes$PT,notes$Sondages) [1] 0.1834435 > cor(notes$PT,notes$Eco) [1] 0.2284890

On ne remarque pas d’éventuel lien entre les notesde stage et les notes d’option.

Analyse en composantes principales

La représentation de ces deux axes concentre environ 42 % des observations ce qui est assez léger. Seulement deux variables semblent vraiment corrélées avec les 2 axes, ce sont les notes de Maths et

d’Option. Toutes les variables se placent à droite de l’axe vertical. Les notes de Sondage, de Test, d’ADD, d’Anova semblentcorrélées positivement avec l’axe vertical. Les variables des notes de communication et de l’étude de cas sur R sont très corrélées, tout comme ADD et Anova, ainsi que Sondage et Test. Pour répondre à la question de l’énoncé, Stage, PT, BD objet ne sont pas du tout liées avec aucunes variables, contrairement à celles de dessus.

Le choix des composantes
eigenvalue 4.1699676 1.6686123 1.45493491.0647422 0.9871834 0.9170699 0.8904913 0.7016291 0.4957180 0.4766128 0.4189668 0.3324756 0.2839420 percentage of variance 29.7854829 11.9186592 10.3923919 7.6053016 7.0513101 6.5504996 6.3606521 5.0116363 3.5408430 3.4043772 2.9926198 2.3748254 2.0281572 cumulative percentage of variance 29.78548 41.70414 52.09653 59.70184 66.75315 73.30365 79.66430 84.67593 88.21678 91.62115 94.61377 96.9886099.01676

comp 1 comp 2 comp 3 comp 4 comp 5 comp 6 comp 7 comp 8 comp 9 comp 10 comp 11 comp 12 comp 13

Les quatre premières composantes vont nous servir pour la suite de l’étude, nous ne retiendrons que celles-ci puisque d’après le graphique ci-dessous, le quatre premières composantes sont les seuls qui sont supérieures à 1.

Méthode de Kaiser :

Méthode du coude

D’après cegraphique, en gardant les 4 composantes on fait une représentation d’environ 60%.

Contribution des variables
Axe 1
Positivement : Anova (13), Sondages(13), ADD(13), Test(14), Maths (10) Négativement : 0

Axe 2
Positivement: Etudes de cas R (14), ExpCom (17) Négativement: Maths (26), option (28)

Axe 3
Positivement: Anova (juste=>8), BD objet (21), ExpCom (12), PT (13), Négativement: Stage (29)...
tracking img