Statistiques terminale

Disponible uniquement sur Etudier
  • Pages : 6 (1360 mots )
  • Téléchargement(s) : 0
  • Publié le : 14 décembre 2011
Lire le document complet
Aperçu du document
Chapitre VII : Les statistiques I. Point moyen – Covariance Sur une population donnée, étudions deux caractères. Pour chacun des n individus de cette population, notons xi et yi les valeurs prises par chacun de ces caractères, et présentons les données à l’aide de la série statistique à deux variable suivante : Valeur xi x1 x2 … xn Valeur yi y1 y2 … yn a) Nuage de points - Point moyen Définition: Dans un repère orthogonal, l’ensemble des points Ai de coordonnées (xi ; yi) (avec 1  i  n) est appelé le nuage de points associé à cette série statistique à deux variables. 1 1 n Notons x = (x1 + x2 + … + xn) =  xi n n i=1 et 1 1 n y = (y1 + y2 + … + yn) =  yi . n n i=1

Définition : Le point G de coordonnées ( x ; y ) est appelé le point moyen du nuage de points associé à cette sériestatistique à deux variables. Obtention des coordonnées du point moyen grâce à la calculatrice : Texas Instrument (TI – 80) Casio Graph 25 Dans le menu STAT, entrer les valeurs de x dans STAT 1 : Edit… permet d’entrer les valeurs List 1, puis celles de y dans List 2. de x dans L1, puis celles de y CALC dans L2 STAT CALC 2 : 2-VAR Stats puis SET , entrer dans 2VarXList : List 1 2VarYList : List 2 (2nd L1 , 2nd L2 ) ENTER EXE puis Calc 2-Var Ceci nous donne x et y . On obtient alors x et y . Exemple : La série statistique double suivante indique les notes mensuelles d’un élève au cours des cinq premiers mois de l’année scolaire numérotés de 1 à 5. Mois xi 1 2 3 4 5 note yi 8 9 12 12 13

y

x =3

x = 3 et y = 10,8 donc le point moyen G du nuage représenté ci-dessus a pour coordonnées (3 ;10,8).

b) variance - covariance Pour étudier la dispersion de chaque variable x et y, on peut calculer leurs variances : 1 n 1 n 1 n 1 n Vx =  (xi – x )² = n  xi² – ( x )² et Vy = n  (yi – y )² = n  yi² – ( y )² n i=1 i=1 i=1 i=1 Mais il est utile d’introduire une quantité qui fasse intervenir à la fois les valeurs de x et de y. Définition : On appelle covariance de x et y le nombre : 1n  1 n Cx y =  (xi – x )(yi – y ) =   xi yi – x y . n n   i=1  i=1 La seconde expression est plus commode pour les calculs à la main. 1  Dans l’exemple précédent, Cx y = (1  8 + 2  9 + 3  12 + 4  12 + 5  13) – 3  10,8 5 = 35 – 32,4 = 2,6. II. Ajustement affine par la méthode des moindres carrés Lorsque les points du nuage paraissent presque alignés, on peut chercher une relation dela forme y = ax + b qui exprime de façon approchée y en fonction de x, autrement dit, une fonction affine f telle que l’égalité y = f(x) s’ajuste au mieux avec les données. Graphiquement, cela signifie qu’on cherche une droite qui passe au plus près de tous les points du nuage. Une telle relation permettrait notamment de faire des prévisions. Pour mesurer la qualité d’une telle formule, onconsidère, pour chaque valeur xi, la différence entre la valeur observée, c’est à dire yi, et la valeur calculée par la formule, c’est à dire axi + b. On souhaite que toutes les différences : yi – axi – b appelées erreurs, ou résidus, ou perturbations, soient les plus petites possible. La méthode la plus couramment employée, dite méthode des moindres carrés, consiste à choisir a et b de façon que lasomme des carrés des résidus soit la plus petite possible. On considère par la suite un nuage de points Ai(xi ; yi) (avec 1  i  n). Définition : Il existe une droite unique associée au nuage de points Ai (xi ; yi), avec i = 1, 2, …, n , telle que la somme S des AiPi² soit minimale.  Cette droite passe par le point moyen G( x , y ) du nuage.  Elle a une équation y = ax + b avec a = Cx y et b = y –a x . Vx

Définition : Cette droite s’appelle la droite de régression de y en x. Utilisation de la calculatrice pour la détermination de l’équation de la droite de régression : Texas Instrument (TI – 80) Casio Graph 25 Dans le menu STAT, entrer les valeurs de x dans STAT 1 : Edit… permet d’entrer les valeurs de List 1, puis celles de y dans List 2. x dans L1, puis celles de y CALC dans L2...
tracking img