régression

Pages: 6 (1367 mots) Publié le: 17 février 2014
 Régression Linéaire Simple
Prédire les valeurs d’une variable dépendante « Y » à partir des valeurs prises par une autre variable indépendante « X »
Etape D’une étude de régression :
1- Spécification du modèle :
Soupçonner la relation (Diagramme de dispersion - nuage de point) et voir la forme

2- Validation du modèle :
Le vérifier dans saglobalité, Coefficient de Détermination avec ANOVA.


3- Estimation des paramètres :
Estimer le modèle théorique par le modèle empirique par la méthode des moindres carrés . (Construire d’une droite de régression empirique qui minimise la somme des carrés de l’écart empirique (résidu)).

4- Test d’hypothèse :
Pour vérifier l’influence de X, on procède à un test d’hypothèse sur , opterpour des extrapolations.

Il existe 3 mesures possibles pour quantifier l’intensité de la relation entre X et Y :

-Coefficient de Détermination [(proche de 1) => (Droite de régression s’ajuste très bien au nuage de point)]
-Coefficient de corrélation
-Covariance entre X et Y











Régression Linéaire Multiple :
Nous voulons savoirsi les variables indépendantes influencent la variable dépendante, on choisit la méthode d’entrée (forcée) pour la 1ère étape, et la méthode ascendante pour la 2ème étape.
On regarde s’il y’a une corrélation élevée et significative entre « Variable dépendante & variable indépendante », et « variables indépendantes entre eux »
=> Multi colinéarité (2VI mesurent la même chose pour prédire Y).Ceci est communiqué dans le tableau de corrélation (Analyse=>Régression et on fait entrer les variables).
Etape 1 : Evaluation de la pertinence du modèle :
Prendre une décision sur l’hypothèse nulle grâce au tableau d’Anova
Seuil de signification, l’erreur admise, donc si Anova nous donne une valeur supérieure
=> On rejette le modèle.
Ça veut dire que Beta est comprise entre deux grandeurs designes opposés = (prendre valeur de 0)
Au cas contraire = [(Sig Anova) < (Sig 1% ou 5%)], on rejette l’hypothèse nulle, on dit que les valeurs de F (365,381 & 225,505) sont significatives.


Etape 2 : Evaluation de l’ajustement du modèle
Maintenant que le modèle est significatif, on regarde si ce dernier est ajusté et adapté aux données observées

La valeur de la corrélation multiple (R)nous renseigne sur l’ajustement du modèle. Cet indice varie entre 0 et 1 et représente en valeur absolue la corrélation entre la variable dépendante et la combinaison de toutes les variables indépendantes du modèle.
=> Plus la valeur de R est proche de 1, plus le modèle est ajusté aux données. Dans notre exemple, le modèle final a une valeur de R de 0,70 ce qui est relativement élevé et quisuggère que le modèle est bien ajusté.
Étape 3 : Évaluation de la performance du modèle de régression
Le tableau permet également d’évaluer la performance du modèle en termes de proportion de la variance expliquée par la combinaison des variables indépendantes avec le calcul de la valeur de R². (Variabilité de Y expliquée par le modèle)
Étape 4 : Estimation des paramètres du modèle
Maintenant quele modèle est significatif, on peut prédire une valeur de Y.
Lorsque la VI augmente d’un écart-type, la VD augmente de son écart-type*Béta, et les autres sont constantes.
L’erreur standard nous renseigne sur la variabilité du coefficient dans la population.

Finalement, la valeur VIF ou la tolérance (qui est l’inverse du VIF) permet de vérifier la prémisse de multi colinéarité. Nous cherchonsà obtenir une valeur VIF près de 1. Si elle est de 10, c’est problématique. Inversement, si la valeur de la tolérance est équivalente à 0,1, il y a un problème sérieux de colinéarité dans le modèle. Probablement que les corrélations entre 2 VI ou plus sont trop élevées. 


Remarque : Pour rejeter une variable, on compare aussi sa Sig avec le seuil choisi, 5% généralement.
Pic => Le point...
Lire le document complet

Veuillez vous inscrire pour avoir accès au document.

Vous pouvez également trouver ces documents utiles

  • La régression multiple
  • Analyse de la regression
  • Regression linéaire
  • Regression multiple
  • Statistique régression
  • Régression logistique
  • La régression multiple
  • L'analyse de régression

Devenez membre d'Etudier

Inscrivez-vous
c'est gratuit !