Estimation non paramétrique de la régression

Pages: 9 (2029 mots) Publié le: 18 avril 2011
Sandrine HENGA & Simon SAYAGH

Estimation non paramétrique de la régression

Master 1 Mathématiques Statistique et Applications

Avril 2011

I Introduction

En analyse de données, l’estimation non-paramétrique est souvent utilisée puisque les postulats concernant les résidus sont, dans ce cas là, toujours vérifiés, et puisque la décision de la relation entre la variableexplicative X et la variable dépendante Y est directement liée aux données.
Dans ce rapport nous allons nous attarder particulièrement aux méthodes d’estimation non-paramétrique de l’espérance conditionnelle. Le but général des techniques de régression étant de décrire les relations entre plusieurs variables dans un but prédictif, ceci à partir d'observations de ces variables.

Par opposition à lastatistique paramétrique, la statistique non paramétrique, le modèle n'est pas décrit par un nombre fini de paramètres. Divers cas de figure peuvent se présenter, comme par exemple:
-On autorise toutes les distributions possibles c'est à dire on ne fait aucune hypothèse sur la forme, nature ou le type de la distribution des variables aléatoires
-Le nombre de paramètres du modèle n'est pas fixé etvarie (augmente) avec le nombre de variables

Il s'agira de présenter pour quelques modèles et exemples simples, les idées principales de l'estimation non paramétrique par la méthode du noyau.

II Estimation de la régression

L’utilisation des modèles paramétriques est très fréquente lorsque l’on fait appel à la régression afin d’analyser un jeu de données. Or, il y a certaines situations oùces modèles ne sont pas appropriés et où le choix d’un modèle non paramétrique est préférable. Dans ce chapitre, nous étudierons la méthode du noyau, pour l’estimation non-paramétrique de la régression. Cette méthode est très pratique lorsque l’on s’intéresse à la relation entre une variable réponse Y et une variable explicative X, mais que l’on ne veut supposer aucune forme particulière pour larelation entre ces deux variables, laissant ainsi aux données le choix exclusif de cette forme.


1 . Estimation linéaire
On se place une situation mettant en jeu des observations bivariées (xi;yi) pour i=1,…,n , où les xi représentent les valeurs observées de la variable aléatoire explicative X et les yi celle de la variable aléatoire dépendante Y. La méthode la plus communément utilisée pourétudier la relation entre ces deux variables est la régression linéaire simple, qui suppose un modèle de la forme :
Yi = a + b Xi + εi pour i=1, … , n
Où les erreurs aléatoires εi sont non corrélées, de moyenne nulle et de variance σ2 .Cette méthode possède certains avantages : elle est facile à interpréter et, lorsque les postulats sur les résidus sont vérifiés, elle permet de faire destests d'hypothèses sur les paramètres. Par contre, il arrive que la linéarité de la relation ne soit pas toujours respectée. Dans ce cas il est alors préférable de choisir un modèle plus souple qui permet de mieux comprendre la relation entre X et Y.

2. Estimation non-linéaire

C'est le but de notre sujet qui est l'estimation non paramétrique de la régression représenté comme suit:
yi= m (xi) + εi pour i = 1, … , n
Où m (xi) représente l’espérance conditionnelle de la courbe de régression, c'est-à-dire m(x)=Е(Y│X=x ) , et où les résidus εi représentent la variation de Y autour de m(x).Les postulats sur les termes d'erreur εi sont les mêmes que ceux du modèle linéaire et, à part certaines hypothèses de continuité et de lissage il n'y a habituellement aucune contrainteassociée à m(x).

II La méthode du noyau
1. Description de la méthode
La méthode du noyau est une méthode qui est communément utilisée pour faire de la régression non paramétrique. Elle donne pour estimateur de Е(Y│X=x ) une moyenne pondérée des valeurs ! pour les i dont le point ! est près du point d’estimation. Pour appliquer cette méthode, il faut suivre les six étapes suivantes :
-Tout...
Lire le document complet

Veuillez vous inscrire pour avoir accès au document.

Vous pouvez également trouver ces documents utiles

  • Régression non paramétrique
  • Estimation non paramètriques
  • Tests Non paramétrique
  • Statistique non paramétrique
  • régression
  • estimation
  • Estimation
  • Les estimations

Devenez membre d'Etudier

Inscrivez-vous
c'est gratuit !