logiciel R

Disponible uniquement sur Etudier
  • Pages : 6 (1498 mots )
  • Téléchargement(s) : 0
  • Publié le : 21 juillet 2014
Lire le document complet
Aperçu du document
Cours 6 : Les statistiques avec R
XVII- Généralités
XVIII- Les formules
XIX- Les sorties
XX- Les fonctions génériques

XVII- Généralités
Fonctions d’analyse statistique disponibles

Package « stats » : contient les fonctions d'analyse statistique
classiques (tests d’hypothèses classiques, modèles linéaires,
distributions, résumés statistiques, séries temporelles, analysesmultivariées). Il est chargé au démarrage. Accessibles avec
library(help="stats")
Packages spécifiques : d'autres packages de méthodes statistiques
sont disponibles, distribués avec R ou à télécharger.
Exemples :
class : fonctions pour classification
boot : fonctions bootstrap
stats4: fonctions stats utilisant S4
survival : analyse de survie

XVII- Généralités
Quelques fonctions dans « stats »:Modélisation
SSlogis
aov
glm
lm
manova
ksmooth
step

Modèle logistique
Analyse de variance
Modèles linéaires généralisés
Modèles linéaires
Analyse de variance multivariée
Kernel Regression Smoother
Choix d’un modèle par l’algorithme Stepwise

Tests
bartlett.test
binom.test
chisq.test
cor.test
t.test
var.test
wilcox.test
ks.test

Test de Bartlett d’homogénéité de variancesTest Binomial exact
Test du Chi2
Test d’ Association/Correlation
t-Test de Student de comparaison de moyennes
F Test de Fisher de comparaison de Variances
Test de rang de Wilcoxon
Tests de Kolmogorov-Smirnov

XVII- Généralités
Estimation
density
ecdf

Estimation de densité par noyaux
Fonction de répartition empirique

Analyse des données
hclust
Classifications hiérarchiqueskmeans
Classifications par partitionnement
princomp
Analyse en composantes principales
prccomp
Analyse en composantes principales
dist
Calcul de matrices de distance

XVIII- Les formules
Syntaxe des principales fonctions : les formules
Certaines fonctions statistiques (en particulier les fonctions de
modélisation) travaillent sur des formules (?formula):
fonction (formula=, data =…)formula= de type réponse ~ prédicteurs
data= tableau de données éventuel dans lequel se trouvent
les variables dans la formule.
réponse = variable à expliquer
predicteurs=ensemble des variables explicatives, séparées par des
symboles arithmétiques qui ont ici une signification particulière.

XVIII- Les formules
Exemple de formules :
y~a : prédicteur a
y~a+b : prédicteurs a et b
y~M :autant de modèles que de predicteurs dans M (matrice)
y ~ x - 1 ( ou y ~ 0 + x) : modèle sans terme constant.
y~log(b)
y ~ a + I(b+c) : predicteurs a et (b+c)
y~a:b : interactions de a et b
y~a*b : a+b+a:b effets principaux et interaction entre a et b
y~(a+b)^2 : effets principaux a et b et interactions du second ordre
a+b+a:b
y=a*b-a:b : a+b

XVIII- Les formules
Exemples de fonctionstravaillant sur des formules
Exemple 1 : Régression linéaire simple (RLS) de y sur x ( x et y quantitatives)
>x=sample(s,200,replace=TRUE);y=3+7*x+rnorm(200,0,100)

> regression=lm(y~x)
Exemple 2 : Régression linéaire multiple (RLM) de la fertilité sur l’éducation

et la mortalité infantile (toutes les variables sont quantitatives)

> data(swiss)
>fit = lm(Fertility~Education+Infant.Mortality,swiss)
Exemple 3 : Analyse de variance à un facteur. Ici, analyse de l’effet du facteur
insecticide à 6 niveaux (spray) sur la réponse nombre d’insectes (count), basée sur
l’observation de 12 cultures, tour à tour pulvérisées par les 6 insecticides (la réponse
est quantitative, le facteur est un facteur)
> data(InsectSprays)
>anov=aov(sqrt(count) ~ spray, data = InsectSprays);anov XVIII- Les formules
Autres syntaxes : D’autres fonctions travaillent sur des matrices,
des vecteurs ou des data.frame (tests statistiques, analyse des
données)

XVIII- Les formules
Exemples de fonctions ne travaillant pas sur les formules
Exemple 4 : Test du chi2 : On veut tester le lien existant entre de variables
qualitatives X et Y à partir d’un échantillon sous forme de table de...
tracking img