ZABOLOTNA MANDRYCHENKO Rapport
Le tableau reflet l'ensemble des produits de vin qui vont être présentés aux marché et foires russes à 2014 par un groupe. Le vin provient des domaines et régions viticoles différentes, ayant divers couleurs, types, cépages, taux d'alcool, certification de provenance et prix. Le but est d'analyse général d'ensemble de produits et la popularité selon la couleur, type, provenance, taux d'alcool et gamme de prix. La clé à déchiffrer tous les caractéristiques est citée au-dessous de tableau: les caractéristiques sont posé soit d'une extrémité jusqu'à autre (par exemple: de plus basse qualité - vin de France, jusqu'à plus haute - Grand Cru) soit, pour les régions viticole, contre le sens horaire de leur position en France: de la vallée de la Loire jusqu'à Alsace et vin du monde.
Pour chaque vin nous avons:
Couleur (blanc, rose, rouge)
Type (tranquil, mousseau)
Niveau de sucre (Sec, Demi sec, Moelleux)
Indication géographique (Vin de France, IGP, AOP, Grand Cru)
Région viticole (Vallée de la Loire, Bordeaux, Pays d'Oc, Provence, Vallée du Rhône/Jura, Bourgone/Beaujolais, Alsace, Etranger)
Taux d'aclool (selon pourcentage d'alcool)
Prix (moins de 3 eur, 3-9 eur, 10-15 eur)
2. Analyse des données
Pour importer des données das un R on doit utiliser vins<-read.table("fof.txt") commande:
vins<-read.table("fof.txt") commande
Puis on peux fair un histogramme de chacune des variables quantitative hist(vins). Cette histogramme peux montrer de distribution de chaque variable.
Pour calculer les caractéristiques des variables globalement et par espèce on doit utiliser summary(X) commande:
summary(X) commande
Nous utilisons ensuite la fonction boxplot ()pour montrer la médiane, la distribution. Cette graphique indique une relation entre variables, la première étantla variable à expliquer et la seconde la variable explicative:
boxplot(data)
Pour étudier l'intensité de la liaison qui peut exister entre Taux d’alcool, Prix, Niveau_qualité on calcule les