Statistiques
Commentaire statistique de la distribution des âges
?
La distribution des âges s’étend de 17 à 25 ans. Elle croît régulièrement et rapidement entre 17 ans et l’âge modal de 19 ans (36 étudiants). Hormis la classe des « 20 ans » dont l’effectif de 35 est très proche du mode, elle présente ensuite une décroissance convexe de 20 à 24 ans. On constate un mode non significatif à 25 ans (3étudiants sur les 124 répondants).
Lecture sociologie de la distribution des âges
?
Cette répartition correspond bien à celle à laquelle on peut s’attendre en visant la population des étudiants en L1, 19 ans étant l’âge des étudiants dits « à l’heure » dans leurs études. Les effectifs des âges inférieurs à 19 ans correspondent aux étudiants précoces ; à l’inverse, les effectifs des classessupérieures à 19 ans tiennent probablement aux redoublement et/ou aux réorientations.
Représentation de distributions continues
Répartition des salaires des agents de la fonction publique en 1986 d’après l’INSEE (salaire annuel net en milliers de francs) Hommes Fréquence cumulée Fonction de Centre de Salaire Classe Amplitude Effectifs Fréquence Densité Croissante Répartition 30-60 45 30 61179 4,5 1,54,5 1,5 60-70 65 10 133233 9,8 9,8 14,3 11,3 70-80 75 10 258310 19 19 33,3 30,3 80-90 85 10 171300 12,6 12,6 45,9 42,9 90-100 95 10 146829 10,8 10,8 56,7 53,7 100-110 105 10 149548 11 11 67,7 64,7 110-120 115 10 152267 11,2 11,2 78,9 75,9 120-140 130 20 111481 8,2 4,1 87,1 80 140-180 160 40 114200 8,4 2,1 95,5 82,1 180-260 220 80 54381 4 0,5 99,5 82,6
Histogramme
?
Les ordonnées del’histogramme sont (normalement) les densités.
–
Exception (courante) : toutes les classes ont une amplitude de 1 ? on peut représenter les effectifs ou les fréquences. Sous R :
? ?
–
hist(x) ? effectifs en ordonnées ; hist(x, proba=TRUE) ? densité en ordonnées ;
fi ai
?
Amplitude (noté ai)= « largeur » de la classe ; Densité (noté di) = fréquence / amplitude =
?
Statistiquesdescriptives
?
Objectif : décrire / résumer une distribution de données en un minimum de caractéristiques.
– –
? Comparer les distributions entre elles ; ? Fournir des paramètres aux loi de probabilités en vue d’effectuer des statistiques mathématiques (intervention du hasard) ;
Statistiques descriptives
?
3 types de mesures :
– – –
Tendance centrale ; Dispersion Forme ;Signification concrète ? Sensibilité aux valeurs aberrantes ? Stabilité d’un échantillon à l’autre ?
?
Précautions à prendre lors de l’emploi :
– – –
Caractéristiques de tendance centrale
? ?
Aussi dites « caractéristiques de position ». Critères de Yule :
1 objective 2 complète 3 concrète 4 simple 5 algébrique
mode OK OK OK
médiane OK OK OK
moyenne OK OK OK OK Caractéristiques de tendance centrale en fonction de l’échelle
?
Les caractéristiques dépendent des échelles de la distribution.
Échelle Nominale X Échelle Ordinale X X Échelle D’intervalle X X X
mode médiane moyenne
Maximum, minimum
?
Le minimum est la plus grande modalité observable ; Le maximum est la plus petite modalité observable. Exemple : mm ? {4,18,3,15,11,9}
–
?
?
Maximum = 18; Minimum = 3 repose sur les valeurs extrêmes / aberrantes ; Suppose le plus souvent une variable quantitative.
?
Problème :
– –
Le mode
?
Dans une distribution donnée, le mode correspond à la modalité :
– –
dont les effectifs sont les plus élevés ; la plus fréquente ; Mo = 5 ;
?
Exemple : m = {1,4,8,5,5,3,4,5,9,3,5}
–
?
Rappel : systématiquement relever lamultimodalité d’une distribution ? plusieurs souspopulations confondues ? (ex. : tailles ? décomposition en tailles hommes / femmes)
Le mode
?
Avantage : valable quelle que soit l’échelle des données ; Inconvénients :
– – –
?
Ne prend en compte qu’une petite partie des données ; Instable d’un échantillon à un autre ; Pour une distribution continue, dépend de l’amplitude des classes…