Cours 3 stat

Cours 3 stat

ntroduction à l’enquête et aux statistiques Paramètres de position centrale et de dispersion Est-il possible de remplacer l’ensemble des valeurs d’une variable observée auprès de 10, 100, 1 000 Individus par une seule valeur ? Cela pourrait être l’objectif d’un indicateur de tendance centrale (moyenne, médiane, mode), mais la seule formulation précédente laisse perplexe sur la pertinence d’un tel indicateur. Dans une série de IO, 100, 1000 observations, les valeurs peuvent fortement varier, d’un individu à l’autre.

Pour rendre compte de ce variabilité on calcule l’indicateur de tenda entrale » comme l’é Les indicateurs de te une série de valeurs. Une 0 p g ersion autour de r but de synthétiser autre utilité est de permettre de comparer la distribution d’une même variable au sein de deux populations ou la distribution d’une variable au sein d’une population à deux moments différents. Dans ce chapitre, les modalités de calculs de quelques indicateurs élémentaires sont présentées, nous apprendrons également à les commenter.

Un étudiant en sciences sociales doit maîtriser les notions de moyenne, médiane et écart-type. Savoir calculer ces indicateurs ?de manière artisanale » contribue à la leur compréhension et aide à leur critique. Exemple d’utilisation d’indic d’indicateurs de tendance centrale et de dispersion :

Désolé, mais les essais complets ne sont disponibles que pour les utilisateurs enregistrés

Choisissez un plan d'adhésion
1- En 2000, les hommes célibataires qui se sont mariés en France avant 60 ans avaient en moyenne 30,6 ans contre 28,5 ans pour leurs homologues femmes. Conclusion : les femmes se marient pour la première fois en moyenne plus tôt que les hommes.

Cet âge moyen cache certaines disparités, par exemple, un quart des hommes se marient avant 26,5 ans et un quart après 34 ans. L’écart-type de l’âge au premier mariage des hommes est de ns contre 5,8 ans pour les femmes. Ces deux valeurs mesurent la dispersion de l’âge au premier mariage autour de l’âge moyen au premier mariage ce qui témoigne d’assez fortes dispersions Ces indicateurs doivent le mieux possible résumer les deux distributions ci-dessous.

Ces deux histogrammes sont presque identiques. Les indicateurs quantifient une légère différence entre les hommes et les femmes, à peine perceptible ? I « œil nu » Distribution des premiers mariages masculins selon l’âge France 2000 Distribution des premiers mariages féminins selon l’âge – France Nbre de mariages 25 0 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 4041 42 43 4445 4647 4849 50 51 52 53 54 55 56 57 58 59 Age Source . ?? INSEE, Etat CiVi Source : INSEE, Etat civil Introduction à l’enquête et aux statistiques A. LES PARAMETRES DE TENDANCE CENTRALE ET DE POSITION Le calcul de trois indicateurs de tendance centrale va être traité dans cette partie : la moyenne (arithmétique ou pondérée), la médiane et le mode. Chacun présente des avantages et des limites. Pour une même série il est ni indispensable, ni inutile de calculer les trois indicateurs, mais souvent fortement conseillé.

LA MOYENNE La moyenne est l’indicateur le plus utilisé, mais il n’est pas forcément le plus facile ? interpréter et comprendre. Elle est notée par X si elle est mesurée sur la population totale Moyenne – ln = * xi = 1,83 ni=l 6 avec n-6 311 Interprétation : La moyenne des 6 valeurs est de 1,83. Cette valeur est conforme à la série, elle se trouve à peu près au centre de cette distribution.

Ayez le réflexe de toujours vérifier la cohérence de la valeur obtenue avec la série de données correspondante. 2 REMARQUES SUR LA MOYENNE ARITHMETIQUE 1. C’est un indicateur qui se calcule facilement. . La moyenne arithmétique ne se conçoit que si les valeurs observées sont numériqu 4 20 réalité. 6. La moyenne est très sensible aux valeurs extrêmes (parfois aberrantes). Cela est d’autant plus vrai si N/n est petit.

MOYENNE D’UNE DISTRIBUTION GROUPEE (OU MOYENNE PONDEREE) Ces moyennes pondérées sont des moyennes qui se calculent ? partir de données regroupées, le plus souvent présentées sous forme d’un tableau. Premier cas : si les données sont regroupées en classe sans intervalle, c’est à dire : – 1; p} avec xj une modalité de la variable X n] reffectif de cette modalité t p le nombre total de modalités La formule est la suivante x s 0 le salaire 960 qui « pèse » le plus dans la valeur moyenne, il « pèse » trois fois plus que le salaire de 250 euros.

Exemple 2 : Soit la répartition des individus selon l’âge au départ de chez leurs parents dans une région française selon le sexe – Départs compris entre 15 et 34 ans: Age atteint l’année L’année 1970 L’année 1990 du départ de chez ses parents Hommes Femmes 15 9 11 3 16 8 33 14 17 39 42 48 18 116 205 97 6 0 les données sont regroupées en classe sous forme d’intervalles. C’est à dire sous la forme suivante . p} avec [xi xi] un intervalle, une classe correspondant à une modalité de la variable X nj l’effectif de cette modalité *c * nj*c ; avec les coefficients de pondér 0 venne Répartition des hommes selon rage au départ de chez leurs parents dans une région française— Départs compris entre 15 et 34 ans en 1 990: Classe Ij Centre des classes cj* 22 27 32 15-19 ans 20-24 ans 25-29 ans 30-34 ans Total Effectifs : nj 217 536 327 59 1 139 3 689 11 792 8 829 1 888 26 198 ‘âge est ici considéré comme une variable discrète (calculé en différence de millésimes). ans et 30,7 ans ontre 17,0, 22,0, 27,0 et 32,0 ans dans notre hypothèse.

La surestimation dans la première classe de l’âge centrale est compensée par la sous-estimation dans les deux dernières classes. pour limiter l’effet lié au centre des classes, il faut multiplier le nombre de classes : moins il y de classes et plus la moyenne est approximative. MOYENNE DE DEUX PONDEREE POPULATIONS OU UNE APPLICATION DU PRINCIPE DE LA MOYENNE La moyenne d’une variable au sein de deux populations différentes est une autre application du principe de la moyenne pondérée. Les coefficients de pondération sont dans ce cas le poids elatif de chacune des populations dans la population totale.

Plus une population est représentée dans la population totale et plus elle « pèse » dans la moyenne calculée dans la population totale. Application Soient deux populations A et B, au sein de chacune on mesure un caractère X : b x a = 182 cm x b = 168 cm sur 90 garçons, sur 120 filles, Quelle est la moyenne des 210 individus ? 90 = 0,429 soit 210 = 1 – 0,43 = 0,57 = 0,43 * 182 + 0,57 * 168 = 174,0 cm nterprétation : La taille moyenne des 210 garçons et filles est de 1740 cm et non la moyenne arithmétique qui donne un résultat faux 0 0