Statiqtique

Statiqtique

Statistiques de Gestion Chapitre1 Notions de Statistiques Descriptives C’est quoi les statistiques? • C’est l’art de recueillir, presenter, analyser et utiliser des observations (des donnees) afin d’aider a la prise de decisions et a la resolution de problemes. • Le premier phenomene qui ressort des observations: la variabilite des donnees. La statistique est utilisee ou et pourquoi? • Dans la gestion courante des activites des gouvernements. • A la prise de decision dans l’industrie. En recherche medicale, en sociologie, en psychologie, en marketing, en finance, en comptabilite, etc. Etapes d’une etude statistique • Collecte: Recueil des donnees. • Organisation: une fois les donnees obtenues, il faut les traiter, les coder, avant de proceder aux analyses. • Interpretation: choix des techniques statistiques d’analyse Un premier exemple • On s’interesse aux salaires mensuels de 80 chefs executifs d’une chaine multinationale en centaines de dirhams. 05 90 245 165 200 135 215 200 160 195 221 150 220 130 180 175 150 150 175 205 180 150 170 150 190 95 100 145 145 200 185 175 200 115 195 165 175 165 85 175 121 120 180 160 195 185 165 145 160 150 180 160 150 205 135 135 175 175 235

Désolé, mais les essais complets ne sont disponibles que pour les utilisateurs enregistrés

Choisissez un plan d'adhésion
170 180 165 170 155 150 225 155 145 150 115 100 140 110 135 155 145 165 150 135 140 Les donnees sont presentees comme elles ont ete recueillies. Ainsi, il n’est pas facile de repondre a une question comme: quel est le pourcentage des salaires inferieurs a 15000 DH ? Les deux types d’etudes statistiques • La statistique descriptive ou statistique deductive La statistique inductive ou inference statistique La statistique descriptive • La statistique descriptive (ou statistique deductive) s’occupe de la description des donnees: tableau, graphique, pourcentage, … • La statistique inductive (ou inference statistique) s’occupe de tirer des conclusions generales a partir d’experiences et de faire des previsions. Plan du cours • Cours 1 : Notions de statistique descriptive • Cours 2: Statistiques previsionnelles: Ajustement lineaire • Cours 3 : Statistiques previsionnelles: Series chronologiques • Cours 4 : probabilites • Cours 5 : variables aleatoires Plan du cours Cours 6: les modeles discrets (binomiale, hypergeometrique, Poisson) • Cours 7 : les modeles continus (uniforme, normale, exponentielle) • Cours 8 : intervalle de confiance, marge d ’erreur • Cours 9 : tests d’hypothese sur une moyenne Les definitions de base • • • • Population et individus Variables Types de variables Echantillon Population et individus • Individu ou unite statistique – Une unite distincte chez laquelle on peut observer une ou plusieurs caracteristiques donnees. Population et individus • Population – Ensemble des individus(ou unites statistiques ) pour lequel on considere une ou plusieurs caracteristiques Taille de la population – Le nombre d’individus constituant la population. Notation : N Echantillon • Les resultats des observations, portant sur la variable a l’etude, faites sur une partie des individus. (Une observation par individu) Taille de l’echantillon : le nombre d’observations dans l’echantillon. Notation : n Variable statistique • Caracteristique susceptible de variations observables. – Notation : X , Y , W , … (MAJUSCULE) • Valeurs: les mesures distinctes d’une caracteristique donnee. – Notation : x1 , x2 , … (minuscule) VARIABLES QUANTITATIVES Variable quantitative :

Une variable statistique est quantitative si ses valeurs sont des nombres exprimant une quantite, sur lesquels les operations arithmetiques (somme, etc… ) ont un sens. Variable quantitative discrete: Variable quantitative continue: Une variable quantitative est discrete si elle ne peut prendre que des valeurs isolees, generalement entieres. Une variable quantitative est continue si ses valeurs peuvent etre n’importe lesquelles d’un intervalle reel. VARIABLES QUALITATIVES Variable qualitative : Une variable statistique est qualitative si ses valeurs, ou modalites, s’expriment de facon itterale ou par un codage sur lequel les operations arithmetiques telles que moyenne, somme, … , n’ont pas de sens. Variable qualitative nominale : C’est une variable qualitative dont les modalites ne sont pas ordonnees. Variable qualitative ordinale : C’est une variable qualitative dont les modalites sont naturellement ordonnees Exemple: Noms M. Ahmed M. Adil Mme Samia Melle Rania M. Ali M. Sami M. Iliass Mme Lamia Melle Fatima M. Mohammed M. Omar Mme Alia …. VARIABLES QUALITATIVES NOMINALES Couleur des yeux Vert Noir Noir Noisette Bleu Noir Noisette Noir Bleu Vert Bleu Noir ….

Modalites Effectifs Frequences Bleu 60 0,200 Noir 160 0,533 Noisette 40 0,133 Vert 40 0,133 Total : 300 1 % 20,0 53,3 13,3 13,3 100 Modalites Effectifs Frequences % f1? 100 modalite 1 n1 f1= n1/n … … … f i ? 100 modalite i ni fi= ni/n … … … f k ? 100 modalite k nk fk= nk/n Total : 100 ? n i = n ? f i =1 VARIABLES QUALITATIVES NOMINALES Modalites Effectifs Frequences Bleu 60 0. 200 Noir 160 0,533 Noisette 40 0,133 Vert 40 0,133 Total : 300 1 % 20,0 53,3 13,3 13,3 100 Diagramme circulaire ou camembert Vert 13% Noisette 13% Bleu 20% 180 160 140 120 100 80 60 40 Diagramme en barres 160 60 40 40 Noir 54% 20 0 Bleu Noir Noisette Vert

Variables Qualitatives ordinales 130 personnes ont ete interrogees sur leur addiction au chocolat Les modalites sont presentees dans l’ordre Modalites Effectifs = Nombre de personnes Pas du tout (A) 10 Un peu (B) 25 Beaucoup (C) 40 Passionnement (D) 32 A la folie (E) 23 45 40 40 35 30 25 25 20 15 10 10 5 0 23 32 A B C D E VARIABLES QUANTITATIVES DISCRETES EFFECTIFS ET FREQUENCES Menage M1 M2 M3 M4 M5 M6 M7 M8 M9 M10 M11 M12 M13 M14 M15 M16 M17 …… Nombre d’enfants par menage 2 3 0 0 5 0 1 0 2 4 1 3 2 0 0 1 2 ……. Nombre d’enfants 0 1 2 3 4 5 Nombre de Menages 103 115 95 35 10 2 Valeurs de Effectifs Frequences % la variable f1? 00 x1 n1 f1= n1/n … … … f i ? 100 xi ni fi= ni/n … … … f k ? 100 xk nk fk= nk/n Total : 100 ? n i = n ? fi =1 VARIABLES QUANTITATIVES DISCRETES REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES Nbre d’enfants xi 0 1 2 3 4 5 140 120 100 80 60 40 20 0 0 1 2 3 4 5 6 Effectif ni 103 115 95 35 10 2 Frequence fi 0,286 0,319 0,264 0,097 0,028 0,006 Diagramme en batons VARIABLES QUANTITATIVES DISCRETES EFFECTIFS ET FREQUENCES CUMULES Nbre Nombre de Effectifs cumules Effectifs cumules d’enfants menages croissants decroissants 0 103 103 360 1 115 257 218 2 95 142 313 348 3 35 47 358 4 10 12 5 2 360 2 Total : 360

Effectifs cumules croissants: Nombre d’individus pour lesquels la variable est inferieure ou egale a xi. Resultat de l’addition, de proche en proche, des effectifs d’une distribution observee en commencant par le 1er. Effectifs cumules decroissants: Nombre d’individus pour lesquels la variable est superieure ou egale a xi. Resultat de l’addition, de proche en proche, des effectifs d’une distribution observee en commencant par le dernier. Valeurs de la Effectif Effectifs cumules Effectifs cumules variable croissants decroissants xi ni Ni N’i x1 n1 N1= n 1 N’1= nk+ …. + n1= n x2 n2 N2= n1+ n2 N’2= nk+ …. n2 x3 n3 N3= n1+ n2+ n3 N’3= nk+ …. + n3 … … …. …. xk-1 nk-1 Nk-1= n1+ …. + nk-1 N’k-1= nk+ nk-1 xk nk Nk= n1+ …. + nk= n N’k= nk Total : n VARIABLES QUANTITATIVES DISCRETES EFFECTIFS ET FREQUENCES CUMULES Nombre d’enfants xi 0 1 2 3 4 5 Total : Nombre de menages ni 103 115 95 35 10 2 360 Effectifs cumules croissants Ni 103 218 313 348 358 360 Effectifs Frequences Frequences Frequences cumules cumulees cumulees decroissants croissantes decroissantes N’i fi Fi F’i 360 0,2861 0,2861 1 257 0,3194 0,6055 0,7139 142 0,2639 0,8694 0,3945 47 0,0972 0,9666 0,1306 12 0,0278 0,9944 0,0334 2 0,0056 1 0,0056 1

Il y a 313 menages possedant un nombre d’enfants inferieur ou egal a 2 Il y a 47 menages possedant un nombre d’enfants. superieur ou egal a 3 La proportion de menages possedant un nombre d’enfants. inferieur ou egal a 4 est de 99,44% La proportion de menages possedant un nombre d’enfants. superieur ou egal a 1 est de 71,39% VARIABLES QUANTITATIVES CONTINUES Variable observee: augmentation moyenne mensuelle du salaire, en €, des employes d’une multinationale au cours de l’annee 2009. Augmentation Effectif 18 4 2 34 21 9 36 8 9 12 38 11 25 34 0 37 16 33 19 18 10 27 43 1 2 22 6 31 15 …. 35 2 22 28 30 39 42 33 2 …. 0 41 26 5 1 11 42 4 21 …. 16 11 5 8 0 1 4 0 …. Remarque1 : la variable augmentation moyenne mensuelle peut etre consideree comme continue. En arrondissant on l’a discretisee. Une augmentation de 10 € est en fait une augmentation comprise entre 9,5 €et 105 €. Remarque2 : Une variable continue ne prend pas des valeurs isolees, mais des valeurs appartenant a des intervalles. C’est pourquoi, au lieu de definir des effectifs par valeurs, on definira des effectifs par intervalles, appeles classes. Remarque3 : Une variable discrete comportant trop de valeurs est aussi traitee comme une variable continue. (€) 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 …..

Total 257 318 255 307 308 159 140 84 72 55 22 13 9 7 8 21 6 2 …. 2125 VARIABLES QUANTITATIVES CONTINUES Augmentation (€) [0 – 3[ [3 – 5[ [5 – 10[ [10 – 20[ [20 – 30[ [30 – 50[ Effectifs 830 615 510 92 63 15 Classes [e 1 – e 2[ [e 2 – e 3[ …. [e k – e k+1[ Effectifs n1 n2 …. nk Remarque 1: Le choix des classes et arbitraire, mais elles doivent etre adjacentes et recouvrir l’ensemble des valeurs. Remarque 2: Il est preferable de prendre des classes d’amplitudes egales. Remarque 3: Il ne faut prendre ni trop ni trop peu de classes. Remarque 4: Le choix et le nombre de classes influent sur les representations graphiques.

VARIABLES QUANTITATIVES CONTINUES REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES 900 effectif Classes [0 – 3[ [3 – 5[ [5 – 10[ [10 – 20 [ [20 – 30[ [30 – 50[ Effectifs 830 615 510 92 63 15 800 700 600 500 400 300 200 100 0 30 50 0 3 350 Effectif rectifie HISTOGRAMME Classes [0 – 3[ [3 – 5[ [5 – 10[ [10 – 20 [ [20 – 30[ [30 – 50[ Effectifs Amplitude Effectifs ni ai rectifies ni /ai 830 3 276,7 615 2 307,5 510 5 102,0 92 10 9,2 63 10 6,3 15 20 0,75 300 250 200 150 100 50 0 30 50 0 3 VARIABLES QUANTITATIVES CONTINUES REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES

Classes Effectifs Amplitude Effectifs ni ai rectifies ni /ai 830 3 276,7 615 2 307,5 510 5 102,0 92 10 9,2 63 10 6,3 15 20 0,75 350 300 250 200 150 100 50 0 30 Effectif rectifie HISTOGRAMME [0 – 3[ [3 – 5[ [5 – 10[ [10 – 20[ [20 – 30[ [30 – 50[ La surface = ai ? (ni/ai) est de 830 unites La surface = ai ? (ni/ai) est de 615 unites Dans un histogramme, ce sont les surfaces des rectangles (ce que l’? il voit), qui sont proportionnelles aux effectifs, et non les hauteurs de ces rectangles Remarque: Le trace de l’histogramme des frequences est identique. Il suffit de porter en ordonnees la frequence rectifiee di = fi/ai, appelee densite. 0 0 3 VARIABLES QUANTITATIVES CONTINUES EFFECTIFS ET FREQUENCES CUMULES Classes Variable observee: augmentation moyenne mensuelle du salaire, en €, des employes d’une multinationale au cours de l’annee 2009. [ei – ei+1[ [0 – 3[ [3-5[ [ 5 – 10 [ [10 – 20 [ [20 – 30 [ [30 – 50[ Total : Effectifs Effectifs Effectifs Frequences Frequences cumules cumules cumulees cumulees croissants decroissants croissantes decroissantes ni Ni N’i Fi F’i 830 830 2125 0,391 1,000 615 1445 1295 0,680 0,609 510 1955 680 0,920 0,320 92 2047 170 0,963 0,080 63 2110 78 0,993 0,037 15 2125 15 1,000 0,007 2125

Il y a 1445 employes dont l’augmentation est strictement inferieure a 5 Il y a 170 employes dont l’augmentation est superieure ou egale a 10 Combien y-a-t-il d’employes dont l’augmentation est inferieure a 17 ? VARIABLES QUANTITATIVES CONTINUES COURBES CUMULATIVES Quelle est la proportion p d’employes dont l’augmentation est inferieure a 17 € ? [ei – ei+1[ F. C. C [0-3[ [3-5[ 0,391 0,680 1 0,950,9 0,8 0,7 0,6 [ 5 – 10 [ 0,920 [10 – 20 [ 0,963 [20 – 30 [ 0,993 [30 – 50 [ 1 -10 0,5 0,4 0,3 0,2 0,1 0 0 10 20 30 40 50 60 17 17 ? 10 p ? 0. 920 17 ? 10 D’ou p ? 0,92 ? ? 0,963 ? 0,920 ? ? 95% ? 20 ? 0 20 ? 10 0. 963 ? 0. 920 RESUME VARIABLE QUALITATIVE Nominale Ordinale VARIABLE QUANTITATIVE Discrete Continue Effectifs ou Frequences Diagramme en barres Diagramme en barres Effectifs ou Frequences Diagramme en batons Histogramme Modalites dans l ’ordre Diagramme circulaire Courbes cumulatives des effectifs ou des frequences PARAMETRES STATISTIQUES Les representations graphiques ont permis une premiere synthese visuelle de la distribution des observations Un parametre statistique permet de resumer par une seule quantite numerique une information contenue dans une distribution d’observations. ! 000 2500 2000 1500 1000 500 0 0 Les parametres statistiques ne concernent que les variables quantitatives Variable Variable Variable 3000 2500 2000 3000 2500 100 % – A % Position A% N° individu 2000 1500 1000 500 0 Tendance centrale Dispersion 1500 1000 500 0 N° individu 0 0 N° individu PARAMETRES DE TENDANCE CENTRALE LE MODE Une distribution est unimodale si elle presente un maximum marque, et pas d’autres maxima relatifs. La lecture s’effectue sur le diagramme en batons ou l’histogramme. 100 140 120 100 80 60 40 20 0 0 1 2 3 4 5 6 90 80 70 60 50 40 30 20 10 0 900 1400 1900 2400 2900 3500 ou plus… Mode

Mode Classe modale Le mode correspond a l’abscisse du maximum, c. a. d. la valeur la plus frequente PARAMETRES DE TENDANCE CENTRALE LE MODE Si la distribution presente 2 ou plus maxima relatifs, on dit qu’elle est bimodale ou plurimodale. La population est composee de plusieurs sous-populations ayant des caracteristiques de tendance centrale differentes. 90 140 120 80 70 60 100 50 80 60 40 20 0 0 1 2 3 4 5 6 40 30 20 10 0 900 1400 1900 2400 2900 3500 4000 4500 ou plus… Mode 1 Mode 2 Mode 1 Mode 2 PARAMETRES DE TENDANCE CENTRALE LA MEDIANE Les valeurs observees doivent etre rangees par ordre croissant.

La mediane M est la valeur du milieu de la serie d’observations, c. a. d. telle qu’il y ait autant d’observations « au-dessous » que « au-dessus ». Nombre impair d’observations 3 4 4 5 6 8 8 9 10 Nombre pair d’observations 3 4 4 5 6 8 8 9 4 valeurs M 4 valeurs 4 valeurs 4 valeurs Intervalle median M = milieu = 5,5 PARAMETRES DE TENDANCE CENTRALE LA MEDIANE a partir d’une distribution discrete xi 0 ni 103 115 95 35 10 2 Fi 0,286 0,606 0,869 0,967 0,994 1 F(x) 0 0,286 0,606 0,869 0,967 0,994 1 0,5 xi 0 ni 103 77 95 35 10 40 Fi 0,286 0,500 0,764 0,861 0,889 1 F(x) 0 0,286 0,500 0,764 0,861 0,889 1 0,5 M 1 2 3 4 5

Intervalle median M = milieu = 1,5 1 2 3 4 5 1 1 0,5 0,5 -2 -1 0 0 1 2 3 4 5 6 -2 -1 0 0 1 2 3 4 5 6 M Intervalle median M = milieu = 1,5 PARAMETRES DE TENDANCE CENTRALE LA MEDIANE a partir d’une distribution continue x [ei – ei+1[ 0 [0-3[ 0,391 Fi F(x) 0 1 0,9 0,8 0,7 0,6 3 M 5 10 [3-5[ [ 5 – 10 [ [10 – 20 [ 20 [20 – 30 [ 30 [30 – 50 [ 50 0,391 0,5 0,680 0,680 0,920 0,920 0,963 0,963 0,993 0,993 1 1 0,5 0,5 0,4 0,3 0,2 0,1 0 -10 0 3,2210 M 20 30 40 50 60 M-3 5-3 = 0. 5-0. 391 0. 680-0. 391 D’ou M ? 3 ? 0,5 ? 0,391 ? 5 ? 3? ? 3, 22 0,680 ? 0,391 PARAMETRES DE TENDANCE CENTRALE LA MOYENNE ARITHMETIQUE

La moyenne arithmetique est notee x 1 n x = ? xi n i=1 Serie brute x1, x2, … , xn Serie groupee Valeurs de Effectifs Frequences la variable x1 n1 f1= n1/n … … … xi ni fi= ni/n … … … xk nk fk= nk/n 1 k x = ? nixi n i=1 ni xi k ?? =? fi x i i=1 n i=1 k PARAMETRES DE TENDANCE CENTRALE LA MOYENNE ARITHMETIQUE Classes Effectifs Frequences Centres de classe [e1 – e2[ n1 f1 x 1= ( e 1 + e 2)/2 [e2 – e3[ n2 f2 x 2= ( e 2 + e 3)/2 …. …. …. …. [ek – ek+1[ nk fk x k= ( e k + e k+1)/2 Serie classee k 1 k x = ? n i x i ? ? fi x i n i=1 i=1 PARAMETRES DE TENDANCE CENTRALE LA MOYENNE ARITHMETIQUE Comment faire a moyenne de plusieurs populations ? Population P1 Effectif n1 Moyenne x1 Population P2 Effectif n2 Moyenne x 2 Population P = P1 ? P2 Effectif Moyenne n = n1+ n2 x? k n 1x 1 + n 2 x 2 nx x= ?? i i n i=1 n Moyenne globale = moyenne des moyennes PARAMETRES DE TENDANCE CENTRALE PROPRIETES GENERALES z=ax+b y=ax x P (x) = moyenne, mediane, mode P (y) = a P (x) P (z) = a P (x) + b PARAMETRES DE TENDANCE CENTRALE MOYENNES GEOMETRIQUE ET HARMONIQUE Moyenne geometrique n n G = n x1 1 x 2 2 ….. x n k k Utilisee dans le cas de phenomenes multiplicatifs (taux de croissance moyen) Moyenne harmonique H= ?x i=1 n k n i Utilisee dans le cas ou l’on combine 2 variables sous forme de rapport (pieces/heure, km/litre,…) PARAMETRES DE POSITION LES FRACTILES OU QUANTILES On appelle fractiles ou quantiles d’ordre k les (k-1) valeurs qui divisent les observations en k parties d’effectifs egaux. 1 mediane M qui divise les observations en 2 parties egales 3 quartiles Q1, Q2, Q3 qui divisent les observations en 4 parties egales 9 deciles D1, D2, …, D9 qui divisent les observations en 10 parties egales 99 centiles C1, C2, …, C99 qui divisent les observations en 100 parties egales PARAMETRES DE POSITION LES FRACTILES OU QUANTILES

Quartiles, deciles, centiles s’obtiennent de la meme facon que la mediane. Variable discrete 1 Variable continue 0,9 1 0,75 0,9 0,8 0,75 0,7 0,6 0,5 0,5 0,2 -2 -1 0,5 0,4 0,3 0,2 0,1 0 0 0 1 2 3 4 5 6 -10 0 M 310 QD 20 30 40 50 60 D2 M Q3 9 PARAMETRES DE DISPERSION Etendue : R = xmax – xmin Intervalle interquartile : IQ = Q3 – Q1 Variance : Serie brute : 1 n 2 V = ?? xi – x ? n i=1 Serie groupee ou classee : k 1 k 2 2 V = ? n i ? x i – x ? ? ? fi ? x i – x ? n i=1 i=1 1 k V = ? n i x i2 ? x 2 = Moyenne des carres – Carre de la moyenne n i=1 Ecart-type : ?= V PARAMETRES DE DISPERSION Comment faire la variance de plusieurs populations ?

Population P1 Effectif n1 Moyenne x1 Variance V1 Population P2 Effectif n2 Moyenne x 2 Variance V2 Population P = P1 ? P2 Effectif Moyenne Variance n = n1+ n2 x V? 2 1 k 1 k V = ? n i Vi + ? n i ? x i -x ? n i=1 n i=1 Variance globale = Moyenne des variances + Variance des moyennes PROPRIETES IMPORTANTES DE LA MOYENNE ET DE LA VARIANCE Comment se comportent la moyenne et la variance lorsqu’on fait subir un changement de variable aux observations? xi yi = a xi + b y=ax+b V(y) = a 2 V(x) ?(y) = a ? (x) Comment se comportent la moyenne et la variance de la somme de deux series d’observations? xi yi zi = xi + yi z= x+ y V(z) ? V(x)+ V(y)