PWPChoixQuali

PWPChoixQuali

Les Modèles de Choix Qualitatifs Master Economie – Finance Université de Limoges Ph. Rous – année universitaire 2007 – 2008 La Problématique La variable expliquée Y ne peut prendre qu’un nombre limité de valeurs. Le cas typique est celui pour lequel Y est susceptible de prendre deux valeurs (O ou 1), permettant ainsi de rendre compte de Exemple : = 1 si l’individu i est a n événement. Sni* to View – O si cet individu bén ficie actuellement d’un emploi 2 On veut expliquer pourquoi cet événement se produit (ou, au contraire, ne se produit pas).

A cet effet, on entend croiser les éalisations de la variable binaire Y avec celles d’une certaln nombre de variables explicatives Xj dont les réalisations peuvent être indifféremment de natures qualitative ou quantitative. Dans ce contexte, et dans le prolongement des modèles « standards » pour lesquels les réalisations de Y sont continues, on peut être tenté de postuler l’existence d’un lien de type linéaire entre les réalisations des Xj et celles de Y.

On va voir que cette façon de concevoir la relation X OY pose de sérieuses difficultés de telle sorte que cette relation devra être l’estimation elle-même de ces modèles ne se fait

Désolé, mais les essais complets ne sont disponibles que pour les utilisateurs enregistrés

Choisissez un plan d'adhésion
pas sans uelques difficultés 4 Le Modèle Linéaire • une idée simple • interprétation et faiblesses du modèle Une idée simple La première idée qui vient à fesprit pour décrire le lien qui pourrait exister entre X et Y consiste à postuler rexistence dune relation linéaire entre ces deux variables : Yi=Cl+ClXi+Cli Attention : si, dans le cadre du modèle traditionnel, il est possible d’admettre que les erreurs présentent un certain nombre de bonnes propriétés (homoscédasticité notamment) on va voir que, dans ce nouveau contexte, la vérification de ces propriétés pose problème. 6

Le Modèle Linéaire : une interprétation en termes de probabilité de l’occurrence d’un evénement On suppose que E Oi = O pour tout i et on note : • Pi la probabilité de réalisation de l’événement {Yi = 1} – Pi la probabilité de réalisation de l’événement {Yi = O} conditionnellement à la connaissance de la valeur prise par Xi Pi = Prob{Yi = 1 | Xi) On sait par ailleurs que l’espérance conditionnelle de Yi liée par Xi la somme des modalités p pondérées par leurs PAGF 3 des coefficients estimés, il est théoriquement possible de calculer, pour un individu i donné, la probabilité pour qu’il présente la modalité Yi 1 : Xi Mais rien ne garantit que cette probabilité calculée prenne toujours ses valeurs dans [O, 1] probas en folie. prg 9 2/ La question de l’hétéroscédasticité des En partant du modèle Yi + n Xi + on peut aussi écrire que ni=Yi-n On en déduit que n’est susceptible de prendre que 2 valeurs : CIODi = 1- n – Cl Xi avec une probabilité Pi – Ü – Xi avec une probabilité 1 – Pi Le caractère gaussien de l’erreur est donc dlfficilement 10 Bien plus : l’erreur est, par construction, hétéroscédastique.

Var(Oi)- E(Di2) – (1 -n – n Xi)2 + n Xi) + n – n Xi)2 (1 -n -n xi) La variance de l’erreur varie en fonction des valeurs prises par X . lle est hétéroscédastique 11 3 fonction de répartition de la loi logistique 13 Cas no 1 : modèle Probit Cl(. ) correspond à la la fonction de répartition de la loi normale On suppose ici que Yi = + OXi) Ci avec : exp O Cl dz 20 n 20 Cette hypothèse de travail donne naissance au modèle PROBIT. Notez le caractère non linéaire de la relation XO Y 14 Cas no 2 : modèle LOGIT 0(. ) correspond à la la fonction de répartition de la loi logistique On suppose ici que Yi + oxi) + avec : expnocxi 1 expDnnXi Cette hypothèse de travail donne naissance au modèle LOGIT. 3 de la valeur prise par Yi variable OBSERVABLE

Détermination de la valeur prise par la variable sous-jacente Yi* INOBSERVABLE 18 On suppose, selon cette aproche, que les valeurs prises par la (les) varlable(s) explicative(s) déterminent (à un alea près) celles d ‘une variable latente (ou sous-jacente) Yi* hélas inobservable qu ‘on peut interpréter comme une propension à engendrer un événement de type Yi 1 – 11 + X2i + + + On observerait Yi 1 dès que cette propension dépasserait un certain seuil Yi -O C {Yi* Dl +02 X2i+ Xki + Yi=l c {Yi* +02 X2i+ 19 On en déduit que : 1} = Prob {Xi C] + > D} = Prob { Di > – Xi prob {Yi = = prob {Xi O + < 0} = prob { Oi < Xi i on connaît la loi de li on peut alors déterminer la probabilité de chacun des événements {Yi O} et {Yi 1} connaissant • les valeurs prlses par les variables explicatives • les valeurs des coefficients (qui doivent être estimés) Remarque : un coefficient Üj positif signifie donc qu'un accroissement de Xi loue dans le sens d'une robabilité de {Y PAGF s 3 0) 1) - 02 X2i - - Ok Xki) La constante CO et le seuil ne peuvent être dissociés 0 par la suite on fera « comme si » C] 21 Pb no 2 : la variance de l'erreur ne peut être identifiée En admettant que Yi = 1, la vraisemblance de la ie observation est : prob (Yi* > 0} 01 – 02 Xi} Di 02 = Prob{ et, sous une hypothèse de symétrie de la fonction 0(. ) n 01 02 Di 11 02 Li = prob{ Cl il est impossible de dissocier C de Oj ! 22 Corollaire de ce résultat L’ordre de grandeur des c PAGF 6 3 en lui-même, que peu SI on prend son de poser : Cli=-l si Yi = O 25 Vraisemblance du modèle Probit On suppose ici que l’erreur est normalement distribuée et, puisque l’écart type C] de l’erreur est indissociable des Oj on fait « comme si » D étalt égal à 1. Sous ces hypothèses on montre facilement (cf. olycopié) que : CliXin Prob{Y’ y Xi, n, CICI 1) CICICli Xi vec : Siy-l exp z2 7 3 contexte, on peut montrer que la vraisemblance et la Log vraisemblance de l’échantillon sont respectivement : e CliXiC] CliXiCl iC]l ne OiXiClCl Log L = û ogo DiXiOO Û loe OiXiO x Log nillii Ici encore les estimations des sont les solutions numériques du problème d’optimisation . PAGF 8 3 des élasticités 32 Elastlcité de la probabilité de Yi = 1 à la modification de Xj : si Xji varie de 1 % de combien variera la probabilité de Y = 1 pour I ‘individu i ? d Cl(pi, Xj K) nxj C (X n O(XiO i) On voit que : • la valeur de l’élasticité n’est as affectée par l’échelle dans aquelle est exprimée la v performance exploitables dans le cadre d’un modèle « traditionnel » ne le sont plus dans le cadre des modèles de choix qualitatifs. On doit en effet se souvenir que les valeurs calculées de X Cl ne sont jamais que les valeurs calculées de la variable latente et non pas celles de la variable Y elle même.

De même, les valeurs calculées de CI(XD) sont celles de la probabilité que Y soit égal à 1 de telle sorte que l’écart qui sépare les valeurs observées de Y des valeurs calculées de la variable latente (ou de la probabilité que Y = 1) n’a lus grande signification C] les tests et indicateurs fondés sur les carrés des résidus sont désormais inexploitables. 35 On pallie cette tare des résidus en privilégiant l’usage d’indicateurs fondés sur les vraisemblances (plutôt que sur les carrés des résldus) : • à la statistique de Fisher pour ‘hypothèse nulle Dj = O Dj > 1 on substitue un ratio de Log Vraisemblance • LR = 2 (Log LUR- cog CR) où LUR et LR sont les vraisemblances des modèles Yi=l Modèle UR : Modèle R. = 11 Ci = Dl +02 X2i+ … + OkXki+ Ci Sous HO, cette statistique éir à une loi du Chi-deux