Les modèles logit polytomiques non ordonnés constituent une famille de modèles économétriques adaptés au cas où la variable à expliquer est une variable qualitative, dont les modalités ne peuvent être classées les unes par rapport aux autres. Il en est ainsi, par exemple, de la catégorie socioprofessionnelle, du mode de transport, du statut d’occupation du logement, du lieu de résidence, etc.
1.Le modèle logit multinomial :
On observe un échantillon de n individus, répartis en J catégories disjointes. Chaque individu i appartient à une catégorie j parmi les J possibles. Il est décrit par un ensemble de K caractéristiques x i1, xi2, …, xiK (par exemple son âge, sexe, niveau d’études, etc.).
Le modèle est construit sur l’idée suivante. La probabilité que l’individu i, compte tenu de ses caractéristiques xik, fasse partie de la catégorie j est supposée dépendre des xik, ou,plus précisément, d’une combinaison linéaire des xik. Formellement, cela s’écrit :
P (j/xi) = G (β0j + β1jxi1 + β2jxi2 + … + βkjxik) = G (xi βj)
Pour j = 1, 2, …, J. Le vecteur xi = (1xi1 xi2…xik) est le vecteur (ligne) des variables explicatives du modèle. Sa première composante vaut systématiquement 1. Elle prend en compte, dans le modèle, le fait que les catégories n’ont pas les mêmes effectifs. On remarquera que les paramètres de la combinaison linéaire dépendent de la catégorie j. On note le vecteur (colonne) de ces paramètres.
2.Le modèle logit conditionnel :
Conformément à la terminologie adoptée en introduction, le modèle logit conditionnel a, comme variables explicatives, uniquement des caractéristiques zj des choix j. Il ne contient aucune variable invariante d’un choix à l’autre.
En particulier, le modèle logit conditionnel ne contient pas la variable de terme constant. Par ailleurs, les paramètres du modèle sont indépendants du choix j.
En reprenant la démarche utilisée pour le logit multinomial et en remplaçant formellement xiβjpar zijβ, le modèle conditionnel s’écrit :
Vj =Vj(x; a) + ej
Les paramètresa sont considérés comme aléatoires.
II.Les modèles logit, un moyen pour prévoir le risque de défaillance:
Dans le cas qui nous intéresse, il s’agit de connaitre la probabilité de défaillance d’une entreprise, sachant ses caractéristiques comptables et financières. Les choix de la régression logistique en tant que technique statistique doit être justifié au regard de la régression linéaire ordinaire et de l’analyse discriminante. Dans le cas de la régression linéaire, la variable dépendante est quantitative. De plus, la régression linéaire ordinaire ne peut pas être mise en œuvre si les erreurs ne sont pas distribuées normalement ou la variance des erreurs n’est pas constante. Pour contrer ces difficultés, une transformation logit est nécessaire. Cette transformation consiste à régresser les variables explicatives non pas sur π, mais sur la variable transformée Log [π/1-π]. Le modèle s’écrit de la façon suivante :