Pour réaliser ces deux régressions logistiques, nous avons cherché différentes données en rapport
aux nombres d’individus présentant les caractéristiques présentées ci-dessus. N’ayant pas eu de
réponse satisfaisante, nous avons recueilli des renseignements auprès de notre tutrice du TER, Mme
Hélène Van Setters-Husson. Ce sont des indications qu’elle a observées parmi ses patients, la
méthodologie aura donc une portée scientifique, en revanche les données d’apprentissage seront
simulées, et donc nécessairement arbitraire.
Voici les données que nous avons recueillies :
Environ 75% de la population présente une déviation des axes visuels ;
Parmi ces 75 % :
o Globalement 70% présente une sur-convergence ;
o A peu près 30% présente une sur-divergence ;
Quasiment 75 % de la population a un sommeil correct ;
Environ 60% de la population dispose d’une bonne attention et d’une bonne concentration ;
Approximativement 31 % de la population montre une réelle motivation au travail ;
Globalement 80 % de la population ne présente aucun trouble affectif.
II. Spécification du modèle
Revenons à notre régression logistique. La variable Y est une variable aléatoire parente qui suit une
loi de Bernoulli de paramètre p, et donc Yt est aussi une variable aléatoire qui suit une loi de Bernoulli
de paramètre p, avec . Afin que Y ne prenne que 2 valeurs, nous allons
utiliser la fonction logistique logit.
=
Voyons maintenant les probabilités théoriques associées à Y pour le modèle de régression logistique
de fonction de lien logit :
=
=