Modèle à inflation de zéro

By février 12, 2019Non classé

Le modèle d`inflation zéro est un modèle de classe latente. Il est proposé dans une situation spécifique – lorsqu`il y a deux types de zéros dans les données observées. Il s`agit d`un modèle en deux parties qui a une interprétation comportementale spécifique (ce qui n`est pas particulièrement compliqué, d`ailleurs). La discussion précédente ne concerne pas le modèle. Il s`agit d`un ajustement de courbe. Non, tu n`as pas besoin du ZINB. Il y a d`autres fonctions qui peuvent être adaptées aux données qui ressembles à elles « s`adaptent mieux » que le modèle ZINB. Toutefois, ni la fonction de probabilité logarithmique ni l`AIC suggéré ne sont des «mesures d`ajustement» utiles – l`ajustement du modèle aux données au sens où il est habituellement considéré n`est pas un élément du critère d`ajustement. Si vous utilisez le modèle pour prédire la variable de résultat, puis Comparez ces prédictions aux données réelles, le modèle ZINB s`adaptera beaucoup mieux il n`y aura aucune comparaison. Il est toujours fascinant quand un commentateur fait valoir qu`un modèle est «difficile à adapter». Taper ZINB dans le langage de commande de STATA ou de nlogit n`est pas plus difficile que de taper negbin. Ces modèles existent depuis des années comme des procédures soutenues dans ces programmes. Il n`y a rien de difficile à y installer.

Quant à la difficulté d`interpréter le modèle, le modèle ZINB, en tant que modèle en deux parties, fait beaucoup de sens. Il est difficile de comprendre pourquoi il devrait être difficile à interpréter. Le point ci-dessus sur le modèle NB étant une restriction paramétrique sur le modèle ZINB est incorrect. La reparamétrisation ne fait que gonfler la probabilité zéro. Mais, il perd l`interprétation en deux parties-le modèle reparamétrée n`est pas un modèle à zéro gonflé dans le sens de classe latente dans lequel il est défini. Le modèle soi-disant reparamétré n`est plus un modèle de classe latente. Il est vrai que le modèle NB peut être testé comme une restriction sur le modèle proposé. Mais, le modèle proposé n`est pas équivalent au modèle ZINB original – il s`agit d`un modèle différent.

Une fois de plus, ce n`est qu`un ajustement de la courbe. Il existe de nombreuses façons de faire exploser la probabilité zéro, mais ces façons perdent l`interprétation théorique du modèle zéro gonflé. J`ai fait quelques progrès avec proc glimmix dans SAS. Le code de mon modèle final est présenté ci-dessous, le modèle un était inconditionnel sans prédicteur, le modèle deux avait un statut socio-économique (SES) comme prédicteur, et le modèle final a SES et le genre comme prédicteurs. * question = type de question, réponse = réponses aux questions IMHO, ils ressemblent, mais sont facilement interprétables et aident à trouver quelques effets intreposant, signe différent de par exemple au même prédicteur dans la partie binomiale & Count du modèle! Lorsqu`il y a encore dispersion dans le sous-groupe à risque, nous pouvons utiliser le modèle ZINB, qui est identique à ZIP, sauf que le NB remplace le poisson pour tenir compte de la surdispersion pour modéliser la réponse de comptage de la sous-population à risque. Ainsi, un modèle de régression ZINB a une régression logistique pour les zéros structuraux et un log-linéaire NB pour la réponse de comptage pour le sous-groupe à risque, avec le paramètre de dispersion supplémentaire α du NB pour tenir compte de la surdispersion. Nous pouvons obtenir des intervalles de confiance pour les paramètres et les paramètres exponentiés à l`aide du bootstrapping. Pour le modèle de poisson, il s`agirait de ratios de risque d`incident, pour le modèle d`inflation zéro, les ratios de cotes.

Nous utilisons le paquet de botte. Tout d`abord, nous obtenons les coefficients de notre modèle d`origine à utiliser comme valeurs de départ pour le modèle pour accélérer le temps qu`il faut pour estimer.