Vous n'êtes pas identifié.
Vous êtes sur le forum du master ESA !
Le site du master ESA - description de la formation, notes de cours, contacts... vient de déménager !!!
Venez visiter notre nouveau site : www.master-esa.fr
Bonjour,
Je suis entrain de modéliser le nombre de sinistre vol en fonction des variables géomarketing, pour cela j'utilise proc Genmod puisque le nombre de sinistre est une variable de comptage.
mes questions:
-dois-je avoir la normalité des résidus? ( les 3 tests "Kolmogorov-Smircov" "Cramer-von Mises" et "Anderson-Darling"rejettent l'hypothèse nulle de normalité des résidus pour les 3 modèles concurrents).
- pour pouvoir comparer mes 3 modèles, est ce que je peux utiliser les critères AIC et BIC sachant que j'ai pas le même nombre de variable dans chaque modèle ?
(j'ai un petit doute puisque ces critères sont calculés à partir de p(le nombre de variable) et log vraisemblance donc ça me semble pas logique).
-finalement peux-je utiliser la MSE ou la RMSE comme critère? (vu que j'ai une valeur prédite de nombre de sinistre vol).
MERCI
Hors ligne
Je ne suis pas un spécialiste de ces modèles mais :
- si l'expliquée est un comptage (prenant donc ses valeurs dans l'ensemble des entiers positifs ou nul) , il me semblerait curieux qu'on puisse faire apparaître une écriture ayant un résidu gaussien prenant, lui, ses valeurs dans R,
- C'est précisément parce que ces critères prennent en compte simultanément la log-vraisemblance et le nombre de variables qu'ils permettent de comparer les modèles entre eux,
- on doit pouvoir, après tout MSE ou RMSE peuvent être vues comme donnant une information sur la taille des erreurs. Sauf que une erreur de 1 point sur une valeur observée égale à 2 n'a pas la même signification qu'une erreur de 1 sur une observée qui vaut 20 ! Il doit être raisonnable de relativiser ces erreurs par la taille de l'expliquée...Cf. par exemple les résidus de Pearson que l'on vous a présentés en cours.
Dernière modification par esa_gc (04-06-2013 16:14:25)
Hors ligne
Merci!!
Hors ligne
Pour compléter un peu : je sais qu'il y a des spécialistes des modèles loglinéaires. Personnellement, j'ai du mal à les interpréter. Avez-vous essayé également un ajustement du type logit ou probit (si vous tenez à la normalité) ordonné ?
Hors ligne
les assureurs s'intéressent le plus au régression LOG LINEAIRE, dans l'option link de genmod on est obligé de mettre un ajustement log, et par rapport aux résidus de pearson j'ai trouvé ce lien:
http://blogperso.univ-rennes1.fr/arthur … stribution
et justement les résidus de pearson (ou les résidus de déviance) dans un modèle log linéaire ne suivent pas une loi normal
Hors ligne