Modèle linéaire généralisé
Fiche d’utilisation du logiciel
5-Modèle linéaire généralisé
D. Chessel & J. Thioulouse
Résumé
La fiche contient le matériel nécessaire pour des séances de travaux dirigés sur R consacrées aux modèles linéaires généralisés.
Plan
1. 2. INTRODUCTION : MODELISER UNE PROBABILITE………………………………………………. 3 ERREURS, LIENS ET DEVIANCE…………………………………………………………………….. 6
2.1. 2.2. 2.3. 2.4. 2.5. 2.6.
3. 4.
Erreur de Bernouilly ……………………………………………………………………………6 Erreur normale…………………………………………………………………………………11 Erreurbinomiale……………………………………………………………………………….12 Erreur de Poisson…………………………………………………………………………….13 Retour sur les déviances …………………………………………………………………..14 Pour mémoire ………………………………………………………………………………….17
LE FONCTIONNEMENT DE LA REGRESSION LOGISTIQUE…………………………………. 18 MODELISER UNE PRESENCE-ABSENCE ……………………………………………………….. 20
4.1. 4.2. 4.3. 4.4.
5.
Le problème…………………………………………………………………………………….20 Un exemple ……………………………………………………………………………………..23Courbes de réponse…………………………………………………………………………24 Surfaces de réponse ………………………………………………………………………..26 Augmenter la mémoire ……………………………………………………………………..33 Etude partielle………………………………………………………………………………….35 Nombres d’accidents ………………………………………………………………………..36
MODELE POISSONIEN………………………………………………………………………………… 32
5.1. 5.2. 5.3.
____________________________________________________________
__________
Logiciel R /Modèle linéaire généralisé / BR5.doc /Page 1
____________________________________________________________
__________
Logiciel R /Modèle linéaire généralisé / BR5.doc / Page 2
1.
Introduction : modéliser une probabilité
Supposons qu’on joue à un jeu bizarre dont on fait l’apprentissage au cours d’une série de 20 essais :
> x y y [1] 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 0.55 0.60 [13] 0.65 0.70 0.75 0.80 0.850.90 0.95 1.00
Mettons une petite erreur sur cette probabilité de gagner :
> z z [1] 0.03421 0.10178 0.15495 0.20513 0.25622 0.30368 0.34967 0.40025 [9] 0.44609 0.49408 0.55102 0.61259 0.66149 0.69004 0.74892 0.80398 [17] 0.84907 0.90670 0.95086 1.00449 > z[20] plot(x,z) > abline(lm(z~x))
1.0 z 0.0 0.2 0.4 0.6 0.8
5
10 x
15
20
Jusqu’à présent, il n’y a rien de bienextraordinaire. Personne ne connaît la probabilité de gagner. On ne peut qu’observer le résultat (gagné ou perdu). Fabriquons donc un résultat observable de ce modèle :
> w w [1] 0 0 0 1 0 1 0 0 0 0 1 0 1 0 1 1 1 1 1 1 > plot(x,w) > abline(lm(w~x))
1.0 w 0.0 0.2 0.4 0.6 0.8
5
10 x
15
20
C’est déjà plus étonnant :
> lm(z~x) Call: lm(formula = z ~ x) Coefficients: (Intercept) x 0.0013830.04987 Degrees of freedom: 20 total; 18 residual
____________________________________________________________
__________
Logiciel R /Modèle linéaire généralisé / BR5.doc / Page 3
Residual standard error: 0.008331 > lm(w~x) Call: lm(formula = w ~ x) Coefficients: (Intercept) x -0.03684 0.05113 Degrees of freedom: 20 total; 18 residual Residual standard error: 0.4257
Le modèle y = 0.05*x…