Modèle linéaire généralisé

novembre 28, 2018 Non Par admin

Fiche d’utilisation du logiciel

5-Modèle linéaire généralisé
D. Chessel & J. Thioulouse

Résumé
La fiche contient le matériel nécessaire pour des séances de travaux dirigés sur R consacrées aux modèles linéaires généralisés.

Plan
1. 2. INTRODUCTION : MODELISER UNE PROBABILITE………………………………………………. 3 ERREURS, LIENS ET DEVIANCE…………………………………………………………………….. 6

2.1. 2.2. 2.3. 2.4. 2.5. 2.6.
3. 4.

Erreur de Bernouilly ……………………………………………………………………………6 Erreur normale…………………………………………………………………………………11 Erreurbinomiale……………………………………………………………………………….12 Erreur de Poisson…………………………………………………………………………….13 Retour sur les déviances …………………………………………………………………..14 Pour mémoire ………………………………………………………………………………….17

LE FONCTIONNEMENT DE LA REGRESSION LOGISTIQUE…………………………………. 18 MODELISER UNE PRESENCE-ABSENCE ……………………………………………………….. 20

4.1. 4.2. 4.3. 4.4.
5.

Le problème…………………………………………………………………………………….20 Un exemple ……………………………………………………………………………………..23Courbes de réponse…………………………………………………………………………24 Surfaces de réponse ………………………………………………………………………..26 Augmenter la mémoire ……………………………………………………………………..33 Etude partielle………………………………………………………………………………….35 Nombres d’accidents ………………………………………………………………………..36

MODELE POISSONIEN………………………………………………………………………………… 32

5.1. 5.2. 5.3.

____________________________________________________________

__________
Logiciel R /Modèle linéaire généralisé / BR5.doc /Page 1

____________________________________________________________

__________
Logiciel R /Modèle linéaire généralisé / BR5.doc / Page 2

1.

Introduction : modéliser une probabilité
Supposons qu’on joue à un jeu bizarre dont on fait l’apprentissage au cours d’une série de 20 essais :
> x y y [1] 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 0.55 0.60 [13] 0.65 0.70 0.75 0.80 0.850.90 0.95 1.00

Mettons une petite erreur sur cette probabilité de gagner :
> z z [1] 0.03421 0.10178 0.15495 0.20513 0.25622 0.30368 0.34967 0.40025 [9] 0.44609 0.49408 0.55102 0.61259 0.66149 0.69004 0.74892 0.80398 [17] 0.84907 0.90670 0.95086 1.00449 > z[20] plot(x,z) > abline(lm(z~x))
1.0 z 0.0 0.2 0.4 0.6 0.8

5

10 x

15

20

Jusqu’à présent, il n’y a rien de bienextraordinaire. Personne ne connaît la probabilité de gagner. On ne peut qu’observer le résultat (gagné ou perdu). Fabriquons donc un résultat observable de ce modèle :
> w w [1] 0 0 0 1 0 1 0 0 0 0 1 0 1 0 1 1 1 1 1 1 > plot(x,w) > abline(lm(w~x))
1.0 w 0.0 0.2 0.4 0.6 0.8

5

10 x

15

20

C’est déjà plus étonnant :
> lm(z~x) Call: lm(formula = z ~ x) Coefficients: (Intercept) x 0.0013830.04987 Degrees of freedom: 20 total; 18 residual

____________________________________________________________

__________
Logiciel R /Modèle linéaire généralisé / BR5.doc / Page 3

Residual standard error: 0.008331 > lm(w~x) Call: lm(formula = w ~ x) Coefficients: (Intercept) x -0.03684 0.05113 Degrees of freedom: 20 total; 18 residual Residual standard error: 0.4257

Le modèle y = 0.05*x…