Graphique Q-Q pour la normalité des résidus (Q-Q plot)
Introduction
Le graphique Q-Q permet de tester si les résidus (= les erreurs) sont distribués normalement.
Application
# Soit m le modèle de régression
par(mfrow=c(1,1))
plot(m)
Interprétation
Lorsque les points suivent une ligne droite sur le graphique, cela suggère la normalité des résidus.
Exemple
Voici nos données et notre fichier d'analyse:
| Fichiers |
|---|
| q-q-plot.csv |
| q-q-plot.R |
Importons nos données:
df <- read.csv("q-q-plot.csv")
Créons ensuite le modèle de régression à tester:
m <- lm(score ~ predicteur, data=df)
Puis, réalisons notre graphique:
par(mfrow=c(1,1))
plot(m, col="darkred")

Les données formant ici une courbe bien visible, nous pouvons affirmer que les résidus ne sont pas distribués normalement.
Nous pouvons également représenter les résidus dans un histogramme:
hist(residuals(m))

Ici aussi, il apparaît évident que les erreurs ne sont pas distribuées normalement.
Pour aller plus loin...
Nous pouvons également tester la linéarité à l'aide d'un test de Shapiro-Wilk sur les résidus:
shapiro.test(resid(m))
| W | p-value |
|---|---|
| 0.74769 | < 2.2e-16 |
Nous pouvons donc affirmer que les résidus ne sont pas distribués normalement (W = 0.748, p<.001).