Skip to content

Graphique Q-Q pour la normalité des résidus (Q-Q plot)

Introduction

Le graphique Q-Q permet de tester si les résidus (= les erreurs) sont distribués normalement.

Application

Syntaxe R
# Soit m le modèle de régression
par(mfrow=c(1,1))
plot(m)

Interprétation

Lorsque les points suivent une ligne droite sur le graphique, cela suggère la normalité des résidus.

Exemple

Voici nos données et notre fichier d'analyse:

Fichiers
q-q-plot.csv
q-q-plot.R

Importons nos données:

Importation des données
df <- read.csv("q-q-plot.csv")

Créons ensuite le modèle de régression à tester:

Création du modèle de régression
m <- lm(score ~ predicteur, data=df)

Puis, réalisons notre graphique:

Graphique Q-Q
par(mfrow=c(1,1))
plot(m, col="darkred")

Graphique Q-Q

Les données formant ici une courbe bien visible, nous pouvons affirmer que les résidus ne sont pas distribués normalement.

Nous pouvons également représenter les résidus dans un histogramme:

Histogramme des résidus
hist(residuals(m))

Histogramme des résidus

Ici aussi, il apparaît évident que les erreurs ne sont pas distribuées normalement.

Pour aller plus loin...

Nous pouvons également tester la linéarité à l'aide d'un test de Shapiro-Wilk sur les résidus:

Test de Shapiro-Wilk sur les résidus
shapiro.test(resid(m))
W p-value
0.74769 < 2.2e-16

Nous pouvons donc affirmer que les résidus ne sont pas distribués normalement (W = 0.748, p<.001).