VIF (Variance Inflation Factor)
Introduction
Le VIF permet de tester la multicolinéarité (corrélation forte entre plusieurs facteurs) dans un modèle de régression.
Application
Syntaxe R
# Soit m le modèle de régression à tester
library(car)
vif(m)
Interprétation
| VIF = 1 | 1 < VIF < 5 | VIF > 5 ou VIF > 10 |
|---|---|---|
| Absence de corrélation entre les facteurs. | Les facteurs sont modérément corrélés, ce qui n'est pas problématique. | Présence de multicolinéarité, ce qui est problématique. |
Exemple
Voici nos données et notre fichier d'analyse:
| Fichiers |
|---|
| variance-inflation-factor.csv |
| variance-inflation-factor.R |
Commençons par activer les librairies nécessaires dans R:
Activation des librairies
library(car)
Importons nos données:
Importation des données
df <- read.csv("variance-inflation-factor.csv")
Nous allons calculer un modèle de régression et tester la multicolinéarité de celui-ci:
Modèle de régression multiple
m <- lm(score ~ predicteur_1 + predicteur_2, data=df)
Testons maintenant la multicolinéarité du modèle:
Variance Inflation Factor
vif(m)
| predicteur_1 | predicteur_2 |
|---|---|
| 16.09882 | 16.09882 |
Ici, nous pouvons voir que le VIF > 10, et qu'il y a donc la présence de multicolinéarité entre les deux prédicteurs, — c'est-à-dire que les deux facteurs sont fortement corrélés entre eux — ce qui est problématique.