Skip to content

VIF (Variance Inflation Factor)

Introduction

Le VIF permet de tester la multicolinéarité (corrélation forte entre plusieurs facteurs) dans un modèle de régression.

Application

Syntaxe R
# Soit m le modèle de régression à tester
library(car)
vif(m)

VIF

Interprétation

VIF = 1 1 < VIF < 5 VIF > 5 ou VIF > 10
Absence de corrélation entre les facteurs. Les facteurs sont modérément corrélés, ce qui n'est pas problématique. Présence de multicolinéarité, ce qui est problématique.

Exemple

Voici nos données et notre fichier d'analyse:

Fichiers
variance-inflation-factor.csv
variance-inflation-factor.R

Commençons par activer les librairies nécessaires dans R:

Activation des librairies
library(car)

Importons nos données:

Importation des données
df <- read.csv("variance-inflation-factor.csv")

Nous allons calculer un modèle de régression et tester la multicolinéarité de celui-ci:

Modèle de régression multiple
m <- lm(score ~ predicteur_1 + predicteur_2, data=df)

Testons maintenant la multicolinéarité du modèle:

Variance Inflation Factor
vif(m)
predicteur_1 predicteur_2
16.09882 16.09882

Ici, nous pouvons voir que le VIF > 10, et qu'il y a donc la présence de multicolinéarité entre les deux prédicteurs, — c'est-à-dire que les deux facteurs sont fortement corrélés entre eux — ce qui est problématique.