Co to jest współczynnik inflacji wariancji (VIF)?

Współczynnik inflacji wariancji (VIF) mierzy dotkliwość współliniowości w analizie regresji. Analiza regresji Analiza regresji to zestaw metod statystycznych używanych do szacowania relacji między zmienną zależną a jedną lub większą liczbą zmiennych niezależnych. Można go wykorzystać do oceny siły związku między zmiennymi i do modelowania przyszłych relacji między nimi. . Jest to koncepcja statystyczna, która wskazuje na wzrost wariancji współczynnika regresji w wyniku kolinearności.

Współczynnik inflacji wariancji

Podsumowanie

  • Współczynnik inflacji wariancji (VIF) jest używany do wykrywania nasilenia współliniowości w analizie regresji zwykłej metodą najmniejszych kwadratów (OLS).
  • Współliniowość zawyża wariancję i błąd typu II. Sprawia, że ​​współczynnik zmiennej jest spójny, ale niewiarygodny.
  • VIF mierzy liczbę zawyżonych wariancji spowodowanych współliniowością.

Współczynnik inflacji wariancji i współliniowość

W zwykłej analizie regresji metodą najmniejszych kwadratów (OLS) współliniowość występuje, gdy co najmniej dwie zmienne niezależne Zmienna niezależna Zmienna niezależna to dane wejściowe, założenie lub czynnik, który jest zmieniany w celu oceny jej wpływu na zmienną zależną (wynik) . pokazują liniową zależność między nimi. Na przykład, aby przeanalizować związek wielkości firmy i przychodów z cenami akcji w modelu regresji, niezależnymi zmiennymi są kapitalizacja rynkowa i przychody.

Kapitalizacja rynkowa spółki Kapitalizacja rynkowa Kapitalizacja rynkowa (kapitalizacja rynkowa) to najnowsza wartość rynkowa akcji spółki w obrocie. Kapitalizacja rynkowa jest równa aktualnej cenie akcji pomnożonej przez liczbę akcji w obrocie. Społeczność inwestorów często wykorzystuje wartość kapitalizacji rynkowej do uszeregowania firm, a jej całkowite przychody są silnie skorelowane. W miarę jak firma zarabia coraz większe przychody, rośnie ona również. Prowadzi to do problemu współliniowości w analizie regresji OLS. Jeśli zmienne niezależne w modelu regresji wykazują doskonale przewidywalną zależność liniową, nazywa się to doskonałą wielokoliniowością.

W przypadku współliniowości współczynniki regresji są nadal spójne, ale nie są już wiarygodne, ponieważ błędy standardowe są zawyżone. Oznacza to, że moc predykcyjna modelu nie jest zmniejszona, ale współczynniki mogą nie być istotne statystycznie przy błędzie typu II Błąd typu II W testowaniu hipotez statystycznych błąd typu II to sytuacja, w której test hipotezy nie odrzuca hipotezy zerowej, że to fałsz. W innych .

Dlatego też, jeśli współczynniki zmiennych nie są indywidualnie istotne - nie można ich odrzucić odpowiednio w teście t - ale mogą łącznie wyjaśnić wariancję zmiennej zależnej z odrzuceniem w teście F i wysokim współczynnikiem determinacji (R2), może istnieć współliniowość. Jest to jedna z metod wykrywania współliniowości.

VIF to kolejne powszechnie używane narzędzie do wykrywania, czy w modelu regresji istnieje współliniowość. Mierzy, o ile wariancja (lub błąd standardowy) oszacowanego współczynnika regresji jest zawyżona z powodu kolinearności.

Stosowanie współczynnika inflacji wariancji

VIF można obliczyć według poniższego wzoru:

Czynnik inflacji wariancji - wzór

Gdzie R i 2 reprezentuje nieskorygowany współczynnik determinacji dla regresji i-tej zmiennej niezależnej na pozostałe. Odwrotność VIF jest znana jako tolerancja . W zależności od osobistych preferencji, do wykrywania współliniowości można użyć albo VIF, albo tolerancji.

Jeśli R i 2 jest równe 0, wariancji pozostałych zmiennych niezależnych nie można przewidzieć na podstawie i-tej zmiennej niezależnej. Dlatego, gdy VIF lub tolerancja jest równa 1, to i-ta zmienna niezależna nie jest skorelowana z pozostałymi, co oznacza, że ​​w tym modelu regresji nie istnieje wielokoliniowość. W tym przypadku wariancja i-tego współczynnika regresji nie jest zawyżona.

Ogólnie VIF powyżej 4 lub tolerancja poniżej 0,25 wskazuje, że może istnieć współliniowość i wymagane są dalsze badania. Gdy VIF jest wyższa niż 10 lub tolerancja jest niższa niż 0,1, istnieje znaczna współliniowość, która wymaga korekty.

Jednak są też sytuacje, w których wysokie VFI można bezpiecznie zignorować bez cierpienia z powodu współliniowości. Oto trzy takie sytuacje:

1. Wysokie wartości VIF istnieją tylko w zmiennych kontrolnych, ale nie w zmiennych będących przedmiotem zainteresowania. W tym przypadku interesujące zmienne nie są współliniowe względem siebie ani zmiennych kontrolnych. Nie ma to wpływu na współczynniki regresji.

2. Gdy wysokie FIF są spowodowane włączeniem produktów lub mocy innych zmiennych, współliniowość nie powoduje negatywnych skutków. Na przykład model regresji zawiera zarówno x, jak i x2 jako zmienne niezależne.

3. Kiedy zmienna fikcyjna, która reprezentuje więcej niż dwie kategorie, ma wysoki VIF, współliniowość niekoniecznie istnieje. Zmienne zawsze będą miały wysokie wartości VIF, jeśli w kategorii będzie niewielka część obserwacji, niezależnie od tego, czy zmienne kategorialne są skorelowane z innymi zmiennymi.

Korekta współliniowości

Ponieważ współliniowość zawyża wariancję współczynników i powoduje błędy typu II, konieczne jest jej wykrycie i skorygowanie. Istnieją dwa proste i powszechnie używane sposoby korygowania współliniowości, wymienione poniżej:

1. Pierwszym jest usunięcie jednej (lub więcej) z wysoce skorelowanych zmiennych. Ponieważ informacje dostarczane przez zmienne są zbędne, usunięcie nie wpłynie znacząco na współczynnik determinacji.

2. Druga metoda polega na zastosowaniu analizy składowych głównych (PCA) lub częściowej regresji najmniejszych kwadratów (PLS) zamiast regresji OLS. Regresja PLS może zredukować zmienne do mniejszego zbioru bez korelacji między nimi. W PCA tworzone są nowe nieskorelowane zmienne. Minimalizuje utratę informacji i poprawia przewidywalność modelu.

Więcej zasobów

Finance jest oficjalnym dostawcą globalnego certyfikatu Certified Banking & Credit Analyst (CBCA) ™ CBCA ™ Akredytacja Certified Banking & Credit Analyst (CBCA) ™ to globalny standard dla analityków kredytowych obejmujący finanse, księgowość, analizę kredytową, analizę przepływów pieniężnych , modelowanie warunków umowy, spłaty pożyczek i nie tylko. program certyfikacji, mający pomóc każdemu zostać światowej klasy analitykiem finansowym. Poniższe dodatkowe zasoby będą przydatne, aby kontynuować karierę:

  • Podstawowe pojęcia statystyczne w finansach Podstawowe pojęcia dotyczące statystyki w finansach Dokładne zrozumienie statystyki jest niezwykle ważne, abyśmy mogli lepiej zrozumieć finanse. Ponadto koncepcje statystyczne mogą pomóc inwestorom w monitorowaniu
  • Metody prognozowania Metody prognozowania Najpopularniejsze metody prognozowania. W tym artykule wyjaśnimy cztery rodzaje metod prognozowania przychodów, których analitycy finansowi używają do przewidywania przyszłych przychodów.
  • Wielokrotna regresja liniowa Wielokrotna regresja liniowa Wielokrotna regresja liniowa odnosi się do techniki statystycznej stosowanej do przewidywania wyniku zmiennej zależnej na podstawie wartości zmiennych niezależnych
  • Zmienna losowa Zmienna losowa Zmienna losowa (zmienna stochastyczna) to rodzaj zmiennej statystycznej, której możliwe wartości zależą od wyników pewnego zjawiska losowego

Zalecane

Czy Crackstreams zostały zamknięte?
2022
Czy centrum dowodzenia MC jest bezpieczne?
2022
Czy Taliesin opuszcza kluczową rolę?
2022