Przewodniki finansowe

Co to jest regresja wieloliniowa?

Wielokrotna regresja liniowa odnosi się do techniki statystycznej używanej do przewidywania wyniku zmiennej na podstawie wartości dwóch lub więcej zmiennych. Czasami jest nazywany po prostu regresją wielokrotną i stanowi rozszerzenie regresji liniowej. Zmienna, którą chcemy przewidzieć, nazywana jest zmienną zależną, natomiast zmienne, których używamy do przewidywania wartości zmiennej zależnej Zmienna zależna Zmienna zależna to taka, która będzie się zmieniać w zależności od wartości innej zmiennej, zwanej zmienną niezależną. są znane jako zmienne niezależne lub objaśniające.

Rysunek 1: Przewidywania modelu wielokrotnej regresji liniowej dla poszczególnych obserwacji (źródło)

Podsumowanie

Wielokrotna regresja liniowa odnosi się do techniki statystycznej, która wykorzystuje dwie lub więcej zmiennych niezależnych do przewidywania wyniku zmiennej zależnej.
Technika ta umożliwia analitykom określenie zmienności modelu i względnego udziału każdej zmiennej niezależnej w całkowitej wariancji.
Regresja wielokrotna może przybierać dwie formy, tj. Regresję liniową i regresję nieliniową.

Formuła wielokrotnej regresji liniowej

Gdzie:

Yi jest zmienna zależna lub przewidywane
β0 jest punktem przecięcia z osią y, tj. wartością y, gdy zarówno xi, jak i x2 są równe 0.
β1 i β2 to współczynniki regresji, które reprezentują zmianę yw stosunku do zmiany o jedną jednostkę odpowiednio w xi1 i xi2 .
βp jest współczynnikiem nachylenia dla każdej zmiennej niezależnej
ϵ jest składnikiem błędu losowego (rezydualnego) modelu.

Zrozumienie wielokrotnej regresji liniowej

Prosta regresja liniowa umożliwia statystykom przewidywanie wartości jednej zmiennej na podstawie dostępnych informacji o innej zmiennej. Regresja liniowa próbuje ustalić związek między dwiema zmiennymi wzdłuż linii prostej.

Regresja wieloraka to typ regresji, w którym zmienna zależna wykazuje liniową zależność z co najmniej dwoma zmiennymi niezależnymi. Może być również nieliniowy , gdy zmienne zależne i niezależne Zmienna niezależna Zmienna niezależna to dane wejściowe, założenie lub czynnik, który jest zmieniany w celu oceny jej wpływu na zmienną zależną (wynik). nie podążaj za linią prostą.

Zarówno regresja liniowa, jak i nieliniowa śledzą określoną odpowiedź przy użyciu graficznie dwóch lub więcej zmiennych. Jednak regresja nieliniowa jest zwykle trudna do wykonania, ponieważ jest tworzona na podstawie założeń wywiedzionych z prób i błędów.

Założenia wielokrotnej regresji liniowej

Wielokrotna regresja liniowa opiera się na następujących założeniach:

1. Liniowa zależność między zmienną zależną i niezależną

Pierwszym założeniem wielokrotnej regresji liniowej jest to, że istnieje liniowa zależność między zmienną zależną a każdą ze zmiennych niezależnych. Najlepszym sposobem sprawdzenia zależności liniowych jest utworzenie wykresów rozrzutu, a następnie wizualne sprawdzenie liniowości. Jeśli zależność wyświetlana na wykresie rozrzutu nie jest liniowa, analityk będzie musiał przeprowadzić regresję nieliniową lub przekształcić dane za pomocą oprogramowania statystycznego, takiego jak SPSS.

2. Zmienne niezależne nie są ze sobą silnie skorelowane

Dane nie powinny wykazywać współliniowości, która występuje, gdy zmienne niezależne (zmienne objaśniające) są ze sobą silnie skorelowane. Gdy zmienne niezależne wykazują współliniowość, pojawią się problemy z określeniem konkretnej zmiennej, która przyczynia się do wariancji zmiennej zależnej. Najlepszą metodą do sprawdzenia tego założenia jest metoda współczynnika inflacji wariancji.

3. Wariancja reszt jest stała

Wielokrotna regresja liniowa zakłada, że wielkość błędu reszt jest podobna w każdym punkcie modelu liniowego. Ten scenariusz jest znany jako homoskedastyczność. Analizując dane, analityk powinien wykreślić standardowe reszty względem przewidywanych wartości, aby określić, czy punkty są sprawiedliwie rozłożone na wszystkie wartości zmiennych niezależnych. Aby przetestować założenie, dane można wykreślić na wykresie rozrzutu lub za pomocą oprogramowania statystycznego w celu utworzenia wykresu rozrzutu obejmującego cały model.

4. Niezależność obserwacji

Model zakłada, że obserwacje powinny być od siebie niezależne. Mówiąc najprościej, model zakłada, że wartości reszt są niezależne. Aby przetestować to założenie, używamy statystyki Durbina Watsona.

Test pokaże wartości od 0 do 4, gdzie wartość od 0 do 2 oznacza dodatnią autokorelację, a wartości od 2 do 4 - ujemną autokorelację. Punkt środkowy, tj. Wartość 2, pokazuje, że nie ma autokorelacji.

5. Normalność wielowymiarowa

Wielowymiarowa normalność występuje, gdy reszty mają rozkład normalny. Aby przetestować to założenie, przyjrzyj się rozkładowi wartości reszt. Można go również zbadać dwiema głównymi metodami, tj. Histogramem z nałożoną krzywą normalną lub metodą wykresu prawdopodobieństwa normalnego.

Więcej zasobów

Finance oferuje Certified Banking & Credit Analyst (CBCA) ™ CBCA ™ Certification Akredytacja Certified Banking & Credit Analyst (CBCA) ™ to globalny standard dla analityków kredytowych obejmujący finanse, rachunkowość, analizę kredytową, analizę przepływów pieniężnych, modelowanie zobowiązań, pożyczki spłaty i nie tylko. program certyfikacji dla tych, którzy chcą przenieść swoją karierę na wyższy poziom. Aby dalej uczyć się i rozwijać swoją bazę wiedzy, zapoznaj się z dodatkowymi odpowiednimi zasobami finansowymi poniżej:

Metody prognozowania Metody prognozowania Najpopularniejsze metody prognozowania. W tym artykule wyjaśnimy cztery rodzaje metod prognozowania przychodów, których analitycy finansowi używają do przewidywania przyszłych przychodów.
Rozkład Poissona Rozkład Poissona Rozkład Poissona jest narzędziem używanym w statystyce teorii prawdopodobieństwa do przewidywania wielkości odchylenia od znanej średniej częstości występowania, w ramach
Zmienna losowa Zmienna losowa Zmienna losowa (zmienna stochastyczna) to rodzaj zmiennej statystycznej, której możliwe wartości zależą od wyników pewnego zjawiska losowego
Analiza regresji Analiza regresji Analiza regresji to zestaw metod statystycznych używanych do szacowania relacji między zmienną zależną a jedną lub większą liczbą zmiennych niezależnych. Można go wykorzystać do oceny siły związku między zmiennymi i do modelowania przyszłych relacji między nimi.