Co to jest skorygowane R-kwadrat?

Skorygowany R-kwadrat to zmodyfikowana wersja R-kwadrat, która uwzględnia predyktory, które nie są istotne w modelu regresji. Innymi słowy, skorygowany R-kwadrat pokazuje, czy dodanie dodatkowych predyktorów poprawia model regresji, czy nie. Aby zrozumieć skorygowane R-kwadrat, wymagane jest zrozumienie R-kwadrat.

Podsumowanie:

  • Skorygowany R-kwadrat jest zmodyfikowaną wersją R-kwadrat, która dostosowuje predyktory, które nie są istotne w modelu regresji.
  • W porównaniu z modelem z dodatkowymi zmiennymi wejściowymi, niższe skorygowane R-kwadrat wskazuje, że dodatkowe zmienne wejściowe nie dodają wartości do modelu.
  • W porównaniu z modelem z dodatkowymi zmiennymi wejściowymi, wyższy skorygowany R-kwadrat wskazuje, że dodatkowe zmienne wejściowe dodają wartość do modelu.

Co to jest R-kwadrat?

R-kwadrat, zwany również współczynnikiem determinacji. które zmienne wejściowe (zmienne predykcyjne) wyjaśniają zmienność zmiennych wyjściowych (zmienne przewidywane). Zakres wynosi od 0 do 1. Na przykład, jeśli R-kwadrat wynosi 0,9, oznacza to, że 90% zmienności zmiennych wyjściowych jest wyjaśnionych przez zmienne wejściowe. Ogólnie rzecz biorąc, wyższy R-kwadrat oznacza lepsze dopasowanie do modelu. Rozważ poniższy diagram:

Skorygowane R-kwadrat

Niebieska linia odnosi się do linii najlepszego dopasowania i pokazuje związek między zmiennymi. Linia jest obliczana za pomocą analizy regresji. Analiza regresji Analiza regresji to zestaw metod statystycznych używanych do szacowania relacji między zmienną zależną a jedną lub większą liczbą zmiennych niezależnych. Można go wykorzystać do oceny siły związku między zmiennymi i do modelowania przyszłych relacji między nimi. i jest wykreślany tam, gdzie pionowe odległości (niebieskie przerywane linie) żółtych kropek do linii najlepszego dopasowania są zminimalizowane.

Żółte kropki odnoszą się do wykresu zmiennych wejściowych i wyjściowych. Zmienna wejściowa jest wykreślana na osi X, a zmienna wyjściowa na osi Y. Na przykład powyższy wykres składa się z następującego zbioru danych:

Skorygowane R-kwadrat - dane wykresu

Niebieskie przerywane linie odnoszą się do odległości wykresu zmiennych wejściowych i wyjściowych od linii najlepszego dopasowania. R-kwadrat jest obliczany na podstawie odległości wszystkich żółtych kropek od linii najlepszego dopasowania (niebieskiej linii). Na przykład poniższy diagram ilustruje R-kwadrat równy 1:

R-kwadrat 1

Problemy z R-kwadrat

R-kwadrat wiąże się z nieodłącznym problemem - dodatkowe zmienne wejściowe spowodują, że R-kwadrat pozostanie bez zmian lub wzrośnie (wynika to z matematycznego obliczania R-kwadrat). Dlatego nawet jeśli dodatkowe zmienne wejściowe nie wykazują związku ze zmiennymi wyjściowymi, R-kwadrat wzrośnie. Przykład wyjaśniający takie zdarzenie podano poniżej.

Zrozumienie skorygowanego R-kwadrat

Zasadniczo skorygowane R-kwadrat sprawdza, czy dodatkowe zmienne wejściowe mają wpływ na model. Rozważmy przykład wykorzystujący dane zebrane przez właściciela pizzy, jak pokazano poniżej:

Przykładowe dane

Załóżmy, że właściciel pizzy przeprowadza dwie regresje:

Regresja 1: Cena ciasta (zmienna wejściowa), Cena pizzy (zmienna wyjściowa)

Regresja 1 daje R-kwadrat wynoszący 0,9557 i skorygowany R-kwadrat wynoszący 0,9493.

Regresja 2: Temperatura (zmienna wejściowa 1), Cena ciasta (zmienna wejściowa 2), Cena pizzy (zmienna wyjściowa)

Regresja 2 daje R-kwadrat 0,9573 i skorygowany R-kwadrat 0,9431.

Chociaż temperatura nie powinna wywierać żadnego wpływu na cenę pizzy, R-kwadrat wzrósł z 0,9557 (regresja 1) do 0,9573 (regresja 2). Można sądzić, że regresja 2 ma wyższą moc predykcyjną, ponieważ R-kwadrat jest wyższy. Chociaż zmienna wejściowa temperatury jest bezużyteczna w przewidywaniu ceny pizzy, zwiększyła R-kwadrat. Tutaj pojawia się skorygowany R-kwadrat.

Skorygowane R-kwadrat sprawdza, czy do modelu przyczyniają się dodatkowe zmienne wejściowe. Skorygowany R-kwadrat w Regresji 1 wyniósł 0,9493 w porównaniu do skorygowany R-kwadrat w Regresji 2 wynoszący 0,9493. Dlatego skorygowane R-kwadrat jest w stanie zidentyfikować, że zmienna wejściowa temperatury nie jest pomocna w wyjaśnianiu zmiennej wyjściowej (ceny pizzy). W takim przypadku skorygowany R-kwadrat wskazywałby twórcy modelu na użycie Regresji 1 zamiast Regresji 2.

Przykład skorygowanego R-kwadrat

Rozważ dwa modele:

  • Model 1 wykorzystuje zmienne wejściowe X1, X2 i X3 do przewidywania Y1.
  • Model 2 wykorzystuje zmienne wejściowe X1 i X2 do przewidywania Y1.

Który model wybrać? Informacje dotyczące obu modeli podano poniżej:

Przykład

Porównując R-kwadrat między Model 1 i Model 2, R-kwadrat przewiduje, że Model 1 jest lepszym modelem, ponieważ niesie większą moc wyjaśniającą (0,5923 w Modelu 1 w porównaniu z 0,5612 w Modelu 2).

Porównując R-kwadrat między Model 1 i Model 2, skorygowany R-kwadrat przewiduje, że zmienna wejściowa X3 przyczynia się do wyjaśnienia zmiennej wyjściowej Y1 (0,4231 w Modelu 1 w porównaniu z 0,3512 w Modelu 2).

W związku z tym należy zastosować Model 1, ponieważ dodatkowa zmienna wejściowa X3 przyczynia się do wyjaśnienia zmiennej wyjściowej Y1.

Dodatkowe zasoby

Finance oferuje program Financial Modeling & Valuation Analyst (FMVA) ™ Certyfikat FMVA® Dołącz do ponad 350 600 studentów, którzy pracują dla firm takich jak Amazon, JP Morgan i Ferrari, z programem certyfikacji dla tych, którzy chcą przenieść swoją karierę na wyższy poziom. Aby kontynuować naukę i rozwijać swoją karierę, pomocne będą następujące zasoby finansowe:

  • Podstawowe pojęcia statystyczne w finansach Podstawowe pojęcia dotyczące statystyki w finansach Dokładne zrozumienie statystyki jest niezwykle ważne, abyśmy mogli lepiej zrozumieć finanse. Ponadto koncepcje statystyczne mogą pomóc inwestorom w monitorowaniu
  • Metoda wysokiego-niskiego a analiza regresji Metoda wysokiego niskiego a analiza regresji Metoda wysokiego-niskiego i analiza regresji to dwie główne metody szacowania kosztów stosowane do szacowania kwot kosztów stałych i zmiennych. Zazwyczaj menedżerowie muszą rozbijać koszty mieszane na składniki stałe i zmienne, aby przewidywać i planować przyszłość.
  • Zmienna niezależna Zmienna niezależna Zmienna niezależna to dane wejściowe, założenie lub czynnik, który jest zmieniany w celu oceny jej wpływu na zmienną zależną (wynik).
  • Rodzaje analizy finansowej Rodzaje analizy finansowej Analiza finansowa obejmuje wykorzystanie danych finansowych do oceny wyników firmy i wydawania zaleceń dotyczących możliwości poprawy w przyszłości. Analitycy finansowi wykonują swoją pracę głównie w programie Excel, używając arkusza kalkulacyjnego do analizy danych historycznych i sporządzania prognoz Rodzaje analiz finansowych

Zalecane

Co to jest kompozyt NASDAQ?
Co to jest wycena oparta na aktywach?
Co to jest oferta gotówkowa?