Jaki jest współczynnik determinacji?

Współczynnik determinacji (R² lub r-kwadrat) jest miarą statystyczną w modelu regresji, która określa proporcję wariancji w zmiennej zależnej, którą można wyjaśnić zmienną niezależną Zmienna niezależna Zmienna niezależna to dane wejściowe, założenie lub czynnik napędzający która jest zmieniana w celu oceny jej wpływu na zmienną zależną (wynik). . Innymi słowy, współczynnik determinacji mówi, jak dobrze dane pasują do modelu (dobroć dopasowania).

Współczynnik determinacji

Chociaż współczynnik determinacji dostarcza pewnych przydatnych spostrzeżeń dotyczących modelu regresji, nie należy polegać wyłącznie na pomiarze przy ocenie modelu statystycznego. Nie ujawnia informacji o związku przyczynowym między zmiennymi niezależnymi i zależnymi Zmienna zależna Zmienna zależna to taka, która będzie się zmieniać w zależności od wartości innej zmiennej, zwanej zmienną niezależną. i nie wskazuje na poprawność modelu regresji. Dlatego użytkownik powinien zawsze wyciągać wnioski na temat modelu, analizując współczynnik determinacji wraz z innymi zmiennymi w modelu statystycznym.

Współczynnik determinacji może przyjmować dowolne wartości od 0 do 1. Ponadto wskaźnik statystyczny jest często wyrażany w procentach.

Interpretacja współczynnika determinacji (R²)

Najczęstszą interpretacją współczynnika determinacji jest to, jak dobrze model regresji pasuje do obserwowanych danych. Na przykład współczynnik determinacji wynoszący 60% pokazuje, że 60% danych pasuje do modelu regresji. Generalnie wyższy współczynnik oznacza lepsze dopasowanie do modelu.

Jednak nie zawsze jest tak, że wysokie r-kwadrat jest dobre dla modelu regresji. Jakość współczynnika zależy od kilku czynników, w tym jednostek miary zmiennych, charakteru zmiennych użytych w modelu oraz zastosowanej transformacji danych. Dlatego czasami wysoki współczynnik może wskazywać na problemy z modelem regresji.

Żadna uniwersalna reguła nie reguluje, jak uwzględnić współczynnik determinacji w ocenie modelu. Kontekst, w którym opiera się prognoza lub eksperyment, jest niezwykle ważny, a w różnych scenariuszach wgląd w dane statystyczne może się różnić.

Obliczanie współczynnika

Matematycznie współczynnik determinacji można znaleźć za pomocą następującego wzoru:

Formuła

Gdzie:

  • Regresja SS - suma kwadratów wynikająca z regresji (wyjaśniona suma kwadratów)
  • Suma SS - całkowita suma kwadratów

Chociaż terminy „całkowita suma kwadratów” i „suma kwadratów wynikająca z regresji” wydają się mylące, znaczenie zmiennych jest proste.

Całkowita suma kwadratów mierzy zmienność obserwowanych danych (dane używane w modelowaniu regresji). Suma kwadratów wynikająca z regresji mierzy, jak dobrze model regresji przedstawia dane, które zostały użyte do modelowania.

Więcej zasobów

Finance jest oficjalnym dostawcą globalnego programu Financial Modeling & Valuation Analyst (FMVA) ™ Certyfikat FMVA® Dołącz do ponad 350 600 studentów, którzy pracują dla firm takich jak Amazon, JP Morgan i Ferrari, program certyfikacji, który ma pomóc każdemu zostać światowej klasy analitykiem finansowym . Aby kontynuować naukę i rozwijać swoją karierę, przydatne będą poniższe dodatkowe zasoby finansowe:

  • Podstawowe pojęcia statystyczne w finansach Podstawowe pojęcia dotyczące statystyki w finansach Dokładne zrozumienie statystyki jest niezwykle ważne, abyśmy mogli lepiej zrozumieć finanse. Ponadto koncepcje statystyczne mogą pomóc inwestorom w monitorowaniu
  • Rozkład dwumianowy Rozkład dwumianowy Rozkład dwumianowy to typowy rozkład prawdopodobieństwa, który modeluje prawdopodobieństwo uzyskania jednego z dwóch wyników przy określonej liczbie parametrów
  • Centralne twierdzenie graniczne Centralne twierdzenie graniczne Centralne twierdzenie graniczne stwierdza, że ​​średnia z próby zmiennej losowej przyjmie rozkład prawie normalny lub normalny, jeśli wielkość próbki jest duża
  • Analiza regresji Analiza regresji Analiza regresji to zestaw metod statystycznych używanych do szacowania relacji między zmienną zależną a jedną lub większą liczbą zmiennych niezależnych. Można go wykorzystać do oceny siły związku między zmiennymi i do modelowania przyszłych relacji między nimi.

Zalecane

Czy Crackstreams zostały zamknięte?
2022
Czy centrum dowodzenia MC jest bezpieczne?
2022
Czy Taliesin opuszcza kluczową rolę?
2022