Co to są statystyki nieparametryczne?

Statystyka nieparametryczna to metoda wnioskowania statystycznego bez uwzględnienia jakiegokolwiek podstawowego rozkładu. Metoda nie przyjmuje żadnych założeń do rozkładu normalnego. Zazwyczaj podejście to wykorzystuje dane, które często są danymi porządkowymi Porządkowe W statystyce dane porządkowe to typ danych, w których wartości mają naturalny porządek. Jedną z najbardziej godnych uwagi cech danych porządkowych jest to, że opierają się na rankingach, a nie na liczbach.

Statystyki nieparametryczne

Statystyki nieparametryczne można porównać ze statystyką parametryczną. To drugie podejście zawiera wyraźne założenia dotyczące rozkładu obserwowanych danych i szacuje parametry rozkładu przy użyciu tych samych danych.

Podsumowanie

  • Statystyki nieparametryczne to metoda, która pomija wszelkie podstawowe rozkłady podczas wnioskowania statystycznego.
  • Nieparametryczne metody statystyczne mają na celu odkrycie nieznanego podstawowego rozkładu obserwowanych danych, a także dokonanie wnioskowania statystycznego w przypadku braku podstawowego rozkładu.
  • Badaczom zaleca się rozważenie słabych, mocnych stron i potencjalnych pułapek nieparametrycznych statystyk.

Zrozumienie statystyki nieparametrycznej

Rozważ dane o nieznanych parametrach µ (średnia) i σ2 (wariancja). Podczas gdy statystyki parametryczne zakładają, że dane zostały pobrane z rozkładu normalnego Rozkład normalny Rozkład normalny jest również nazywany rozkładem Gaussa lub Gaussa. Ten rodzaj dystrybucji jest szeroko stosowany w naukach przyrodniczych i społecznych. Statystyka nieparametryczna nie zakłada, że ​​dane mają rozkład normalny lub są ilościowe. W związku z tym statystyki nieparametryczne oszacowałyby kształt samego rozkładu zamiast szacowania indywidualnych µ i σ2.

Z drugiej strony statystyki parametryczne wykorzystywałyby średnią z próby i odchylenie standardowe próbki do oszacowania wartości, odpowiednio, µ i σ2. Struktura modelu statystyki nieparametrycznej jest wywnioskowana z obserwowanych danych, w przeciwieństwie do określonych priori . Sam termin nieparametryczny oznacza, że ​​liczba i charakter parametrów są elastyczne, a nie, że całkowicie im brakuje parametrów.

Typy statystyk nieparametrycznych

Istnieją dwa główne typy nieparametrycznych metod statystycznych. Pierwsza metoda ma na celu odkrycie nieznanego podstawowego rozkładu obserwowanych danych, podczas gdy druga metoda próbuje wyciągnąć wnioski statystyczne z pominięciem podstawowego rozkładu.

Metody jądra i histogramy Histogram Histogram służy do podsumowania danych dyskretnych lub ciągłych. Innymi słowy, histogram zapewnia wizualną interpretację danych liczbowych, pokazując liczbę punktów danych, które mieszczą się w określonym zakresie wartości (zwanych „pojemnikami”). Histogram jest podobny do pionowego wykresu słupkowego. Jednak histogramy są powszechnie używane do szacowania wartości parametrów w pierwszym podejściu. Z drugiej strony, ta druga metoda polega na testowaniu hipotez bez rzeczywistych wartości danych, ale raczej w oparciu o porządek rang danych.

Testy statystyki nieparametrycznej są zwykle łatwiejsze do zastosowania niż statystyki parametryczne, biorąc pod uwagę brak założeń dotyczących parametrów populacji. Standardowe procedury matematyczne testowania hipotez nie zakładają żadnych założeń dotyczących rozkładów prawdopodobieństwa - w tym testów t dla dystrybucji, testów znakowych i wnioskowania o pojedynczej populacji.

Na przykład podczas testowania hipotezy, że „istnieje różnica w medianach”, dwie zmienne losowe, X i Y, definiują dwa ciągłe rozkłady między miejscem, w którym hipoteza jest wykonywana, a sparowanymi próbami. Oprócz ogólnej stosowalności testowi brakuje również mocy statystycznej innych testów, biorąc pod uwagę, że działa przy kilku założeniach.

Przykłady statystyk nieparametrycznych

Załóżmy, że badacza interesuje oszacowanie liczby urodzonych dzieci z żółtaczką w stanie Kalifornia. Analiza zbioru danych może być przeprowadzona poprzez pobranie próbki 5000 dzieci. Wyprowadzonym pomiarem jest oszacowanie całej populacji niemowląt z żółtaczką urodzonych w następnym roku.

W drugim przypadku rozważ dwie grupy różnych badaczy. Są zainteresowani tym, czy marketing ogólny, czy marketing komercyjny jest powiązany z tym, jak szybko firma zyskuje pozycję marki. Zakładając, że wielkość próby jest wybierana losowo, jej rozkład pod względem szybkości, z jaką firma realizuje pozycjonowanie marki. Pozycjonowanie rynkowe Pozycjonowanie rynkowe, odnosi się do możliwości wpływania na postrzeganie marki lub produktu przez konsumentów w stosunku do konkurencji. Można założyć, że cel rynku jest normalny. Niemniej jednak nie można założyć, że eksperyment, który mierzy strategiczne cele firmy dotyczące dynamiki rynku (który determinuje również pozycjonowanie marki) przybiera normalną dystrybucję.

Główną ideą tego zjawiska jest to, że losowo wybrane dane mogą zawierać takie czynniki, jak dynamika rynku. Z drugiej strony, jeśli w grę wchodzą takie czynniki, jak segment rynku i konkurencja, strategiczne cele firmy prawdopodobnie nie wpłyną na wielkość próby. Takie podejście jest skuteczne, gdy dane nie mają jasnej interpretacji liczbowej.

Na przykład testy dotyczące tego, czy klienci preferują określony produkt ze względu na jego wartość odżywczą, mogą obejmować ranking jego wskaźników, w których zdecydowanie się zgadzam, zgadzam się, obojętny, nie zgadzam się i zdecydowanie się nie zgadzam. W takim scenariuszu przydaje się metoda nieparametryczna.

Kluczowe wnioski

Stosowanie nieparametrycznych podejść statystycznych w badaniach wymaga należytej staranności w odniesieniu do słabych, mocnych stron i potencjalnych pułapek. Prawdą jest, że dla dystrybucji danych z nadmierną kurtoozą lub skośnością; Testy nieparametryczne oparte na rangach okazują się silniejsze niż testy parametryczne.

Mimo to nie we wszystkich przypadkach, gdy założenia parametryczne nie są spełnione, przyjmujemy statystykę nieparametryczną jako metody zastępcze ze względu na stosunkowo niski stopień ufności uzyskany z wcześniejszych statystyk.

Doceniane są statystyki nieparametryczne, ponieważ można je łatwo zastosować. Dane stają się bardziej przydatne w różnych testach, ponieważ parametry nie są obowiązkowe. Co ważniejsze, statystyki można wykorzystać w przypadku braku istotnych informacji, takich jak średnia, odchylenie standardowe lub wielkość próby. Cechy te sprawiają, że statystyki nieparametryczne mają szerszy zakres zastosowania w porównaniu ze statystyką parametryczną.

Dodatkowe zasoby

Finance jest oficjalnym dostawcą globalnego certyfikatu Certified Banking & Credit Analyst (CBCA) ™ CBCA ™ Akredytacja Certified Banking & Credit Analyst (CBCA) ™ to globalny standard dla analityków kredytowych obejmujący finanse, księgowość, analizę kredytową, analizę przepływów pieniężnych , modelowanie warunków umowy, spłaty pożyczek i nie tylko. program certyfikacji, mający pomóc każdemu zostać światowej klasy analitykiem finansowym. Aby kontynuować karierę, przydatne będą poniższe dodatkowe zasoby finansowe:

  • Podstawowe pojęcia statystyczne w finansach Podstawowe pojęcia dotyczące statystyki w finansach Dokładne zrozumienie statystyki jest niezwykle ważne, abyśmy mogli lepiej zrozumieć finanse. Ponadto koncepcje statystyczne mogą pomóc inwestorom w monitorowaniu
  • Testowanie hipotez Testowanie hipotez Testowanie hipotez Testowanie hipotez jest metodą wnioskowania statystycznego. Służy do sprawdzenia, czy stwierdzenie dotyczące parametru populacji jest poprawne. Testowanie hipotez
  • Dane nominalne Dane nominalne W statystykach dane nominalne (znane również jako skala nominalna) to typ danych, który jest używany do oznaczania zmiennych bez podawania wartości ilościowej
  • Testy nieparametryczne Testy nieparametryczne W statystyce testy nieparametryczne to metody analizy statystycznej, które nie wymagają rozkładu, aby spełnić wymagane założenia do analizy

Zalecane

Czy Crackstreams zostały zamknięte?
2022
Czy centrum dowodzenia MC jest bezpieczne?
2022
Czy Taliesin opuszcza kluczową rolę?
2022