Co to jest LASSO?

LASSO, skrót od Least Absolute Shrinkage and Selection Operator, to formuła statystyczna, której głównym celem jest selekcja cech i regularyzacja modeli danych. Metoda została po raz pierwszy wprowadzona w 1996 roku przez profesora statystyki Roberta Tibshirani. LASSO wprowadza parametry do sumy modelu, nadając mu górną granicę, która działa jak ograniczenie sumy, aby zawierała parametry bezwzględne w dopuszczalnym zakresie.

lasso

Metoda LASSO reguluje parametry modelu poprzez zmniejszanie współczynników regresji, zmniejszając niektóre z nich do zera. Faza wyboru cechy następuje po skurczu, w której każda wartość niezerowa jest wybierana do wykorzystania w modelu. Metoda ta ma istotne znaczenie dla minimalizacji błędów prognoz, które są powszechne w modelach statystycznych.Analiza ilościowa Analiza ilościowa to proces gromadzenia i oceny mierzalnych i weryfikowalnych danych, takich jak przychody, udział w rynku i płace, w celu zrozumienia zachowania i wyników biznes. W dobie technologii danych analiza ilościowa jest uważana za preferowane podejście do podejmowania świadomych decyzji. .

LASSO oferuje modele o wysokiej dokładności prognozowania. Dokładność wzrasta, ponieważ metoda obejmuje kurczenie się współczynników, co z kolei zmniejsza wariancję i minimalizuje odchylenie. Działa najlepiej, gdy liczba obserwacji jest mała, a liczba cech jest duża. W dużym stopniu opiera się na parametrze λ, który jest czynnikiem kontrolującym skurcz. Im większe λ, tym więcej współczynników musi wynosić zero.

Gdy λ jest równe zero, model staje się regresją zwykłych najmniejszych kwadratów. W konsekwencji, gdy wzrasta λ, wariancja znacznie maleje, a także zwiększa się odchylenie wyniku. Lasso jest również użytecznym narzędziem do eliminowania wszystkich zmiennych, które są nieistotne i nie są związane ze zmienną odpowiedzi.

LASSO w statystycznych modelach liniowych

Model statystyczny to matematyczna reprezentacja problemu w prawdziwym życiu. Model powinien przedstawiać problem jak najbliżej rzeczywistego świata, jednocześnie czyniąc go prostym i łatwym do zrozumienia. Model składa się ze zmiennych objaśniających i odpowiedzi.

Zmienna objaśniająca jest niezależną zmienną, która jest według uznania badacza. Zmienne niezależne to dane wejściowe do modelu, które badacz może zmierzyć w celu określenia ich wpływu na wyniki modelu.

Zmienna odpowiedź jest zależna zmienna zależna Zmienna A Zmienna zależna jest jeden, który zmienia się w zależności od wartości innej zmiennej o nazwie zmienna niezależna. która stanowi główny przedmiot eksperymentu. Tworzy wynik eksperymentu, który może być pojedynczym wynikiem w przypadku modeli jednowymiarowych lub, w przypadku modeli wielowymiarowych, wynikami wielokrotnymi.

LASSO stanowi integralną część procesu budowania modelu, szczególnie przy użyciu wyboru cech. Faza selekcji cech pomaga w doborze zmiennych objaśniających, które są zmiennymi niezależnymi, a co za tym idzie, zmiennymi wejściowymi w modelu.

Zmienne wejściowe są ważnymi elementami, które określają wynik modelu i pomagają w pomiarze ich wpływu na zmienne odpowiedzi. Wybór odpowiednich zmiennych decyduje o dokładności modelu. Faza wyboru cech LASSO pomaga we właściwym doborze zmiennych.

Oszacowanie z LASSO

Modele statystyczne opierają się na LASSO w celu dokładnego doboru zmiennych i uregulowania. W analizie regresji liniowej Analiza regresji Analiza regresji to zestaw metod statystycznych używanych do szacowania zależności między zmienną zależną a jedną lub większą liczbą zmiennych niezależnych. Można go wykorzystać do oceny siły związku między zmiennymi i do modelowania przyszłych relacji między nimi. na przykład LASSO wprowadza górną granicę sumy kwadratów, minimalizując w ten sposób błędy występujące w modelu. Estymator LASSO zależy od parametru λ.

Parametr λ kontroluje siłę skurczu, gdzie wzrost λ skutkuje wzrostem skurczu. Górna granica sumy wszystkich współczynników jest odwrotnie proporcjonalna do parametru λ. Wraz ze wzrostem wartości górnej granicy parametr λ maleje. Wraz ze spadkiem górnej granicy parametr λ rośnie jednocześnie.

Gdy górna granica rośnie w kierunku nieskończoności, parametr λ zbliża się do zera, przekształcając doświadczenie w zwykłe najmniejsze kwadraty, w których parametr λ jest zawsze równy zero. Kiedy górne wartości współczynników zbliżają się do zera, wartość parametru λ rośnie w kierunku nieskończoności.

Geometria LASSO

LASSO tworzy na wykresie kształt rombu dla swojego obszaru ograniczonego, jak pokazano na poniższym obrazku. Kształt rombu zawiera narożniki, w przeciwieństwie do okrągłego kształtu utworzonego przez regresję grzbietu. Bliskość pierwszego punktu do narożnika wskazuje, że model ma jeden współczynnik równy zero.

Region ograniczeń regresji grzbietu tworzy okrągły kształt, który nie zawiera narożników podobnych do tych utworzonych przez region ograniczeń LASSO podczas kreślenia. Dlatego współczynniki regresji grzbietu nie mogą być równe zeru.

Ważone LASSO

Ważona LASSO jest wynikiem indywidualnego ukarania przez badacza współczynników regresji. Oznacza to, że zamiast karać wspólny parametr λ dla wszystkich współczynników, współczynniki są karane indywidualnie, przy użyciu różnych parametrów.

Wagi można określić za pomocą algorytmu LASSO, aby odpowiednio przypisać wagi w celu dokładnego modelowania. Podobną wagą współczynników regresji jest kooperatywna LASSO, w której współczynniki są karane w grupach uznanych za podobne.

Dodatkowe zasoby

Finance jest oficjalnym dostawcą Certyfikatu Certified Banking & Credit Analyst (CBCA) ™ CBCA ™ Akredytacja Certified Banking & Credit Analyst (CBCA) ™ to globalny standard dla analityków kredytowych obejmujący finanse, rachunkowość, analizę kredytową, analizę przepływów pieniężnych, modelowanie warunków umowy, spłaty pożyczek i nie tylko. program certyfikacji, mający na celu przekształcenie każdego w światowej klasy analityka finansowego.

Aby dalej uczyć się i rozwijać swoją wiedzę na temat analizy finansowej, zdecydowanie zalecamy poniższe dodatkowe zasoby finansowe:

  • Metody prognozowania Metody prognozowania Najpopularniejsze metody prognozowania. W tym artykule wyjaśnimy cztery rodzaje metod prognozowania przychodów, których analitycy finansowi używają do przewidywania przyszłych przychodów.
  • Zmienna niezależna Zmienna niezależna Zmienna niezależna to dane wejściowe, założenie lub czynnik, który jest zmieniany w celu oceny jej wpływu na zmienną zależną (wynik).
  • Wielokrotna regresja liniowa Wielokrotna regresja liniowa Wielokrotna regresja liniowa odnosi się do techniki statystycznej stosowanej do przewidywania wyniku zmiennej zależnej na podstawie wartości zmiennych niezależnych
  • Analiza scenariuszy Analiza scenariuszy Analiza scenariuszy to technika wykorzystywana do analizowania decyzji poprzez spekulowanie różnych możliwych wyników inwestycji finansowych. W modelowaniu finansowym to

Zalecane

Czy Crackstreams zostały zamknięte?
2022
Czy centrum dowodzenia MC jest bezpieczne?
2022
Czy Taliesin opuszcza kluczową rolę?
2022