Regresija najmanjših kvadratov - kako ustvariti linijo, ki najbolje ustreza?

Opredelitev metode regresiranja najmanjših kvadratov

Regresijska metoda najmanjših kvadratov je oblika regresijske analize, ki vzpostavi razmerje med odvisno in neodvisno spremenljivko skupaj z linearno črto. Ta vrstica se imenuje "linija, ki najbolje ustreza."

Regresijska analiza je statistična metoda, s pomočjo katere lahko ocenimo ali predvidimo neznane vrednosti ene spremenljivke iz znanih vrednosti druge spremenljivke. Spremenljivka, ki se uporablja za napovedovanje spremenljivke obresti, se imenuje neodvisna ali pojasnjevalna spremenljivka, spremenljivka, ki se napoveduje, pa odvisna ali razložena spremenljivka.

Upoštevajmo dve spremenljivki, x & y. Ti so narisani na grafu z vrednostmi x na osi x vrednosti y na osi y. Te vrednosti so predstavljene s pikami na spodnjem grafu. Skozi pike je narisana ravna črta - imenovana črta, ki se najbolje prilega.

Cilj regresije najmanjših kvadratov je zagotoviti, da črta, ki poteka skozi nabor vrednosti, vzpostavi najbližjo povezavo med vrednostmi.

Formula regresije najmanjših kvadratov

Regresijska črta po metodi najmanjših kvadratov se izračuna po naslednji formuli -

ŷ = a + bx

Kje,

  • ŷ = odvisna spremenljivka
  • x = neodvisna spremenljivka
  • a = presek y
  • b = naklon črte

Naklon črte b se izračuna po naslednji formuli -

Ali

Y-prerez, 'a' se izračuna po naslednji formuli -

Vrstica najboljšega ujema v najmanj kvadratni regresiji

Črta, ki se najbolje prilega, je ravna črta, ki je narisana skozi razpršene točke podatkov, ki najbolje predstavlja odnos med njima.

Upoštevajmo naslednji graf, v katerem je niz podatkov narisan vzdolž osi x in y. Te podatkovne točke so predstavljene z modrimi pikami. Skozi te točke so narisane tri črte - zelena, rdeča in modra črta. Zelena črta prehaja skozi eno točko, rdeča črta pa skozi tri podatkovne točke. Vendar modra črta prehaja skozi štiri podatkovne točke, razdalja med preostalimi točkami do modre črte pa je minimalna v primerjavi z ostalima dvema črtama.

V zgornjem grafu modra črta predstavlja črto, ki najbolje ustreza, saj leži najbližje vsem vrednostim, razdalja med točkami zunaj črte in črto pa je minimalna (tj. Razdalja med ostanki do črte, ki najbolje ustreza - imenovane tudi vsote kvadratov ostankov). V ostalih dveh vrsticah, oranžni in zeleni, je razdalja med ostanki do vrstic večja kot v primerjavi z modro črto.

Metoda najmanjših kvadratov zagotavlja najbližjo povezavo med odvisnimi in neodvisnimi spremenljivkami tako, da zmanjšuje razdaljo med ostanki in črto, ki najbolje ustreza, tj. Vsota kvadratov ostankov je pri tem pristopu minimalna. Od tod tudi izraz "najmanjši kvadrati".

Primeri regresijske črte najmanjših kvadratov

Uporabimo te formule v spodnjem vprašanju -

Primer # 1

Podrobnosti, ki se nanašajo na izkušnje tehnikov v podjetju (čez nekaj let) in njihovo oceno uspešnosti, so navedene v spodnji tabeli. Na podlagi teh vrednosti ocenite zmogljivost tehnika za 20 let izkušenj.

Izkušnje tehnika (v letih) Ocena uspešnosti
16. 87
12. 88
18. 89
4. 68
3. 78
10. 80
5. 75
12. 83

Rešitev -

Za izračun najmanjših kvadratov bomo najprej izračunali presek Y (a) in naklon črte (b), kot sledi -

Naklon črte (b)

  • b = 6727 - ((80 * 648) / 8) / 1018 - ((80) 2 /8)
  • = 247/218
  • = 1,13

Prerez Y (a)

  • a = 648 - (1,13) (80) / 8
  • = 69,7

Regresijska črta se izračuna na naslednji način -

Če vrednost x v formuli nadomestimo z 20,

  • ŷ = a + bx
  • ŷ = 69,7 + (1,13) (20)
  • ŷ = 92,3

Ocenjena zmogljivost tehnika za 20 let izkušenj je ocenjena na 92,3.

2. primer

Enačba najmanjših kvadratov z uporabo Excela

Regresijsko enačbo najmanjših kvadratov lahko izračunamo z uporabo excela v naslednjih korakih -

  • Vstavite tabelo podatkov v excel.
  • Vstavite razpršeni graf z uporabo podatkovnih točk.
  • V graf raztresenja vstavite linijo trenda.
  • Pod možnostmi trendne črte - izberite linearno linijo trenda in izberite enačbo prikaza na grafikonu.
  • Na grafikonu je prikazana enačba regresije najmanjših kvadratov za dani nabor podatkov excel.

Tako se izračuna enačba regresije najmanjših kvadratov za dani nabor podatkov excel. Z uporabo enačbe lahko izdelamo napovedi in analize trendov. Orodja Excel omogočajo tudi podrobne regresijske izračune.

Prednosti

  • Metoda regresijske analize najmanjših kvadratov je najprimernejša za modele napovedovanja in analizo trenda. Najbolje se uporablja na področjih ekonomije, financ in delniških trgov, kjer se vrednost katere koli prihodnje spremenljivke napove s pomočjo obstoječih spremenljivk in razmerja med njimi.
  • Metoda najmanjših kvadratov zagotavlja najbližjo povezavo med spremenljivkami. Razlika med vsotami kvadratov ostankov in črto, ki najbolje ustreza, je pri tej metodi minimalna.
  • Računski mehanizem je preprost in enostaven za uporabo.

Slabosti

  • Metoda najmanjših kvadratov temelji na vzpostavljanju najbližjega razmerja med dano množico spremenljivk. Računski mehanizem je občutljiv na podatke in v primeru kakršnih koli odstopanj (izjemni podatki) lahko rezultati v glavnem vplivajo.
  • Ta vrsta izračuna je najprimernejša za linearne modele. Za nelinearne enačbe se uporabljajo izčrpnejši računski mehanizmi.

Zaključek

Metoda najmanjših kvadratov je ena najpogosteje uporabljenih metod za napovedovanje modelov in analizo trenda. Ob ustreznem izračunu prinese najboljše rezultate.

Zanimive Članki...