Regresija (pomen, vrste) - Kaj je regresijska analiza?

Kaj je regresija?

Regresijska analiza je statistično merjenje, ki se uporablja v financah, naložbah itd., Katerega namen je vzpostaviti razmerje med odvisno spremenljivko in drugimi vrstami neodvisnih spremenljivk, glavni poudarek pa je določitev moči zgoraj navedenega razmerja.

Pojasnila

  • Za razlago regresijske analize v laičnem izrazu predpostavimo, da se vodja prodaje podjetja trudi napovedati prodajo v naslednjem mesecu. Vključeni so številni dejavniki, ki spodbujajo prodajo izdelka, od vremena do nove strategije konkurenta, festivala in spremembe življenjskega sloga potrošnikov.
  • To je metoda usklajevanja med več dejavniki, ki vplivajo na prodajo, ki imajo največji vpliv. Pomaga lahko pri odgovarjanju na številna vprašanja, na primer, kateri so najpomembnejši dejavniki, kateri dejavniki so manj pomembni, kakšen je odnos med njimi in kar je najpomembneje, kakšna je njihova zanesljivost.
  • Ti dejavniki se imenujejo spremenljivke. Glavni dejavnik, ki ga poskušamo napovedati, se imenuje odvisna spremenljivka, drugi dejavniki, ki vplivajo na odvisno spremenljivko, pa neodvisne spremenljivke.

Formula

Preprosto linearno regresijsko analizo v Excelu lahko izrazimo kot spodnjo formulo in meri razmerje med odvisno spremenljivko in eno neodvisno spremenljivko.

Y = a + bX + ϵ

Tukaj:

  • Y - Odvisna spremenljivka
  • X - Neodvisna (pojasnjevalna) spremenljivka
  • a - Prestrezanje
  • b - Naklon
  • ϵ - Preostanek (napaka)

Kako razlagati regresijsko analizo?

To si lahko razlagamo s preprostim scenarijem. Tu vzamemo razmerje med cenami antičnih zbirk na dražbi in trajanjem njihove starosti. Bolj ko se starina stara, večjo ceno dobi. Ob predpostavki, da smo nastavili podatke za zadnjih 50 predmetov, ki so bili na dražbi, lahko glede na starost postavke predvidimo, kakšne bodo prihodnje dražbene cene. Na podlagi teh podatkov lahko sestavimo regresijsko enačbo.

Formula regresije, ki lahko vzpostavi razmerje med starostjo in ceno, je naslednja:

y = β0 + β1 x + napaka
  • Tu je odvisni faktor Y. Y predstavlja ceno vsakega predmeta, ki bo na dražbi, neodvisni faktor pa X, ki določa starost.
  • Parametra β0 in β1 sta parametra, ki nista znana in ju bomo ocenili z enačbo.
  • β0 je konstanta, ki se uporablja za določanje linearne črte trenda, ki prečka os Y.
  • β1 je konstanta, ki prikazuje velikost spremembe vrednosti odvisne spremenljivke kot povezano funkcijo spremembe, ki se nanaša na neodvisne spremenljivke.
  • Temu v bistvu pravimo naklon enačbe. Kadar je naklon podloga, to pomeni, da obstaja sorazmerno razmerje med starostjo in ceno, in kadar je naklon obraten, to pomeni, da je razmerje posredno sorazmerno.
  • Napaka se lahko opredeli kot hrup ali spremembe v ciljno spremenljivko in je naključno v naravi.

Primeri regresijske analize v resničnem življenju

Predpostavimo, da moramo vzpostaviti razmerje med prodajo, ki se je zgodila, in zneskom, porabljenim za oglaševanje, povezano z izdelkom.

Na splošno lahko opazimo pozitivno razmerje med količino prodaje in količino, porabljeno za oglaševanje. S pomočjo preproste linearne regresijske enačbe imamo:

Y = a + bX

Recimo, da dobimo vrednost kot

Y = 500 + 30X

Razlaga rezultata:

Predvideni naklon 30 nam pomaga pri zaključku, da se povprečna prodaja poveča na 30 USD na leto, ko se poveča poraba za oglaševanje.

Vrste regresijske analize

# 1 - Linearno

To lahko izrazimo kot spodnjo formulo in meri razmerje med odvisno spremenljivko in eno neodvisno spremenljivko.

# 2 - Polinom

Pri tej metodi se z analizo meri razmerje med posameznimi odvisnimi faktorji in več neodvisnimi spremenljivkami.

# 3 - Logistično

Tu je odvisni faktor ali spremenljivka binarne narave. Neodvisne spremenljivke so lahko neprekinjene ali binarne. Pri multinomalni logistični regresiji si lahko privoščimo več kot dve kategoriji, medtem ko izbiramo svojo neodvisno spremenljivko.

# 4 - Kvantil

To je aditivni koncept linearne regresije, ki se uporablja predvsem, kadar so v podatkih prisotni izstopajoči elementi in poševnost.

# 5 - Elastična mreža

To je koristno, kadar se obravnava zelo visoko korelirane neodvisne spremenljivke.

# 6 - Regresija glavnih komponent (PCR)

To je tehnika, ki se uporablja, kadar je v podatkih preveč neodvisnih spremenljivk ali če obstaja večkolinearnost

# 7 - Delni najmanjši kvadratki (PLS)

Je nasprotna metoda glavne komponente, kjer imamo neodvisne spremenljivke, ki so zelo korelirane. Velja tudi, kadar obstaja veliko neodvisnih spremenljivk.

# 8 - Podporni vektor

To lahko zagotovi rešitev za linearne in nelinearne modele. Uporablja nelinearne funkcije jedra za iskanje optimalne rešitve za nelinearne modele.

# 9 - redni

Uporablja se za napovedovanje uvrščenih vrednosti. V bistvu je primeren, kadar je odvisna spremenljivka redne narave

# 10 - Poisson

To velja, kadar ima odvisna spremenljivka podatke o štetju.

# 11 - Negativni binom

Uporabno je tudi za upravljanje podatkov o štetju le, da negativna binomska regresija ne predvideva porazdelitve števila z varianco, ki je enaka njegovi srednji vrednosti, medtem ko Poissonova regresija predpostavlja, da je varianca enaka njegovi srednji vrednosti.

# 12 - kvazi Poisson

Je nadomestek negativne binomske regresije. Velja tudi za razpršene podatke o štetju. Varianca kvazi-Poissonovega modela je linearna funkcija sredine, medtem ko je varianca negativnega binomskega modela kvadratna funkcija sredine.

# 13 - Cox

Bolj se uporablja za analizo podatkov o času do dogodka.

Razlika med regresijo in korelacijo

  • Regresija vzpostavi razmerje med neodvisno varianco in odvisno spremenljivko, kadar sta obe spremenljivki različni, medtem ko korelacija določa povezanost ali odvisnost dveh spremenljivk, kjer med obema spremenljivkama ni razlike.
  • Glavni cilj regresije je ustvariti vrstico, ki najbolje ustreza, in ocena ene spremenljivke je narejena na podlagi drugih, medtem ko v korelaciji pokaže linearno razmerje med dvema spremenljivkama.
  • Pri tem ocenjujemo obseg določene spremembe prepoznane spremenljivke (X) na ocenjeni spremenljivki (Y), medtem ko se v korelaciji s koeficientom meri, v kolikšni meri se spremenljivki premikata skupaj.
  • Gre za postopek ocenjevanja velikosti naključnih neodvisnih spremenljivk, ki temelji na velikosti statično odvisne spremenljivke, medtem ko nam korelacija pomaga pri odločitvi za določeno vrednost, ki izraža soodvisnost obeh spremenljivk.

Zaključek

  • Regresijska analiza uporablja predvsem podatke za vzpostavitev povezave med dvema ali več spremenljivkami. Tu se domneva, da se bodo odnosi, ki obstajajo v preteklosti, odražali tudi v sedanjosti ali prihodnosti. Le malokdo meni, da je to časovni zamik med preteklostjo in sedanjostjo / prihodnostjo.
  • Vendar je to pogosto uporabljena tehnika napovedovanja in ocenjevanja. Čeprav vključuje matematiko, ki se mnogim uporabnikom zdi težka, je tehnika razmeroma enostavna za uporabo, zlasti kadar je model na voljo.

Zanimive Članki...