Linearna regresija (opredelitev, primeri) - Kako tolmačiti?

Kaj je linearna regresija?

Linearna regresija je v bistvu tehnika statističnega modeliranja, ki je uporabljala prikaz razmerja med eno odvisno spremenljivko in eno ali več neodvisnimi spremenljivkami. Je ena najpogostejših vrst napovedne analize. Ta vrsta porazdelitve se oblikuje v premici, zato se temu reče linearna regresija. V tem članku bomo uporabili primere linearne regresijske analize v Excelu.

Če želite najprej opraviti linearno regresijsko analizo, moramo dodati dodatke excel po naslednjih korakih.

Kliknite Datoteka - Možnosti (s tem se vam odpre Pop Excel Options Pop-up).

Kliknite Add-ins - Izberite Excel Add-ins iz Manage Drop Down in excel, nato kliknite Go.

Odpre se pojavno okno dodatkov. Izberite Analysis ToolPak in kliknite V redu.

Dodatek za analizo podatkov se bo prikazal pod zavihkom Vstavi.

Naj nas razumejo spodnji primeri linearne regresijske analize v excelu.

Primeri linearne regresijske analize

Primer # 1

Recimo, da imamo mesečno prodajo in smo za lansko leto porabili za trženje, zdaj pa moramo predvideti prihodnjo prodajo na podlagi lanske porabe in trženja.

Mesec Oglaševanje Prodaja
Jan 40937 502729
Februar 42376 507553
Mar 43355 516885
Apr 44126 528347
Maj 45060 537298
Junij 49546 544066
Jul 56105 553664
Avg 59322 563201
September 59877 568657
Okt 60481 569384
Nov 62356 573764
Dec 63246 582746

Kliknite kartico Analiza podatkov na kartici Podatki in s tem se vam odpre Pop Data Analysis Pop.

Zdaj na seznamu izberite Regresija in kliknite V redu.

Odpre se pojavno okno za regresijo.

V polju osi Y izberite Obseg prodaje $ C $ 1: $ C $ 13, saj je to odvisna spremenljivka, in $ B $ 1: $ B $ 14 na osi X, saj je porabljeno oglaševanje neodvisna spremenljivka.

Če ste v podatkih izbrali glave, potrdite oznako na polju Oznake, ker bo to povzročilo napako.

Izberite Obseg izhoda, če želite dobiti vrednost za določen obseg na delovnem listu, sicer izberite Nov sloj delovnega lista: to bo dodalo nov delovni list in vam dalo rezultat.

Nato potrdite polje Preostanki in kliknite V redu.

S tem boste dodali delovne liste in dobili boste naslednji rezultat.

Dovolite nam, da razumemo rezultate.

Povzetek rezultata

Multiple R: To predstavlja korelacijski koeficient. Vrednost 1 kaže pozitivno razmerje, vrednost 0 pa nobeno razmerje.

R kvadrat: R kvadrat predstavlja koeficient odločnosti. To vam pove, kolikšen odstotek točk pade na regresijsko črto. 0,49 pomeni, da 49% vrednosti ustreza modelu

Prilagojeni kvadrat R : to je prilagojeni kvadrat R, kar je potrebno, če imate več kot eno spremenljivko X.

Standardna napaka: predstavlja oceno standardnega odklona napake. To je natančnost merjenja regresijskega koeficienta.

Opažanja: To je število opažanj, ki ste jih opravili v vzorcu.

ANOVA - Df: Stopnje svobode

SS: Vsota kvadratov.

MS: imamo dve MS

  • Regresija MS je regresija SS / regresija Df.
  • Preostala MS je povprečna kvadratna napaka (Preostali SS / Preostali Df).

F: F test za nično hipotezo.

Pomembnost F: P-vrednosti, povezane s pomembnostjo

Koeficient: Koeficient vam daje oceno najmanjših kvadratov.

T statistika: T statistika za nično hipotezo v primerjavi z nadomestno hipotezo.

Vrednost P: To je vrednost p za preizkus hipoteze.

Spodnja 95% in zgornja 95%: to sta spodnja in zgornja meja intervala zaupanja

Rezultat ostankov. Na podlagi podatkov imamo 12 opazovanj. 2 nd stolpec predstavlja predvidenimi prodajo in 3 rd stolpcev ostankov. Preostanek je v bistvu razlika v predvideni prodaji od dejanske.

2. primer

Izberite stolpec predvidene prodaje in trženja

Pojdite na skupino grafikonov pod zavihkom za vstavljanje. Izberite ikono razpršenega grafikona

S tem bo razpršeni grafikon vstavljen v excel. Glej sliko spodaj

Z desno miškino tipko kliknite katero koli točko in v Excelu izberite Dodaj vrstico trenda. To bo grafikonu dodalo linijo trendov.

  • Trend linijo lahko formatirate tako, da z desno miškino tipko kliknete kjer koli na liniji trenda in nato izberete obliko trenda.
  • Grafikon lahko naredite več izboljšav. tj. oblikovanje črte trenda, barve in spremembe naslova itd
  • Formulo lahko prikažete tudi na grafu, tako da potrdite polje Prikaz formule na grafikonu in na grafikonu prikažete vrednost R kvadrat.

Še nekaj primerov linearne regresijske analize:

  1. Napovedovanje prodanega dežnika na podlagi dežja se je zgodilo na območju.
  2. Napovedovanje prodanega izmeničnega toka na podlagi temperature poleti.
  3. Med sezono izpitov se je prodaja Stacionarnih v bistvu povečala.
  4. Napovedovanje prodaje, ko je bilo oglaševanje izvedeno, na podlagi serije TRP, kjer se oglašuje, priljubljenosti blagovne znamke in stopnic na mestu, kjer je oglas objavljen.
  5. Prodaja hiše na podlagi kraja, območja in cene.

3. primer

Recimo, da imamo devet študentov z njihovo stopnjo inteligencije in številom, ki so ga dosegli na testu.

Študent Rezultat testa IQ
Oven 100 145
Shyam 97 140
Kul 93 130
Kappu 91 125
Raju 89 115
Vishal 86 110
Vivek 82 100
Vinay 78 95
Kumar 75 90

1. korak: Najprej poiščite odvisne in neodvisne spremenljivke. Tu je testna ocena odvisna spremenljivka, IQ pa neodvisna spremenljivka, saj se testna ocena spreminja, ko se IQ spreminja.

2. korak: Pojdite na zavihek Podatki - Kliknite Analiza podatkov - Izberite regresijo - kliknite V redu.

To vam bo odprlo okno Regresija.

Korak 3. Območje ocene vhodnega testa v polju za vnos Y in IQ v polju za vnos X (Preverite nalepke, če imate glave v svojem obsegu podatkov. Izberite izhodne možnosti in preverite želene ostanke. Kliknite V redu.

Dobili boste povzetek, prikazan na spodnji sliki.

4. korak: Analiza regresije s povzetkom rezultatov

Povzetek rezultata

Multiple R: Tukaj je korelacijski koeficient 0,99, kar je zelo blizu 1, kar pomeni, da je Linearno razmerje zelo pozitivno.

R Square: R Square vrednost je 0,983, kar pomeni, da 98,3% vrednosti ustreza modelu.

Vrednost P: Tu je P-vrednost 1,86881E-07, kar je zelo manj kot .1, kar pomeni, da ima IQ pomembne napovedne vrednosti.

Glejte spodnji grafikon.

Opazite, da skoraj vse točke padajo v vrstico ali v bližnjo linijo trenda.

Primer # 4

Predvideti moramo prodajo AC na podlagi prodaje in temperature za drug mesec.

Mesec Temp Prodaja
Jan 25. 38893
Februar 28. 42254
Mar 31. 42845
Apr 33 47917
Maj 37 51243
Junij 40 69588
Jul 38 56570
Avg 37 50000

Sledite spodnjim korakom, da dobite rezultat regresije.

1. korak: Najprej poiščite odvisne in neodvisne spremenljivke. Tu je prodaja odvisna spremenljivka, temperatura pa neodvisna spremenljivka, saj se prodaja spreminja, ko se spreminja temperatura.

2. korak: Pojdite na zavihek Podatki - Kliknite Analiza podatkov - Izberite regresijo - kliknite V redu.

To vam bo odprlo okno Regresija.

Korak 3. Prodaja vnosov v polju vnosa Y Range in Temp v polju vnosa X Range. (Preverite nalepke, če imate glave v svojem obsegu podatkov. Izberite izhodne možnosti in preverite želene ostanke. Kliknite V redu.

Tako boste dobili povzetek, kot je prikazano spodaj.

4. korak: Analizirajte rezultat.

Multiple R: Tu je korelacijski koeficient 0,877, kar je blizu 1, kar pomeni, da je Linearna relacija pozitivna.

R Square: R Square vrednost je 0,770, kar pomeni, da 77% vrednosti ustreza modelu

Vrednost P: Tu je vrednost P 1,86881E-07, kar je zelo manj kot .1, kar pomeni, da ima IQ pomembne napovedne vrednosti.

Primer # 5

Zdaj pa naredimo regresijsko analizo za več neodvisnih spremenljivk:

Predvideti morate prodajo mobilnega telefona, ki se bo začelo prihodnje leto. Imate ceno in prebivalstvo držav, ki vplivajo na prodajo mobilnih telefonov.

Mobilna različica Prodaja Količina Prebivalstvo
ZDA 63860 858 823
Združeno kraljestvo 61841 877 660
KZ 60876 873 631
CH 58188 726 842
HN 52728 864 573
AU 52388 680 809
NZ 51075 728 661
RU 49019 689 778

Sledite spodnjim korakom, da dobite rezultat regresije.

Korak 1. Najprej poiščite odvisne in neodvisne spremenljivke. Tu je prodaja odvisna od spremenljivke, količine in prebivalstva. Obe sta neodvisni spremenljivki, saj se prodaja spreminja glede na količino in število prebivalcev države.

Korak 2. Pojdite na zavihek Podatki - Kliknite na Analiza podatkov - Izberite regresijo - kliknite V redu.

To vam bo odprlo okno Regresija.

Korak 3. Vnesite prodajo v polje vnosa Y Range in izberite količino in populacijo v polju vnosa X Range. (Preverite nalepke, če imate glave v svojem obsegu podatkov. Izberite izhodne možnosti in preverite želene ostanke. Kliknite V redu.

Zdaj zaženite regresijo z analizo podatkov na kartici Podatki. Tako boste dobili spodnji rezultat.

Povzetek rezultata

Multiple R: Tukaj je korelacijski koeficient 0,93, kar je zelo blizu 1, kar pomeni, da je Linearno razmerje zelo pozitivno.

R Square: Vrednost R Square je 0,866, kar pomeni, da 86,7% vrednosti ustreza modelu.

Pomen F: Pomen F je manjši od .1, kar pomeni, da ima regresijska enačba pomembno napovedno vrednost.

Vrednost P : Če pogledate vrednost P za količino in prebivalstvo, lahko vidite, da so vrednosti manjše od .1, kar pomeni, da imata količina in populacija pomembno napovedno vrednost. Manj vrednosti P pomeni, da ima spremenljivka pomembnejše napovedne vrednosti.

Vendar imata tako količina kot populacija pomembno napovedno vrednost, toda če pogledate P-vrednost za količino in populacijo, lahko vidite, da ima količina P-vrednost v excelu manjša od populacije. To pomeni, da ima količina pomembnejšo napovedno vrednost kot populacija.

Stvari, ki si jih je treba zapomniti

  • Vedno preverite odvisni in neodvisni spremenljivki, kadar koli izbirate podatke.
  • Linearna regresijska analiza upošteva razmerje med sredino spremenljivk.
  • To samo modelira razmerje med spremenljivkami, ki so linearne
  • Včasih ni najbolj primeren za resnični problem. Na primer: (Starost in plače). Večinoma se plače povečujejo s staranjem starosti. Po upokojitvi pa se starost poveča, plače pa se znižujejo.

Zanimive Članki...