Kaj je linearna regresija?
Linearna regresija je v bistvu tehnika statističnega modeliranja, ki je uporabljala prikaz razmerja med eno odvisno spremenljivko in eno ali več neodvisnimi spremenljivkami. Je ena najpogostejših vrst napovedne analize. Ta vrsta porazdelitve se oblikuje v premici, zato se temu reče linearna regresija. V tem članku bomo uporabili primere linearne regresijske analize v Excelu.
Če želite najprej opraviti linearno regresijsko analizo, moramo dodati dodatke excel po naslednjih korakih.
Kliknite Datoteka - Možnosti (s tem se vam odpre Pop Excel Options Pop-up).

Kliknite Add-ins - Izberite Excel Add-ins iz Manage Drop Down in excel, nato kliknite Go.

Odpre se pojavno okno dodatkov. Izberite Analysis ToolPak in kliknite V redu.

Dodatek za analizo podatkov se bo prikazal pod zavihkom Vstavi.

Naj nas razumejo spodnji primeri linearne regresijske analize v excelu.
Primeri linearne regresijske analize
Primer # 1
Recimo, da imamo mesečno prodajo in smo za lansko leto porabili za trženje, zdaj pa moramo predvideti prihodnjo prodajo na podlagi lanske porabe in trženja.
Mesec | Oglaševanje | Prodaja |
Jan | 40937 | 502729 |
Februar | 42376 | 507553 |
Mar | 43355 | 516885 |
Apr | 44126 | 528347 |
Maj | 45060 | 537298 |
Junij | 49546 | 544066 |
Jul | 56105 | 553664 |
Avg | 59322 | 563201 |
September | 59877 | 568657 |
Okt | 60481 | 569384 |
Nov | 62356 | 573764 |
Dec | 63246 | 582746 |
Kliknite kartico Analiza podatkov na kartici Podatki in s tem se vam odpre Pop Data Analysis Pop.

Zdaj na seznamu izberite Regresija in kliknite V redu.

Odpre se pojavno okno za regresijo.

V polju osi Y izberite Obseg prodaje $ C $ 1: $ C $ 13, saj je to odvisna spremenljivka, in $ B $ 1: $ B $ 14 na osi X, saj je porabljeno oglaševanje neodvisna spremenljivka.

Če ste v podatkih izbrali glave, potrdite oznako na polju Oznake, ker bo to povzročilo napako.

Izberite Obseg izhoda, če želite dobiti vrednost za določen obseg na delovnem listu, sicer izberite Nov sloj delovnega lista: to bo dodalo nov delovni list in vam dalo rezultat.

Nato potrdite polje Preostanki in kliknite V redu.

S tem boste dodali delovne liste in dobili boste naslednji rezultat.

Dovolite nam, da razumemo rezultate.
Povzetek rezultata
Multiple R: To predstavlja korelacijski koeficient. Vrednost 1 kaže pozitivno razmerje, vrednost 0 pa nobeno razmerje.
R kvadrat: R kvadrat predstavlja koeficient odločnosti. To vam pove, kolikšen odstotek točk pade na regresijsko črto. 0,49 pomeni, da 49% vrednosti ustreza modelu
Prilagojeni kvadrat R : to je prilagojeni kvadrat R, kar je potrebno, če imate več kot eno spremenljivko X.
Standardna napaka: predstavlja oceno standardnega odklona napake. To je natančnost merjenja regresijskega koeficienta.
Opažanja: To je število opažanj, ki ste jih opravili v vzorcu.
ANOVA - Df: Stopnje svobode
SS: Vsota kvadratov.
MS: imamo dve MS
- Regresija MS je regresija SS / regresija Df.
- Preostala MS je povprečna kvadratna napaka (Preostali SS / Preostali Df).
F: F test za nično hipotezo.
Pomembnost F: P-vrednosti, povezane s pomembnostjo
Koeficient: Koeficient vam daje oceno najmanjših kvadratov.
T statistika: T statistika za nično hipotezo v primerjavi z nadomestno hipotezo.
Vrednost P: To je vrednost p za preizkus hipoteze.
Spodnja 95% in zgornja 95%: to sta spodnja in zgornja meja intervala zaupanja
Rezultat ostankov. Na podlagi podatkov imamo 12 opazovanj. 2 nd stolpec predstavlja predvidenimi prodajo in 3 rd stolpcev ostankov. Preostanek je v bistvu razlika v predvideni prodaji od dejanske.
2. primer
Izberite stolpec predvidene prodaje in trženja

Pojdite na skupino grafikonov pod zavihkom za vstavljanje. Izberite ikono razpršenega grafikona

S tem bo razpršeni grafikon vstavljen v excel. Glej sliko spodaj

Z desno miškino tipko kliknite katero koli točko in v Excelu izberite Dodaj vrstico trenda. To bo grafikonu dodalo linijo trendov.


- Trend linijo lahko formatirate tako, da z desno miškino tipko kliknete kjer koli na liniji trenda in nato izberete obliko trenda.
- Grafikon lahko naredite več izboljšav. tj. oblikovanje črte trenda, barve in spremembe naslova itd
- Formulo lahko prikažete tudi na grafu, tako da potrdite polje Prikaz formule na grafikonu in na grafikonu prikažete vrednost R kvadrat.
Še nekaj primerov linearne regresijske analize:
- Napovedovanje prodanega dežnika na podlagi dežja se je zgodilo na območju.
- Napovedovanje prodanega izmeničnega toka na podlagi temperature poleti.
- Med sezono izpitov se je prodaja Stacionarnih v bistvu povečala.
- Napovedovanje prodaje, ko je bilo oglaševanje izvedeno, na podlagi serije TRP, kjer se oglašuje, priljubljenosti blagovne znamke in stopnic na mestu, kjer je oglas objavljen.
- Prodaja hiše na podlagi kraja, območja in cene.
3. primer
Recimo, da imamo devet študentov z njihovo stopnjo inteligencije in številom, ki so ga dosegli na testu.
Študent | Rezultat testa | IQ |
Oven | 100 | 145 |
Shyam | 97 | 140 |
Kul | 93 | 130 |
Kappu | 91 | 125 |
Raju | 89 | 115 |
Vishal | 86 | 110 |
Vivek | 82 | 100 |
Vinay | 78 | 95 |
Kumar | 75 | 90 |
1. korak: Najprej poiščite odvisne in neodvisne spremenljivke. Tu je testna ocena odvisna spremenljivka, IQ pa neodvisna spremenljivka, saj se testna ocena spreminja, ko se IQ spreminja.
2. korak: Pojdite na zavihek Podatki - Kliknite Analiza podatkov - Izberite regresijo - kliknite V redu.

To vam bo odprlo okno Regresija.

Korak 3. Območje ocene vhodnega testa v polju za vnos Y in IQ v polju za vnos X (Preverite nalepke, če imate glave v svojem obsegu podatkov. Izberite izhodne možnosti in preverite želene ostanke. Kliknite V redu.

Dobili boste povzetek, prikazan na spodnji sliki.

4. korak: Analiza regresije s povzetkom rezultatov
Povzetek rezultata
Multiple R: Tukaj je korelacijski koeficient 0,99, kar je zelo blizu 1, kar pomeni, da je Linearno razmerje zelo pozitivno.
R Square: R Square vrednost je 0,983, kar pomeni, da 98,3% vrednosti ustreza modelu.
Vrednost P: Tu je P-vrednost 1,86881E-07, kar je zelo manj kot .1, kar pomeni, da ima IQ pomembne napovedne vrednosti.
Glejte spodnji grafikon.

Opazite, da skoraj vse točke padajo v vrstico ali v bližnjo linijo trenda.
Primer # 4
Predvideti moramo prodajo AC na podlagi prodaje in temperature za drug mesec.
Mesec | Temp | Prodaja |
Jan | 25. | 38893 |
Februar | 28. | 42254 |
Mar | 31. | 42845 |
Apr | 33 | 47917 |
Maj | 37 | 51243 |
Junij | 40 | 69588 |
Jul | 38 | 56570 |
Avg | 37 | 50000 |
Sledite spodnjim korakom, da dobite rezultat regresije.
1. korak: Najprej poiščite odvisne in neodvisne spremenljivke. Tu je prodaja odvisna spremenljivka, temperatura pa neodvisna spremenljivka, saj se prodaja spreminja, ko se spreminja temperatura.
2. korak: Pojdite na zavihek Podatki - Kliknite Analiza podatkov - Izberite regresijo - kliknite V redu.

To vam bo odprlo okno Regresija.

Korak 3. Prodaja vnosov v polju vnosa Y Range in Temp v polju vnosa X Range. (Preverite nalepke, če imate glave v svojem obsegu podatkov. Izberite izhodne možnosti in preverite želene ostanke. Kliknite V redu.

Tako boste dobili povzetek, kot je prikazano spodaj.

4. korak: Analizirajte rezultat.
Multiple R: Tu je korelacijski koeficient 0,877, kar je blizu 1, kar pomeni, da je Linearna relacija pozitivna.
R Square: R Square vrednost je 0,770, kar pomeni, da 77% vrednosti ustreza modelu
Vrednost P: Tu je vrednost P 1,86881E-07, kar je zelo manj kot .1, kar pomeni, da ima IQ pomembne napovedne vrednosti.
Primer # 5
Zdaj pa naredimo regresijsko analizo za več neodvisnih spremenljivk:
Predvideti morate prodajo mobilnega telefona, ki se bo začelo prihodnje leto. Imate ceno in prebivalstvo držav, ki vplivajo na prodajo mobilnih telefonov.
Mobilna različica | Prodaja | Količina | Prebivalstvo |
ZDA | 63860 | 858 | 823 |
Združeno kraljestvo | 61841 | 877 | 660 |
KZ | 60876 | 873 | 631 |
CH | 58188 | 726 | 842 |
HN | 52728 | 864 | 573 |
AU | 52388 | 680 | 809 |
NZ | 51075 | 728 | 661 |
RU | 49019 | 689 | 778 |
Sledite spodnjim korakom, da dobite rezultat regresije.
Korak 1. Najprej poiščite odvisne in neodvisne spremenljivke. Tu je prodaja odvisna od spremenljivke, količine in prebivalstva. Obe sta neodvisni spremenljivki, saj se prodaja spreminja glede na količino in število prebivalcev države.
Korak 2. Pojdite na zavihek Podatki - Kliknite na Analiza podatkov - Izberite regresijo - kliknite V redu.

To vam bo odprlo okno Regresija.

Korak 3. Vnesite prodajo v polje vnosa Y Range in izberite količino in populacijo v polju vnosa X Range. (Preverite nalepke, če imate glave v svojem obsegu podatkov. Izberite izhodne možnosti in preverite želene ostanke. Kliknite V redu.

Zdaj zaženite regresijo z analizo podatkov na kartici Podatki. Tako boste dobili spodnji rezultat.
Povzetek rezultata
Multiple R: Tukaj je korelacijski koeficient 0,93, kar je zelo blizu 1, kar pomeni, da je Linearno razmerje zelo pozitivno.
R Square: Vrednost R Square je 0,866, kar pomeni, da 86,7% vrednosti ustreza modelu.
Pomen F: Pomen F je manjši od .1, kar pomeni, da ima regresijska enačba pomembno napovedno vrednost.
Vrednost P : Če pogledate vrednost P za količino in prebivalstvo, lahko vidite, da so vrednosti manjše od .1, kar pomeni, da imata količina in populacija pomembno napovedno vrednost. Manj vrednosti P pomeni, da ima spremenljivka pomembnejše napovedne vrednosti.
Vendar imata tako količina kot populacija pomembno napovedno vrednost, toda če pogledate P-vrednost za količino in populacijo, lahko vidite, da ima količina P-vrednost v excelu manjša od populacije. To pomeni, da ima količina pomembnejšo napovedno vrednost kot populacija.
Stvari, ki si jih je treba zapomniti
- Vedno preverite odvisni in neodvisni spremenljivki, kadar koli izbirate podatke.
- Linearna regresijska analiza upošteva razmerje med sredino spremenljivk.
- To samo modelira razmerje med spremenljivkami, ki so linearne
- Včasih ni najbolj primeren za resnični problem. Na primer: (Starost in plače). Večinoma se plače povečujejo s staranjem starosti. Po upokojitvi pa se starost poveča, plače pa se znižujejo.