R na kvadrat (R ^ 2) - Definicija, formula, izračunaj R na kvadrat

Kaj je R na kvadrat (R2) v regresiji?

R-kvadrat (R 2 ) je pomembno statistično merilo, ki je regresijski model, ki predstavlja delež razlike ali variance v statističnih izrazih za odvisno spremenljivko, ki jo je mogoče razložiti z neodvisno spremenljivko ali spremenljivkami. Skratka, določa, kako dobro se bodo podatki ujemali z regresijskim modelom.

R Formula na kvadrat

Za izračun R na kvadrat morate določiti korelacijski koeficient, nato pa rezultat poravnati na kvadrat.

R Formula na kvadrat = r 2

Kjer je r korelacijski koeficient mogoče izračunati spodaj:

r = n (∑xy) - ∑x ∑y / √ (n * (∑x 2 - (∑x) 2 )) * (n * (∑y 2 - (∑y) 2 ))

Kje,

  • r = korelacijski koeficient
  • n = število v danem naboru podatkov
  • x = prva spremenljivka v kontekstu
  • y = druga spremenljivka

Pojasnilo

Če obstaja povezava ali korelacija, ki je lahko linearna ali nelinearna med tema dvema spremenljivkama, potem mora navesti, ali se neodvisna spremenljivka spremeni v vrednosti, potem bo druga odvisna spremenljivka verjetno spremenila vrednost, recimo linearno ali nelinearno.

Del števca formule opravi preizkus, ali se premikata skupaj, in odstrani njihove posamezne gibe in relativno moč obeh, ki se gibljejo skupaj, del imenovalca pa števnik prilagodi števcu tako, da vzame kvadratni koren zmnožka razlik spremenljivke iz njihovih kvadratnih spremenljivk. In ko na rezultat dobite na kvadrat, dobimo na kvadrat R, kar ni nič drugega kot koeficient odločnosti.

Primeri

Primer # 1

Če upoštevamo naslednji dve spremenljivki x in y, morate izračunati kvadrat R v regresiji.

Rešitev:

Z uporabo zgoraj omenjene formule moramo najprej izračunati korelacijski koeficient.

V zgornji tabeli imamo vse vrednosti z n = 4.

Zdaj vnesite vrednosti v formulo, da pridemo do slike.

r = (4 * 26.046,25) - (265,18 * 326,89) / √ ((4 * 21,274,94) - (326,89) 2 ) * ((4 * 31 901,89) - (326,89) 2 )

r = 17.501,06 / 17.512,88

Korelacijski koeficient bo

r = 0,99932480

Torej, izračun bo naslednji,

r 2 = (0,99932480) 2

R Formula na kvadrat v regresiji

r 2 = 0,998650052

2. primer

Indija, država v razvoju, želi opraviti neodvisno analizo, ali so spremembe cen surove nafte vplivale na njeno vrednost rupije. Sledi zgodovina cen surove nafte Brent in vrednotenja rupij glede na dolarje, ki so v teh letih v povprečju prevladovali spodaj.

Indijska centralna banka RBI se je obrnila na vas, da bi na naslednjem srečanju o njej predstavila predstavitev. Ugotovite, ali gibanje surove nafte vpliva na gibanje rupije na dolar?

Rešitev:

Z zgornjo formulo korelacije lahko najprej izračunamo koeficient korelacije. Če povprečno ceno surove nafte obravnavamo kot eno spremenljivko, recimo x, in rupijo na dolar kot drugo spremenljivko kot y.

V zgornji tabeli imamo vse vrednosti z n = 6.

Zdaj vnesite vrednosti v formulo, da pridemo do slike.

r = (6 * 23592,83) - (356,70 * 398,59) / √ ((6 * 22829,36) - (356,70) 2 ) * ((6 * 26529,38) - (398,59) 2 )

r = -620,06 / 1.715,95

Korelacijski koeficient bo

r = -0,3614

Torej, izračun bo naslednji,

r 2 = (-0,3614) 2

R Formula na kvadrat v regresiji

r 2 = 0,1306

Analiza: Zdi se, da obstaja majhna povezava med spremembami cen surove nafte in spremembami cene indijske rupije. Ko cene surove nafte naraščajo, vplivajo tudi spremembe v indijski rupiji. Ker pa je R na kvadrat le 13%, potem spremembe cene surove nafte zelo malo pojasnjujejo spremembe v indijski rupiji, indijska rupija pa je podvržena spremembam tudi pri drugih spremenljivkah, kar je treba upoštevati.

3. primer

Laboratorij XYZ izvaja raziskave o višini in teži in ga zanima, ali obstaja kakšna povezava med temi spremenljivkami. Potem ko so zbrali vzorec 5000 ljudi za vsako kategorijo in prišli do povprečne teže in povprečne višine v tej skupini.

Spodaj so podrobnosti, ki so jih zbrali.

Izračunajte R na kvadrat in ugotovite, ali ta model pojasnjuje odstopanja v višini vpliva na odstopanja v teži.

Rešitev:

Z zgornjo formulo korelacije lahko najprej izračunamo koeficient korelacije. Obravnavanje višine kot ene spremenljivke, recimo x, in teže kot druge spremenljivke kot y.

V zgornji tabeli imamo vse vrednosti z n = 6.

Zdaj vnesite vrednosti v formulo, da pridemo do slike.

r = (7 * 74.058,67) - (1031 * 496,44) / √ ((7 * 153595 - (1031) 2 ) * ((7 * 35793,59) - (496,44) 2 )

r = 6.581,05 / 7.075,77

Korelacijski koeficient bo

Korelacijski koeficient (r) = 0,9301

Torej, izračun bo naslednji,

r 2 = 0,8651

Analiza: korelacija je pozitivna in kaže, da obstaja neka povezava med višino in težo. Z naraščanjem višine se zdi, da se povečuje tudi teža osebe. Medtem ko R2 kaže, da 86% sprememb v višini pripisuje spremembam v teži, 14% pa je nepojasnjenih.

Ustreznost in uporaba

Ustreznost kvadrata R v regresiji je njegova sposobnost, da poišče verjetnost prihodnjih dogodkov v danih predvidenih rezultatih ali izidih. Če se modelu doda več vzorcev, potem koeficient pokaže verjetnost ali verjetnost, da na črto pade nova točka ali nov nabor podatkov. Tudi če sta obe spremenljivki močno povezani, določitev ne dokazuje vzročnosti.

Nekateri prostori, v katerih se R kvadrat največ uporablja, so za sledenje uspešnosti vzajemnih skladov, za sledenje tveganju v hedge skladih, da se ugotovi, kako dobro se delnice gibljejo na trgu, kjer R2 predlaga, koliko gibanja delnic je mogoče razložiti gibanja na trgu.

Zanimive Članki...