Formula za izračun korelacije
Korelacija je statistično merilo med dvema spremenljivkama in je opredeljena kot sprememba količine v eni spremenljivki, ki ustreza spremembi v drugi in se izračuna s seštevanjem zmnožka vsote prve spremenljivke minus povprečje prve spremenljivke v vsoto druge spremenljivke minus srednja vrednost druge spremenljivke, deljena s celoto pod korenom zmnožka kvadrata prve spremenljivke minus srednja vrednost prve spremenljivke v vsoto kvadrata druge spremenljivke minus srednja vrednost druge spremenljivke.
Vrednost korelacije je omejena med -1 in +1 in jo lahko razlagamo na naslednji način:
- -1: Če je -1, potem so spremenljivke znane kot popolnoma negativno povezane. To pomeni, da če se ena spremenljivka premika v eno smer, se druga premika v nasprotni smeri.
- 0: To pomeni, da spremenljivka nima nobene korelacije.
- +1: če je +1, potem so spremenljivke znane kot popolnoma pozitivno povezane. Obe spremenljivki se premikata v pozitivni smeri.
Če imamo dve spremenljivki x in y, lahko korelacijski koeficient med dvema spremenljivkama najdemo kot:
Korelacijski koeficient = ∑ (x (i) - povprečje (x)) * (y (i) -pomen (y)) / √ (∑ (x (i) -pomen (x)) 2 * ∑ (y (i) -pomeni (y)) 2 )
Kje,
- x (i) = vrednost x v vzorcu
- Povprečje (x) = povprečje vseh vrednosti x
- y (i) = vrednost y v vzorcu
- Povprečje (y) = povprečje vseh vrednosti y
Primeri
Izračun korelacije v Excelu je preprost. Sintaksa uporabljene funkcije je naslednja:
Korelacijski koeficient = KOREL (matrika1, matrika2)
Primer # 1
Vzemimo isti primer, kot smo ga uporabili zgoraj za izračun korelacije z uporabo excela.
Rešitev:
Spodaj so vrednosti x in y:

Izračun je naslednji.

Osnova excel formula = CORREL (matrika (x), matrika (y))

Koeficient = +0,95
Ker je ta koeficient blizu +1, sta x in y zelo pozitivno povezana.
2. primer
Korelacija je koristna predvsem za analizo tečajev delnic podjetij in na podlagi tega oblikovanje delniškega portfelja.
Ugotovimo korelacijo delnic Apple z indeksom Nasdaq na podlagi zadnjega enoletnega poslovanja z delnicami. Apple je večnacionalno podjetje s sedežem v ZDA, ki je specializirano za IT izdelke, kot so iPod, iPad, Mac itd.
Rešitev:
Spodaj je mesečni donos delnic Apple in Nasdaq za zadnje leto:

Zdaj vnesite vrednosti -
Korelacijski koeficient = ∑ (x (i) - povprečje (x)). (Y (i) -pomen (y)) / √ ∑ (x (i) -pomen (x)) 2 ∑ (y (i) - pomeni (y)) 2

Korelacija med Appleom in Nasdaqom = 0,039 / (0,03939)

Koeficient = 0,62
Ker je korelacija med Appleom in Nasdaqom pozitivna, je Apple pozitivno povezan z Nasdaqom.
3. primer
Poglejmo zdaj korelacijo med Walmart in Nasdaq indeksom na podlagi zadnjega enoletnega poslovanja z delnicami. Walmart je ameriško podjetje s trgovsko verigo supermarketov.
Rešitev:
Spodaj je mesečna uspešnost med Walmartom in Nasdaqom v zadnjem letu -

Zdaj vnesite vrednosti v formulo -
Korelacijski koeficient = ∑ (x (i) - povprečje (x)). (Y (i) -pomen (y)) / √ ∑ (x (i) -pomen (x)) 2 ∑ (y (i) - pomeni (y)) 2
Zato je izračun naslednji,

Korelacija med Walmartom in Nasdaqom = 0,0032 / (√0,0346 * 0,0219)

Koeficient = 0,12
Vidimo lahko, da sta Walmart in Nasdaq tudi pozitivno povezana, vendar ne toliko v primerjavi z Appleovo korelacijo z Nasdaqom.
Ustreznost in uporaba
Korelacijski koeficient je koristen pri določanju linearnega razmerja med dvema spremenljivkama. Meri, kako se bo spremenljivka gibala v primerjavi z gibanjem druge spremenljivke. Praktična uporaba tega koeficienta je ugotoviti povezavo med gibanjem cene delnic in celotnim gibanjem trga. Osnova te analize, delniški analitik, bo vključeval delež delnic, da se ustvari optimalen portfelj z minimalnim tveganjem. Prav tako je v znanosti o podatkih koristno ugotoviti razmerje med dvema spremenljivkama.
Prav tako se korelacijski koeficient zelo močno uporablja za proučevanje konstruktne veljavnosti podatkov pri faktorski analizi. Zelo se uporablja v regresijski analizi za napovedovanje vrednosti odvisnih spremenljivk na podlagi razmerja med odvisnimi in neodvisnimi spremenljivkami. Ta enačba je zelo koristna pri kvantitativni analizi, da bi dobili naravo razmerja med različnimi spremenljivkami. Osnova tega razmerja je, če spremenljivka ni povezana z drugimi spremenljivkami, potem jo je mogoče odstraniti s seznama.