Opredelitev Pearsonovega korelacijskega koeficienta
Pearsonov korelacijski koeficient, znan tudi kot statistični test Pearson R, meri moč med različnimi spremenljivkami in njihovimi odnosi. Kadar se med obema spremenljivkama izvaja kateri koli statistični test, je vedno dobro, da oseba, ki dela analizo, izračuna vrednost korelacijskega koeficienta, da ve, kako močno je razmerje med obema spremenljivkama.
Pearsonov korelacijski koeficient vrne vrednost med -1 in 1. Razlaga korelacijskega koeficienta je pod:
- Če je korelacijski koeficient -1, to pomeni močno negativno razmerje. To pomeni popolno negativno razmerje med spremenljivkami.
- Če je korelacijski koeficient 0, to pomeni, da ni nobene povezave.
- Če je korelacijski koeficient 1, to kaže na močno pozitivno razmerje. To pomeni popolno pozitivno razmerje med spremenljivkami.
Višja absolutna vrednost korelacijskega koeficienta kaže na močnejše razmerje med spremenljivkami. Tako korelacijski koeficient 0,78 kaže na močnejšo pozitivno korelacijo v primerjavi z vrednostjo recimo 0,36. Podobno korelacijski koeficient -0,87 kaže na močnejšo negativno korelacijo v primerjavi s korelacijskim koeficientom recimo -0,40.
Z drugimi besedami, če je vrednost v pozitivnem območju, potem kaže, da je razmerje med spremenljivkami pozitivno povezano in da se obe vrednosti skupaj zmanjšujeta ali povečujeta. Po drugi strani pa, če je vrednost v negativnem območju, potem kaže, da je razmerje med spremenljivkami negativno povezano in da bosta obe vrednosti šli v nasprotno smer.
Formula koeficienta korelacije Pearson
Pearsonova formula koeficienta korelacije je naslednja,
Kje,
- r = Pearsonov koeficient
- n = število parov staleža
- ∑xy = vsota proizvodov seznanjenih zalog
- =x = vsota x rezultatov
- ∑y = vsota ocen y
- ∑x 2 = vsota na kvadrat x rezultatov
- ∑y 2 = vsota kvadratnih y rezultatov
Pojasnilo
1. korak: Poiščite število parov spremenljivk, ki je označeno z n. Predpostavimo, da je x sestavljen iz 3 spremenljivk - 6, 8, 10. Predpostavimo, da je y sestavljen iz ustreznih 3 spremenljivk 12, 10, 20.
2. korak: V dveh stolpcih navedite spremenljivke.
Korak 3: Izvedi proizvod izmed X in Y v 3 rd kolone.
4. korak: Poiščite vsoto vrednosti vseh x spremenljivk in vseh y spremenljivk. Izrazi rezultatov na dnu 1 st in 2 nd stolpec. Izrazi vsota x * y v 3 rd kolone.
Korak 5: Izvedi x 2 in je y 2 v 4 th in 5 th kolon in njihova vsota na dnu stolpcev.
6. korak: V formulo vstavite zgornje vrednosti in jih rešite.
r = 3 * 352-24 * 42 / √ (3 * 200-24 2 ) * (3 * 644-42 2 )
= 0,7559
Primer Pearsonovega korelacijskega koeficienta R
Primer 1
V tem primeru s pomočjo naslednjih podrobnosti v tabeli 6 spodaj navedenih oseb z različno starostjo in različno težo za izračun vrednosti Pearson R
Sr št | Starost (x) | Teža (y) |
1. | 40 | 78 |
2. | 21. | 70 |
3. | 25. | 60 |
4. | 31. | 55 |
5. | 38 | 80 |
6. | 47 | 66 |
Rešitev:
Za izračun Pearsonovega koeficienta korelacije bomo najprej izračunali naslednje vrednosti,
Tu je skupno število ljudi 6, torej n = 6
Zdaj je izračun Pearsona R naslednji,
- r = (n (∑xy) - (∑x) (∑y)) / (√ (n ∑x 2 - (∑x) 2 ) (n ∑y 2 - (∑y) 2 )
- r = (6 * (13937) - (202) (409)) / (√ (6 * 7280 - (202) 2 ) * (6 * 28365- (409) 2 )
- r = (6 * (13937) - (202) * (409)) / (√ (6 * 7280 - (202) 2 ) * (6 * 28365- (409) 2 )
- r = (83622- 82618) / (√ (43680 -40804) * (170190- 167281)
- r = 1004 / (√ (2876) * (2909)
- r = 1004 / (√ 8366284)
- r = 1004 / 2892,452938
- r = 0,35
Tako je vrednost Pearsonovega korelacijskega koeficienta 0,35
2. primer
Obstajata 2 delnici - A in B. Njihove cene delnic v določenih dneh so naslednje:
Zaloga A (x) | Stcok B (y) |
45 | 9. |
50 | 8. |
53 | 8. |
58 | 7. |
60 | 5. |
Poiščite Pearsonov koeficient korelacije iz zgornjih podatkov.
Rešitev:
Najprej bomo izračunali naslednje vrednosti.
Izračun Pearsonovega koeficienta je naslednji,
- r = (5 * 1935-266 * 37) / ((5 * 14298- (266) 2) * (5 * 283- (37) 2)) 0,5
- = -0,9088
Zato je Pearsonov korelacijski koeficient med obema staležoma -0,9088.
Prednosti
- Pomaga pri vedenju, kako močan je odnos med obema spremenljivkama. Z uporabo Pearsonovega koeficienta korelacije ni prikazana samo prisotnost ali odsotnost korelacije med obema spremenljivkama, temveč tudi natančno določa, v kolikšni meri so te spremenljivke povezane.
- S to metodo lahko ugotovimo smer korelacije, tj. Ali je korelacija med dvema spremenljivkama negativna ali pozitivna.
Slabosti
- Pearsonov korelacijski koeficient R ne zadostuje, da bi ugotovil razliko med odvisnimi spremenljivkami in neodvisnimi spremenljivkami, saj je korelacijski koeficient med spremenljivkama simetričen. Če na primer oseba poskuša spoznati povezavo med visokim stresom in krvnim tlakom, lahko ugotovi visoko vrednost korelacije, ki kaže, da visok stres povzroča krvni tlak. Zdaj, če spremenljivko zamenjamo, bo rezultat tudi v tem primeru enak, kar kaže, da stres povzroča krvni tlak, ki nima smisla. Tako se mora raziskovalec zavedati podatkov, ki jih uporablja za izvajanje analize.
- S to metodo ni mogoče dobiti informacij o naklonu črte, saj le navaja, ali obstaja povezava med spremenljivkama ali ne.
- Verjetno je, da se Pearsonov koeficient korelacije lahko napačno interpretira, zlasti v primeru homogenih podatkov.
- V primerjavi z drugimi metodami izračunavanja traja veliko časa, da pride do rezultatov.
Pomembne točke
- Vrednosti se lahko gibljejo od vrednosti +1 do vrednosti -1, kjer +1 označuje popolno pozitivno razmerje med upoštevanimi spremenljivkami, -1 označuje popolno negativno razmerje med upoštevanimi spremenljivkami, vrednost 0 pa pomeni, da nobena povezava obstaja med obravnavanimi spremenljivkami.
- Neodvisna je od merske enote spremenljivk. Na primer, če je merska enota ene spremenljivke v letih, medtem ko je merska enota druge spremenljivke v kilogramih, se tudi takrat vrednost tega koeficienta ne spremeni.
- Korelacijski koeficient med spremenljivkama je simetričen, kar pomeni, da bo vrednost korelacijskega koeficienta med Y in X ali X in Y ostala enaka.
Zaključek
Pearsonov korelacijski koeficient je vrsta korelacijskega koeficienta, ki predstavlja razmerje med obema spremenljivkama, ki se merita na istem intervalu ali na isti stopnji razmerja. Izmeri moč odnosa med obema neprekinjenima spremenljivkama.
Navaja ne samo prisotnost ali odsotnost korelacije med obema spremenljivkama, temveč tudi natančno določa, v kolikšni meri so te spremenljivke povezane. Neodvisna je od merske enote spremenljivk, kjer se lahko vrednosti korelacijskega koeficienta gibljejo od vrednosti +1 do vrednosti -1. Vendar ni dovolj, da ugotovimo razliko med odvisnimi spremenljivkami in neodvisnimi spremenljivkami.