Normalna porazdelitev v statistiki - opredelitev, primer, razlaga

Kaj je običajna porazdelitev v statistiki?

Normal Distribution je zvonasta krivulja frekvence porazdelitve, ki pomaga opisati vse možne vrednosti, ki jih naključna spremenljivka lahko sprejme v določenem obsegu, pri čemer je večina območja porazdelitve na sredini in le malo v repih, skrajno Ta porazdelitev ima dva ključna parametra: povprečje (µ) in standardni odklon (σ), ki ima ključno vlogo pri izračunu donosa sredstev in strategiji upravljanja tveganj.

Kako razlagati normalno distribucijo

Zgornja slika kaže, da je statistična normalna porazdelitev zvončaste krivulje. Območje možnih izidov te porazdelitve je celotno realno število, ki leži med -∞ in + ∞. Repi zvončaste krivulje segajo na obeh straneh grafikona (+/-) brez omejitev.

  • Približno 68% vseh opazovanj spada v +/- en standardni odklon (σ)
  • Približno 95% vseh opazovanj spada v +/- dva standardna odklona (σ)
  • Približno 99% vseh opazovanj spada v +/- tri standardne deviacije (σ)

Ima koso ničelnost (simetrija porazdelitve). Če je porazdelitev podatkov asimetrična, potem je porazdelitev neenakomerna, če ima nabor podatkov poševnost večjo od nič ali pozitivno poprečnost. Nato je desni rep porazdelitve daljši od levega, pri negativni poševnosti (manj kot nič) pa bo levi rep daljši od desnega.

Ima kurtozo 3 (meri vrhost porazdelitve), kar pomeni, da porazdelitev ni niti previsoka niti pretanka. Če je kurtoza več kot tri, je porazdelitev bolj dosežena z debelejšimi repi in če je kurtoza manjša od treh, ima tanke repove in vrh je nižji od običajne porazdelitve.

Značilnosti

  • Predstavljajo družino porazdelitve, kjer povprečje in odstopanje določata obliko porazdelitve.
  • Povprečje, mediana in način te porazdelitve so enaki.
  • Polovica vrednosti je levo od sredine, druga polovica pa desno.
  • Skupna vrednost pod standardno krivuljo bo vedno enaka.
  • Najverjetneje je porazdelitev v središču, manj vrednosti pa leži na koncu.

Preoblikovanje (Z)

Funkcija gostote verjetnosti (PDF) naključne spremenljivke (X) po porazdelitvi je podana z:

kjer je -∞ <x <∞; -∞ <µ 0

Kje,

  • F (x) = normalna verjetnostna funkcija
  • x = naključna spremenljivka
  • µ = srednja vrednost porazdelitve
  • σ = standardni odklon porazdelitve
  • π = 3,14159
  • e = 2,71828

Formula preobrazbe

Kje,

  • X = Naključna spremenljivka

Primeri običajne porazdelitve v statistiki

Pogovorimo se o naslednjih primerih.

Primer # 1

Recimo, da ima podjetje 10000 zaposlenih in več struktur plač glede na delovno mesto, v katerem dela. Plače se običajno razdelijo s povprečno populacijo µ = 60.000 USD in standardnim odklonom populacije σ = 15.000 USD. Kolikšna bo verjetnost, da ima naključno izbrani zaposleni letno plačo, nižjo od 45000 USD.

Rešitev

Kot je prikazano na zgornji sliki, moramo za odgovor na to vprašanje ugotoviti območje pod normalno krivuljo od 45 do levega bočnega repa. Za pravi odgovor moramo uporabiti tudi vrednost Z-tabele.

Prvič, dano povprečje in standardni odklon moramo pretvoriti v standardno normalno porazdelitev s povprečjem (µ) = 0 in standardnim odklonom (σ) = 1 s pomočjo pretvorbene formule.

Po pretvorbi moramo poiskati Z-tabelo, da ugotovimo ustrezno vrednost, ki nam bo dala pravilen odgovor.

Glede na to,

  • Povprečje (µ) = 60.000 USD
  • Standardni odklon (σ) = 15000 USD
  • Naključna spremenljivka (x) = 45000 USD

Transformacija (z) = (45000 - 60000/15000)

Transformacija (z) = -1

Zdaj je vrednost, ki je enaka -1 v Z-tabeli, 0,1587, kar predstavlja površino pod krivuljo od 45 do poti levo. Navedlo je, da je pri naključnem izboru zaposlenega verjetnost zaslužka manj kot 45000 USD letno 15,87%.

2. primer

Zdaj obdržite isti scenarij kot zgoraj, ugotovite verjetnost, da naključno izbrani zaposleni z običajno distribucijo zasluži več kot 80.000 USD na leto.

Rešitev

V tem vprašanju moramo torej po isti formuli ugotoviti zasenčeno območje od 80 do desnega repa.

Glede na to,

  • Povprečje (µ) = 60.000 USD
  • Standardni odklon (σ) = 15000 USD
  • Naključna spremenljivka (X) = 80.000 USD

Preoblikovanje (z) = (80000 - 60000/15000)

Transformacija (z) = 1,33

Glede na Z-tabelo je enakovredna vrednost 1,33 0,9082 ali 90,82%, kar kaže, da je verjetnost naključnega izbiranja zaposlenih, ki zaslužijo manj kot 80.000 USD letno, 90,82%.

Toda glede na vprašanje moramo določiti verjetnost, da bodo naključni zaposleni zaslužili več kot 80.000 USD na leto, zato moramo vrednost odšteti od 100.

  • Naključna spremenljivka (X) = 100% - 90,82%
  • Naključna spremenljivka (X) = 9,18%

Torej je verjetnost, da zaposleni zaslužijo več kot 80.000 USD na leto, 9,18%.

Uporabe

  • Tehnična karta delniških trgov je pogosto zvončna krivulja, ki analitikom in vlagateljem omogoča statistično sklepanje o pričakovanem donosu in tveganju zalog.
  • Uporablja se v resničnem svetu, na primer za določanje najverjetneje najboljšega časa, ki ga picerije potrebujejo za dostavo pice, in še veliko več resničnih aplikacij.
  • Uporablja se za primerjavo višin določenega sklopa prebivalstva, pri katerem bo večina ljudi imela povprečno velikost, zelo malo ljudi pa bo imelo nadpovprečno ali podpovprečno višino.
  • Uporabljajo se pri določanju povprečne akademske uspešnosti študentov, kar pomaga primerjati rang študentov.

Zaključek

Običajna distribucija najde aplikacije v podatkovni znanosti in analitiki podatkov. Napredne tehnologije, kot sta umetna inteligenca in strojno učenje, ki se uporabljajo skupaj s to distribucijo, lahko izboljšajo kakovost podatkov, kar bo posameznikom in podjetjem pomagalo pri učinkovitem odločanju.

Zanimive Članki...