Deviation vs Standard Deviation
Deviation vs Standard Deviation
Sa mga deskriptibo at inferential na istatistika, maraming mga indeks ang ginagamit upang ilarawan ang isang set ng data na tumutugma sa gitnang tendency, dispersion at skewness nito. Sa statistical inference, ang mga ito ay karaniwang kilala bilang mga estimator dahil tinatantya nila ang mga value ng parameter ng populasyon.
Ang Dispersion ay ang sukatan ng pagkalat ng data sa gitna ng set ng data. Ang standard deviation ay isa sa mga pinakakaraniwang ginagamit na sukat ng dispersion. Ang mga deviations ng bawat data point mula sa mean ay isinasaalang-alang kapag kinakalkula ang standard deviation. Kaya, maaaring ipangatuwiran ng isa na ang karaniwang paglihis kasama ang mean ay magbibigay ng halos sapat na larawan tungkol sa isang set ng data.
Isaalang-alang ang sumusunod na set ng data. Ang bigat ng 10 tao (sa kilo) ay sinusukat na 70, 62, 65, 72, 80, 70, 63, 72, 77 at 79. Pagkatapos ang mean weight ng sampung tao (sa kilo) ay 71 (sa kilo)).
Ano ang deviation?
Sa mga istatistika, ang paglihis ay nangangahulugang ang halaga kung saan ang isang punto ng data ay naiiba sa isang nakapirming halaga gaya ng mean. Sa pangkalahatan, hayaang maging fixed value ang k at ang x1, x2, …, xn ay tumutukoy sa isang data itakda. Pagkatapos, ang paglihis ng xj mula sa k ay tinukoy bilang (xj– k).
Halimbawa, sa set ng data sa itaas ang kani-kanilang paglihis mula sa mean ay (70 – 71)=-1, (62 – 71)=-9, (65 – 71)=-6, (72 – 71)=1, (80 – 71)=9, (70 – 71)=-1, (63 – 71)=-8, (72 – 71)=1, (77 – 71)=6 at (79 – 71)=8.
Ano ang standard deviation?
Kapag ang data mula sa buong populasyon ay maaaring isaalang-alang (halimbawa sa kaso ng isang census), posibleng kalkulahin ang pamantayan ng paglihis ng populasyon. Upang kalkulahin ang karaniwang paglihis ng populasyon, una ang mga paglihis ng mga halaga ng data mula sa ibig sabihin ng populasyon ay kinakalkula. Ang root mean square (quadratic mean) ng mga deviations ay tinatawag na population standard deviation. Sa mga simbolo, σ=√{ ∑(xi-µ)2 / n} kung saan ang µ ay ang ibig sabihin ng populasyon at n ang laki ng populasyon.
Kapag ginamit ang data mula sa isang sample (ng laki n) upang tantyahin ang mga parameter ng populasyon, kinakalkula ang sample na standard deviation. Una ang mga paglihis ng mga halaga ng data mula sa sample mean ay kinakalkula. Dahil ang sample mean ay ginagamit bilang kapalit ng populasyong mean (na hindi alam), ang pagkuha ng quadratic mean ay hindi angkop. Upang mabayaran ang paggamit ng sample mean, ang kabuuan ng mga parisukat ng mga deviations ay hinati ng (n-1) sa halip na n. Ang sample na standard deviation ay ang square root nito. Sa mga simbolo ng matematika, S=√{ ∑(xi-ẍ)2 / (n-1)}, kung saan ang S ay ang sample na standard deviation, ẍ ang sample mean at ang xi ay ang data point.
Sa nakaraang set ng data, ang kabuuan ng mga parisukat ng deviation ay (-1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1) 2 + (-8)2 + 12 + 62 + 82=366. Kaya, ang standard deviation ng populasyon ay √(366/10)=6.05 (sa kilo). (Ipagpalagay na ang populasyon na isinasaalang-alang ay binubuo ng 10 tao kung saan kinuha ang data).
Ano ang pagkakaiba ng deviation at standard deviation?
• Ang standard deviation ay isang statistical index at isang estimator, ngunit hindi ang deviation.
• Ang standard deviation ay isang sukatan ng dispersion ng isang cluster ng data mula sa gitna, samantalang ang deviation ay tumutukoy sa halaga kung saan ang isang punto ng data ay naiiba sa isang fixed value.