Standard Deviation vs Mean
Sa mga deskriptibo at inferential na istatistika, maraming mga indeks ang ginagamit upang ilarawan ang isang set ng data na tumutugma sa gitnang tendency, dispersion at skewness nito. Sa statistical inference, ang mga ito ay karaniwang kilala bilang mga estimator dahil tinatantya nila ang mga value ng parameter ng populasyon.
Central tendency ay tumutukoy at hinahanap ang sentro ng pamamahagi ng mga halaga. Ang mean, mode at median ay ang pinakakaraniwang ginagamit na mga indeks sa paglalarawan ng sentral na tendency ng isang set ng data. Ang dispersion ay ang dami ng pagkalat ng data mula sa sentro ng pamamahagi. Ang range at standard deviation ay ang pinakakaraniwang ginagamit na mga sukat ng dispersion. Ang mga skewness coefficient ng Pearson ay ginagamit sa paglalarawan ng skewness ng isang distribusyon ng data. Dito, ang skewness ay tumutukoy sa kung ang data set ay simetriko tungkol sa gitna o hindi at kung hindi kung gaano ito baluktot.
Ano ang ibig sabihin?
Ang Mean ay ang pinakakaraniwang ginagamit na index ng central tendency. Dahil sa isang set ng data, ang ibig sabihin ay kinakalkula sa pamamagitan ng pagkuha ng kabuuan ng lahat ng mga halaga ng data at pagkatapos ay paghahati nito sa bilang ng data. Halimbawa, ang bigat ng 10 tao (sa kilo) ay sinusukat na 70, 62, 65, 72, 80, 70, 63, 72, 77 at 79. Kung gayon ang ibig sabihin ng timbang ng sampung tao (sa kilo) ay maaaring kinakalkula bilang mga sumusunod. Ang kabuuan ng mga timbang ay 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79=710. Mean=(sum) / (bilang ng data)=710 / 10=71 (sa kilo).
Tulad sa partikular na halimbawang ito, ang ibig sabihin ng halaga ng isang set ng data ay maaaring hindi isang punto ng data ng set ngunit magiging natatangi para sa isang ibinigay na set ng data. Ang ibig sabihin ay magkakaroon ng parehong mga yunit ng orihinal na data. Samakatuwid, maaari itong markahan sa parehong axis ng data at maaaring magamit sa mga paghahambing. Gayundin, walang sign restriction para sa mean ng isang set ng data. Maaaring ito ay negatibo, zero o positibo, dahil ang kabuuan ng set ng data ay maaaring negatibo, zero o positibo.
Ano ang standard deviation?
Ang standard deviation ay ang pinakakaraniwang ginagamit na index ng dispersion. Upang kalkulahin ang karaniwang paglihis, una ang mga paglihis ng mga halaga ng data mula sa mean ay kinakalkula. Ang root square mean ng deviations ay tinatawag na standard deviation.
Sa nakaraang halimbawa, ang kani-kanilang mga paglihis mula sa mean ay (70 – 71)=-1, (62-71)=-9, (65-71)=-6, (72-71)=1, (80-71)=9, (70-71)=-1, (63-71)=-8, (72-71)=1, (77-71)=6 at (79-71)=8. Ang kabuuan ng mga parisukat ng deviation ay (-1)2+ (-9)2+ (-6)2+ 1 2+92+ (-1)2+ (-8)2 + 12+ 62 + 82=366. Ang standard deviation ay √(366/10)=6.05 (sa kilo). Mula dito, mahihinuha na ang karamihan sa mga datos ay nasa pagitan ng 71±6.05, sa kondisyon na ang set ng data ay hindi masyadong baluktot, at talagang ganoon sa partikular na halimbawang ito.
Dahil ang standard deviation ay may parehong mga unit gaya ng orihinal na data, nagbibigay ito sa amin ng sukatan kung gaano kalaking deviation ang data mula sa gitna; mas malaki ang standard deviation mas malaki ang dispersion. Gayundin, ang standard deviation ay magiging isang nonnegative na value anuman ang katangian ng data sa set ng data.
Ano ang pagkakaiba sa pagitan ng standard deviation at mean?
• Ang standard deviation ay isang sukatan ng dispersion mula sa gitna, samantalang ang mean ay sumusukat sa lokasyon ng gitna ng isang data set.
• Ang standard deviation ay palaging isang nonnegative na value, ngunit ang mean ay maaaring tumagal ng anumang tunay na halaga.