Pagkakaiba sa pagitan ng Central Tendency at Dispersion

Pagkakaiba sa pagitan ng Central Tendency at Dispersion
Pagkakaiba sa pagitan ng Central Tendency at Dispersion

Video: Pagkakaiba sa pagitan ng Central Tendency at Dispersion

Video: Pagkakaiba sa pagitan ng Central Tendency at Dispersion
Video: Ching W. Tang - 2019 Kyoto Laureate in Advanced Technology - Lecture and Conversation 2024, Hulyo
Anonim

Central Tendency vs Dispersion

Sa descriptive at inferential statistics, maraming indeks ang ginagamit upang ilarawan ang isang set ng data na tumutugma sa central tendency, dispersion, at skewness nito: ang tatlong pinakamahalagang katangian na tumutukoy sa relatibong hugis ng distribution ng isang data set.

Ano ang central tendency?

Central tendency ay tumutukoy at hinahanap ang sentro ng pamamahagi ng mga halaga. Ang mean, mode, at median ay ang pinakakaraniwang ginagamit na mga indeks sa paglalarawan ng sentral na tendensya ng isang set ng data. Kung simetriko ang isang set ng data, magkasabay ang median at mean ng set ng data sa isa't isa.

Binigyan ng set ng data, kinakalkula ang mean sa pamamagitan ng pagkuha ng kabuuan ng lahat ng value ng data at pagkatapos ay paghahati-hati nito sa bilang ng data. Halimbawa, ang bigat ng 10 tao (sa kilo) ay sinusukat na 70, 62, 65, 72, 80, 70, 63, 72, 77 at 79. Kung gayon ang ibig sabihin ng timbang ng sampung tao (sa kilo) ay maaaring kinakalkula bilang mga sumusunod. Ang kabuuan ng mga timbang ay 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79=710. Mean=(sum) / (bilang ng data)=710 / 10=71 (sa kilo). Nauunawaan na ang mga outlier (mga punto ng data na lumihis mula sa normal na kalakaran) ay may posibilidad na makaapekto sa mean. Kaya, sa pagkakaroon ng mga outlier, ibig sabihin ay hindi magbibigay ng tamang larawan tungkol sa gitna ng set ng data.

Ang median ay ang data point na makikita sa eksaktong gitna ng set ng data. Ang isang paraan upang makalkula ang median ay ang pag-order ng mga punto ng data sa pataas na pagkakasunud-sunod, at pagkatapos ay hanapin ang punto ng data sa gitna. Halimbawa, kung isang beses na-order ang nakaraang set ng data ay mukhang, 62, 63, 65, 70, 70, 72, 72, 77, 79, 80. Samakatuwid, ang (70+72)/2=71 ay nasa gitna. Mula dito, makikita na ang median ay hindi kailangang nasa set ng data. Ang Median ay hindi apektado ng presensya ng mga outlier. Samakatuwid, ang median ay magsisilbing isang mas mahusay na sukatan ng sentral na tendensya sa pagkakaroon ng mga outlier.

Ang mode ay ang pinakamadalas na nagaganap na value sa set ng data. Sa nakaraang halimbawa, ang value na 70 at 72 ay parehong nangyayari nang dalawang beses at sa gayon, pareho ang mga mode. Ipinapakita nito na, sa ilang mga distribusyon, mayroong higit sa isang halaga ng modal. Kung mayroon lamang isang mode, ang data set ay sinasabing unimodal, sa kasong ito, ang data set ay bimodal.

Ano ang dispersion?

Ang Dispersion ay ang dami ng pagkalat ng data tungkol sa sentro ng pamamahagi. Ang range at standard deviation ay ang pinakakaraniwang ginagamit na mga sukat ng dispersion.

Ang hanay ay ang pinakamataas na halaga na binawasan ang pinakamababang halaga. Sa nakaraang halimbawa, ang pinakamataas na value ay 80 at ang pinakamababang value ay 62, kaya ang range ay 80-62=18. Ngunit ang range ay hindi nagbibigay ng sapat na larawan tungkol sa dispersion.

Upang kalkulahin ang standard deviation, unang kinakalkula ang mga deviation ng mga value ng data mula sa mean. Ang root square mean ng deviations ay tinatawag na standard deviation. Sa nakaraang halimbawa, ang kani-kanilang mga paglihis mula sa mean ay (70 – 71)=-1, (62 – 71)=-9, (65 – 71)=-6, (72 – 71)=1, (80 – 71)=9, (70 – 71)=-1, (63 – 71)=-8, (72 – 71)=1, (77 – 71)=6 at (79 – 71)=8. Ang kabuuan ng ang mga parisukat ng deviation ay (-1)2 + (-9)2 + (-6)2+ 12 + 92 + (-1)2 + (-8) 2 + 12 + 62 + 82=366 Ang standard deviation ay √(366/10)=6.05 (sa kilo). Maliban na lang kung ang set ng data ay lubhang nabaluktot, mula rito ay mahihinuha na ang karamihan ng data ay nasa pagitan na 71±6.05, at talagang ganoon sa partikular na halimbawang ito.

Ano ang pagkakaiba ng central tendency at dispersion?

• Ang sentral na tendency ay tumutukoy at hinahanap ang sentro ng pamamahagi ng mga value

• Ang dispersion ay ang dami ng pagkalat ng data tungkol sa gitna ng isang set ng data.

Inirerekumendang: