Stratified Sampling vs Cluster Sampling
Sa mga istatistika, lalo na kapag nagsasagawa ng mga survey, mahalagang makakuha ng walang pinapanigan na sample, upang mas tumpak ang resulta at mga hula na ginawa tungkol sa populasyon. Ngunit, sa simpleng random sampling, umiiral ang posibilidad na piliin ang mga miyembro ng sample na may kinikilingan; sa madaling salita, hindi ito kumakatawan sa populasyon nang patas. Samakatuwid, ginagamit ang stratified sampling at cluster sampling upang madaig ang mga isyu sa bias at kahusayan ng simpleng random sampling.
Stratified Sampling
Ang stratified random sampling ay isang paraan ng sampling kung saan ang populasyon ay unang nahahati sa strata (Ang isang stratum ay isang homogenous na subset ng populasyon). Pagkatapos ay kinukuha ang isang simpleng random na sample mula sa bawat stratum. Ang mga resulta mula sa bawat strata na pinagsama ang bumubuo sa sample. Ang sumusunod ay mga halimbawa ng posibleng strata sa mga populasyon
• Para sa populasyon ng isang estado, lalaki at babae strata
• Para sa mga taong nagtatrabaho sa isang lungsod, resident at non-resident strata
• Para sa mga mag-aaral sa isang kolehiyo, puti, itim, Hispanic, at Asian strata
• Para sa madla ng isang debate tungkol sa teolohiya, Protestante, Katoliko, Hudyo, Muslim strata
Sa prosesong ito, sa halip na kumuha ng mga sample nang random diretso mula sa populasyon, ang populasyon ay pinaghihiwalay sa mga pangkat gamit ang isang likas na katangian ng mga elemento (homogeneous na mga grupo). Pagkatapos ay kinuha ang mga random na sample mula sa grupo. Ang dami ng mga random na sample na kinuha mula sa bawat pangkat ay nakadepende sa bilang ng mga elemento sa loob ng grupo.
Ito ay nagbibigay-daan sa paggawa ng sampling nang hindi mas malaki ang sample ng isang pangkat kaysa sa bilang ng mga sample na kinakailangan mula sa partikular na pangkat na iyon. Kung ang bilang ng mga elemento mula sa isang partikular na pangkat ay mas malaki kaysa sa kinakailangang halaga, maaaring humantong sa mga maling interpretasyon ang isang liko sa pamamahagi.
Sratified sampling ay nagbibigay-daan sa paggamit ng iba't ibang istatistikal na pamamaraan para sa bawat stratum, na tumutulong sa pagpapabuti ng kahusayan at katumpakan ng pagtatantya.
Cluster Sampling
Ang Cluster random sampling ay isang paraan ng sampling kung saan unang nahahati ang populasyon sa mga cluster (Ang cluster ay isang heterogenous na subset ng populasyon). Pagkatapos ay kinuha ang isang simpleng random na sample ng mga kumpol. Ang lahat ng miyembro ng mga napiling kumpol ay sama-samang bumubuo sa sample. Ang paraang ito ay kadalasang ginagamit kapag ang mga natural na pagpapangkat ay halata at available.
Para sa mga halimbawa, isaalang-alang ang isang survey para sa pagsusuri sa paglahok ng mga mag-aaral sa high school sa mga extracurricular na aktibidad. Sa halip na pumili ng mga random na estudyante mula sa populasyon ng mag-aaral, ang pagpili ng klase bilang mga sample para sa survey ay cluster sampling. Pagkatapos ang bawat miyembro ng klase ay kapanayamin. Sa kasong ito, ang mga klase ay mga kumpol ng populasyon ng mag-aaral.
Sa cluster sampling, ang mga cluster ang pinipili nang random, hindi ang mga indibidwal. Ipinapalagay na ang bawat cluster mismo ay isang walang pinapanigan na representasyon ng populasyon, na nagpapahiwatig na ang bawat isa sa mga cluster ay heterogenous.
Ano ang pagkakaiba ng Stratified Sampling at Cluster Sampling?
• Sa stratified sampling, ang populasyon ay nahahati sa mga homogenous na grupo na tinatawag na strata, gamit ang isang attribute ng mga sample. Pagkatapos ay pipiliin ang mga miyembro mula sa bawat stratum, at ang bilang ng mga sample na kinuha mula sa mga strata na iyon ay proporsyonal sa presensya ng strata sa loob ng populasyon.
• Sa cluster sampling, ang populasyon ay pinagsama-sama sa mga cluster, na higit na nakabatay sa lokasyon, at pagkatapos ay pinipili ang isang cluster nang random.
• Sa cluster sampling, isang cluster ang pinipili nang random, samantalang sa stratified sampling ang mga miyembro ay pinipili nang random.
• Sa stratified sampling, ang bawat pangkat na ginamit (strata) ay kinabibilangan ng mga homogenous na miyembro habang, sa cluster sampling, ang isang cluster ay heterogenous.
• Mas mabagal ang stratified sampling habang medyo mas mabilis ang cluster sampling.
• Ang mga stratified sample ay may mas kaunting error dahil sa pag-factor sa presensya ng bawat pangkat sa loob ng populasyon at pag-aangkop sa mga pamamaraan upang makakuha ng mas mahusay na pagtatantya.
• Ang cluster sampling ay may likas na mas mataas na porsyento ng error.