Categorical Data vs Numerical Data
Ang Data ay ang mga katotohanan o impormasyong nakolekta para sa layunin ng sanggunian o pagsusuri. Kadalasan ang mga datos na ito ay kinokolekta bilang katangian ng kinauukulang paksa. Ang katangiang ito ay maaaring mag-iba mula sa isa't isa kaya't ang iba't ibang katangiang ito ay maaaring ituring bilang isang variable. Ang mga variable ay maaaring magkaroon ng iba't ibang anyo ng mga halaga at ang mga ito ay intrinsic sa mga nakolektang data.
Ang mga variable ay maaaring maging qualitative o quantitative; ibig sabihin, kung ang variable ay quantitative, ang mga sagot ay mga numero at ang magnitude ng attribute na sinusukat ay maaaring ipahayag na may isang tiyak na antas ng katumpakan. Ang iba pang uri, ang mga qualitative variable ay sumusukat sa qualitative attributes at ang mga value na ipinapalagay ng mga variable ay hindi maaaring ibigay sa mga tuntunin ng laki o magnitude. Ang mga variable mismo ay kilala bilang categorical variable at ang data na nakolekta sa pamamagitan ng isang categorical variable ay categorical data.
Higit pa tungkol sa Numerical Data
Numerical data ay karaniwang ang dami ng data na nakuha mula sa isang variable, at ang halaga ay may kahulugan ng laki/magnitude. Ang mga datos na Numerical na nakuha ay nahahati pa sa tatlo pang kategorya batay sa teoryang binuo ni Stanley Smith Stevens. Ang numerical na data ay maaaring alinman sa ordinal, interval o ratio. Ang uri ng data ay tinutukoy ng paraan ng pagsukat ng mga halaga, at ang mga uri ay kilala bilang mga antas ng pagsukat.
Ang bigat ng isang tao, ang distansya sa pagitan ng dalawang punto, temperatura, at ang presyo ng isang stock ay mga halimbawa ng numerical data.
Sa mga istatistika, karamihan sa mga pamamaraan ay hinango para sa pagsusuri ng numerical na data. Pangunahing ginagamit ang mga pangunahing deskriptibong istatistika at regression at iba pang inferential na pamamaraan para sa pagsusuri ng numerical data.
Higit pa tungkol sa Categorical Data
Ang data na pangkategorya ay mga halaga para sa isang variable na husay, kadalasan ay isang numero, isang salita, o isang simbolo. Inilalabas nila ang katotohanan na ang variable sa isinasaalang-alang na kaso ay kabilang sa isa sa ilang mga pagpipilian na magagamit. Samakatuwid, nabibilang sila sa isa sa mga kategorya; kaya ang pangalan ay kategorya.
Ang political affiliation ng isang tao, nationality ng isang tao, ang paboritong kulay ng isang tao, at ang blood group ng isang pasyente ay qualitative attributes. Minsan, ang isang numero ay maaaring makuha bilang isang kategoryang halaga, ngunit ang numero mismo ay hindi kumakatawan sa magnitude ng katangiang sinusukat. Ang Postal code ay isang halimbawa.
Gayundin, ang anumang mga pangkategoryang halaga ay nabibilang sa nominal na uri ng data, na isa pang uri batay sa mga antas ng mga sukat. Ang mga paraan na ginagamit para sa pagsusuri ng kategoryang data ay iba sa numerical na data, ngunit ang pinagbabatayan na prinsipyo ay maaaring pareho.
Ano ang pagkakaiba ng Kategorya at Numerical na Data?
• Ang numerical data ay mga value na nakuha para sa quantitative variable, at nagdadala ng sense of magnitude na nauugnay sa konteksto ng variable (kaya, ang mga ito ay palaging mga numero o simbolo na may numerical value). Ang kategoryang data ay mga halagang nakuha para sa isang variable na husay; Ang mga pang-kategoryang numero ng data ay hindi nagdadala ng isang pakiramdam ng magnitude.
• Palaging nabibilang ang numerical data sa alinman sa ordinal, ratio, o interval type, samantalang ang categorical data ay nabibilang sa nominal type.
• Ang mga paraan na ginagamit upang pag-aralan ang dami ng data ay iba sa mga pamamaraang ginagamit para sa pang-kategoryang data, kahit na ang mga prinsipyo ay pareho man lang ang aplikasyon ay may makabuluhang pagkakaiba.
• Sinusuri ang numerical data gamit ang mga istatistikal na pamamaraan sa mga deskriptibong istatistika, regression, time series at marami pa.
• Para sa kategoryang data ay kadalasang ginagamit ang mga pamamaraang deskriptibo at mga graphical na pamamaraan. Ginagamit din ang ilang non-parametric test.