Variance vs Covariance
Ang pagkakaiba-iba at covariance ay dalawang sukat na ginagamit sa mga istatistika. Ang pagkakaiba-iba ay isang sukatan ng scatter ng data, at ang covariance ay nagpapahiwatig ng antas ng pagbabago ng dalawang random na variable na magkasama. Ang pagkakaiba-iba ay sa halip ay isang intuitive na konsepto, ngunit ang covariance ay tinukoy sa matematika na hindi ganoon ka-intuitive sa simula.
Higit pa tungkol sa Variance
Ang variance ay isang sukatan ng dispersion ng data mula sa mean value ng distribution. Sinasabi nito kung gaano kalayo ang mga punto ng data mula sa mean ng pamamahagi. Ito ay isa sa mga pangunahing tagapaglarawan ng pamamahagi ng posibilidad at isa sa mga sandali ng pamamahagi. Gayundin, ang pagkakaiba ay isang parameter ng populasyon, at ang pagkakaiba ng isang sample mula sa populasyon ay nagsisilbing isang estimator para sa pagkakaiba ng populasyon. Mula sa isang pananaw, tinukoy ito bilang parisukat ng karaniwang paglihis.
Sa simpleng wika, maaari itong ilarawan bilang average ng mga parisukat ng distansya sa pagitan ng bawat punto ng data at ang mean ng distribusyon. Ang sumusunod na formula ay ginagamit upang kalkulahin ang pagkakaiba.
Var(X)=E[(X-µ)2] para sa isang populasyon, at
Var(X)=E[(X-‾x)2] para sa isang sample
Maaari pang gawing simple ang pagbibigay ng Var(X)=E[X2]-(E[X])2.
Ang Variance ay may ilang mga katangian ng lagda, at kadalasang ginagamit sa mga istatistika upang gawing mas simple ang paggamit. Ang pagkakaiba ay hindi negatibo dahil ito ang parisukat ng mga distansya. Gayunpaman, ang hanay ng pagkakaiba ay hindi limitado at depende sa partikular na pamamahagi. Ang pagkakaiba ng isang pare-parehong random na variable ay zero, at ang pagkakaiba ay hindi nagbabago kaugnay ng isang parameter ng lokasyon.
Higit pa tungkol sa Covariance
Sa teoryang istatistika, ang covariance ay isang sukatan kung gaano kalaki ang pagbabago ng dalawang random na variable nang magkasama. Sa madaling salita, ang covariance ay isang sukatan ng lakas ng ugnayan sa pagitan ng dalawang random na variable. Gayundin, maaari itong ituring bilang isang paglalahat ng konsepto ng pagkakaiba ng dalawang random na variable.
Covariance ng dalawang random na variable na X at Y, na magkasamang ibinahagi sa may hangganan na pangalawang momentum, ay kilala bilang σXY=E[(X-E[X])(Y-E[Y])]. Mula dito, ang pagkakaiba ay makikita bilang isang espesyal na kaso ng covariance, kung saan ang dalawang variable ay pareho. Cov(X, X)=Var(X)
Sa pamamagitan ng pag-normalize ng covariance, maaaring makuha ang linear correlation coefficient o ang coefficient ng correlation ng Pearson, na tinukoy bilang ρ=E[(X-E[X])(Y-E[Y])]/(σ X σY)=(Cov(X, Y))/(σX σY )
Graphically, ang covariance sa pagitan ng isang pares ng data point ay makikita bilang ang area ng rectangle na may mga data point sa magkabilang vertices. Maaari itong bigyang kahulugan bilang isang sukatan ng magnitude ng paghihiwalay sa pagitan ng dalawang punto ng data. Isinasaalang-alang ang mga parihaba para sa buong populasyon, ang magkakapatong ng mga parihaba na tumutugma sa lahat ng mga punto ng data ay maaaring ituring bilang ang lakas ng paghihiwalay; pagkakaiba-iba ng dalawang variable. Ang covariance ay nasa dalawang dimensyon, dahil sa dalawang variable, ngunit ang pagpapasimple nito sa isang variable ay nagbibigay ng pagkakaiba ng isang solong bilang ang paghihiwalay sa isang dimensyon.
Ano ang pagkakaiba ng Variance at Covariance?
• Ang pagkakaiba ay ang sukatan ng pagkalat/pagkalat sa isang populasyon habang ang covariance ay itinuturing bilang isang sukatan ng pagkakaiba-iba ng dalawang random na variable o ang lakas ng ugnayan.
• Ang pagkakaiba ay maaaring ituring bilang isang espesyal na kaso ng covariance.
• Ang pagkakaiba-iba at covariance ay nakasalalay sa laki ng mga halaga ng data, at hindi maihahambing; samakatuwid, sila ay normalized. Ang covariance ay na-normalize sa correlation coefficient (hinahati sa produkto ng standard deviations ng dalawang random variable) at ang variance ay na-normalize sa standard deviation (sa pamamagitan ng pagkuha ng square root)