Pagkakaiba sa Pagitan ng Correlation at Covariance

Pagkakaiba sa Pagitan ng Correlation at Covariance
Pagkakaiba sa Pagitan ng Correlation at Covariance

Video: Pagkakaiba sa Pagitan ng Correlation at Covariance

Video: Pagkakaiba sa Pagitan ng Correlation at Covariance
Video: Muhammad Farooq-i-Azam: Correlation and Covariance of Pairs of Continuous Random Variables 2024, Nobyembre
Anonim

Correlation vs Covariance

Ang Correlation at covariance ay malapit na nauugnay na mga konsepto sa theoretical statistics. Mahalaga ang mga ito sa pagtukoy ng ugnayan sa pagitan ng dalawang random na variable.

Ano ang Correlation?

Ang ugnayan ay isang sukatan ng lakas ng ugnayan sa pagitan ng dalawang variable. Ang correlation coefficient ay binibilang ang antas ng pagbabago ng isang variable batay sa pagbabago ng isa pang variable. Sa mga istatistika, ang ugnayan ay konektado sa konsepto ng pag-asa, na siyang istatistikal na kaugnayan sa pagitan ng dalawang variable

Ang correlation coefficient ng Pearson o ang correlation coefficient r ay isang value sa pagitan ng -1 at 1 (-1≤r≤+1). Ito ang pinakakaraniwang ginagamit na koepisyent ng ugnayan at wasto lamang para sa isang linear na relasyon sa pagitan ng mga variable. Kung r=0 walang relasyon, at kung r≥0 ang relasyon ay direktang proporsyonal; ang halaga ng isang variable ay tumataas sa pagtaas ng isa pa. Kung r≤0 ang relasyon ay inversely proportional; bumababa ang isang variable habang tumataas ang isa.

Dahil sa linearity na kundisyon, maaari ding gamitin ang correlation coefficient r upang maitaguyod ang pagkakaroon ng linear na relasyon sa pagitan ng mga variable.

Ano ang Covariance?

Sa teoryang istatistika, ang covariance ay isang sukatan kung gaano kalaki ang pagbabago ng dalawang random na variable nang magkasama. Sa madaling salita, ang covariance ay isang sukatan ng lakas ng ugnayan sa pagitan ng dalawang random na variable.

Sa ibang pananaw, makikita na ang correlation ay ang normalized na bersyon lamang ng covariance, kung saan ang covariance ay hinahati sa produkto ng standard deviations ng dalawang random variable. Ang hanay ng covariance ay maaaring malaki; kaya hindi madaling ikumpara. Ang kahirapan na ito ay nalalampasan sa pamamagitan ng pagdadala ng mga halaga ng covariance sa isang hanay kung saan maaari itong ikumpara sa pamamagitan ng pag-normalize nito (tulad ng ginagawa ng z-score). Bagama't ang covariance at variance ay naka-link sa isa't isa sa paraang nasa itaas, ang kanilang mga probability distribution ay hindi nakakabit sa isa't isa sa simpleng paraan at kailangang hiwalayan.

Ano ang pagkakaiba ng Correlation at Covariance?

• Ang parehong ugnayan at covariance ay mga sukat ng kaugnayan sa pagitan ng dalawang random na variable. Ang correlation ay ang sukatan ng lakas ng linearity ng dalawang variable at ang covariance ay isang sukatan ng lakas ng correlation.

• Ang mga value ng correlation coefficient ay isang value sa pagitan ng -1 at +1, samantalang ang hanay ng covariance ay hindi pare-pareho, ngunit maaaring maging positibo o negatibo. Ngunit kung ang mga random na variable ay na-standardize bago kalkulahin ang covariance kung gayon ang covariance ay katumbas ng ugnayan at may halaga sa pagitan ng -1 at +1.

Inirerekumendang: