Pagkakaiba sa pagitan ng KDD at Data mining

Pagkakaiba sa pagitan ng KDD at Data mining
Pagkakaiba sa pagitan ng KDD at Data mining

Video: Pagkakaiba sa pagitan ng KDD at Data mining

Video: Pagkakaiba sa pagitan ng KDD at Data mining
Video: How To Import Transactions Connection To Your Bank With QuickBooks Online 2024, Nobyembre
Anonim

KDD vs Data mining

Ang KDD (Knowledge Discovery in Databases) ay isang larangan ng computer science, na kinabibilangan ng mga tool at teorya upang tulungan ang mga tao sa pagkuha ng kapaki-pakinabang at hindi pa alam na impormasyon (i.e. kaalaman) mula sa malalaking koleksyon ng digitized na data. Ang KDD ay binubuo ng ilang mga hakbang, at ang Data Mining ay isa sa mga ito. Ang Data Mining ay aplikasyon ng isang partikular na algorithm upang kunin ang mga pattern mula sa data. Gayunpaman, magkasabay na ginagamit ang KDD at Data Mining.

Ano ang KDD?

Tulad ng nabanggit sa itaas, ang KDD ay isang larangan ng computer science, na tumatalakay sa pagkuha ng dati nang hindi alam at kawili-wiling impormasyon mula sa raw data. Ang KDD ay ang buong proseso ng pagsisikap na magkaroon ng kahulugan ng data sa pamamagitan ng pagbuo ng mga angkop na pamamaraan o pamamaraan. Ang prosesong ito ay tumatalakay sa pagmamapa ng mababang antas ng data sa iba pang mga anyo na mas compact, abstract at kapaki-pakinabang. Ito ay nakakamit sa pamamagitan ng paggawa ng maiikling ulat, pagmomodelo sa proseso ng pagbuo ng data at pagbuo ng mga predictive na modelo na maaaring mahulaan ang mga hinaharap na kaso. Dahil sa exponential growth ng data, lalo na sa mga lugar tulad ng negosyo, ang KDD ay naging isang napakahalagang proseso para i-convert ang malaking kayamanan ng data na ito sa business intelligence, dahil ang manu-manong pagkuha ng mga pattern ay naging tila imposible sa nakalipas na ilang dekada. Halimbawa, ito ay kasalukuyang ginagamit para sa iba't ibang mga aplikasyon tulad ng pagsusuri sa social network, pagtuklas ng pandaraya, agham, pamumuhunan, pagmamanupaktura, telekomunikasyon, paglilinis ng data, palakasan, pagkuha ng impormasyon at higit sa lahat para sa marketing. Ang KDD ay karaniwang ginagamit upang sagutin ang mga tanong tulad ng ano ang mga pangunahing produkto na maaaring makatulong upang makakuha ng mataas na kita sa susunod na taon sa Wal-Mart?. Ang prosesong ito ay may ilang hakbang. Nagsisimula ito sa pagbuo ng pag-unawa sa domain ng application at sa layunin at pagkatapos ay paggawa ng target na dataset. Sinusundan ito ng paglilinis, preprocessing, pagbabawas at projection ng data. Ang susunod na hakbang ay ang paggamit ng Data Mining (ipinaliwanag sa ibaba) upang matukoy ang pattern. Panghuli, pinagsasama-sama ang natuklasang kaalaman sa pamamagitan ng paggunita at/o pagbibigay-kahulugan.

Ano ang Data Mining?

Tulad ng nabanggit sa itaas, ang Data Mining ay isang hakbang lamang sa loob ng pangkalahatang proseso ng KDD. Mayroong dalawang pangunahing layunin ng Data Mining gaya ng tinukoy ng layunin ng application, at ang mga ito ay ang pag-verify o pagtuklas. Ang pag-verify ay pag-verify sa hypothesis ng user tungkol sa data, habang ang pagtuklas ay awtomatikong nakakahanap ng mga kawili-wiling pattern. Mayroong apat na pangunahing gawain sa data mining: clustering, classification, regression, at association (summarization). Ang clustering ay pagtukoy ng mga katulad na grupo mula sa hindi nakaayos na data. Ang pag-uuri ay mga panuntunan sa pag-aaral na maaaring ilapat sa bagong data. Ang regression ay paghahanap ng mga function na may kaunting error sa data ng modelo. At ang asosasyon ay naghahanap ng mga relasyon sa pagitan ng mga variable. Pagkatapos, kailangang piliin ang partikular na algorithm ng data mining. Depende sa layunin, maaaring pumili ng iba't ibang algorithm tulad ng linear regression, logistic regression, decision tree at Naïve Bayes. Pagkatapos ay hahanapin ang mga pattern ng interes sa isa o higit pang representasyong anyo. Panghuli, sinusuri ang mga modelo gamit ang predictive accuracy o understandability.

Ano ang pagkakaiba ng KDD at Data mining?

Bagaman, ang dalawang terminong KDD at Data Mining ay madalas na ginagamit nang magkasabay, tumutukoy ang mga ito sa dalawang magkaugnay ngunit bahagyang magkaibang konsepto. Ang KDD ay ang pangkalahatang proseso ng pagkuha ng kaalaman mula sa data habang ang Data Mining ay isang hakbang sa loob ng proseso ng KDD, na tumatalakay sa pagtukoy ng mga pattern sa data. Sa madaling salita, ang Data Mining ay ang aplikasyon lamang ng isang partikular na algorithm batay sa pangkalahatang layunin ng proseso ng KDD.

Inirerekumendang: