Pagkakaiba sa Pagitan ng Data mining at Data Warehousing

Pagkakaiba sa Pagitan ng Data mining at Data Warehousing
Pagkakaiba sa Pagitan ng Data mining at Data Warehousing

Video: Pagkakaiba sa Pagitan ng Data mining at Data Warehousing

Video: Pagkakaiba sa Pagitan ng Data mining at Data Warehousing
Video: You won't Believe what Happened after Blinken's China Visit. 2024, Nobyembre
Anonim

Data mining vs Data Warehousing

Ang Data Mining at Data Warehousing ay parehong napakalakas at sikat na mga diskarte para sa pagsusuri ng data. Gumagamit ng Data Mining ang mga user na may hilig sa mga istatistika. Gumagamit sila ng mga istatistikal na modelo upang maghanap ng mga nakatagong pattern sa data. Interesado ang mga data miners sa paghahanap ng mga kapaki-pakinabang na ugnayan sa pagitan ng iba't ibang elemento ng data, na sa huli ay kumikita para sa mga negosyo. Ngunit sa kabilang banda, ang mga eksperto sa data na maaaring direktang magsuri ng mga dimensyon ng negosyo ay may posibilidad na gumamit ng mga Data warehouse.

Ang Data mining ay kilala rin bilang Knowledge Discovery in data (KDD). Tulad ng nabanggit sa itaas, ito ay isang larangan ng computer science, na tumatalakay sa pagkuha ng dati nang hindi alam at kawili-wiling impormasyon mula sa raw data. Dahil sa exponential growth ng data, lalo na sa mga lugar tulad ng negosyo, ang data mining ay naging napakahalagang tool para i-convert ang malaking kayamanan ng data na ito sa business intelligence, dahil ang manu-manong pagkuha ng mga pattern ay naging tila imposible sa nakalipas na ilang dekada. Halimbawa, ito ay kasalukuyang ginagamit para sa iba't ibang mga aplikasyon tulad ng pagsusuri sa social network, pagtuklas ng pandaraya at marketing. Karaniwang tinatalakay ng data mining ang sumusunod na apat na gawain: clustering, classification, regression, at association. Ang clustering ay pagtukoy ng mga katulad na grupo mula sa hindi nakaayos na data. Ang pag-uuri ay mga panuntunan sa pag-aaral na maaaring ilapat sa bagong data at karaniwang kasama ang mga sumusunod na hakbang: paunang pagproseso ng data, pagdidisenyo ng pagmomodelo, pag-aaral/pagpili ng feature at Pagsusuri/pagpapatunay. Ang regression ay paghahanap ng mga function na may kaunting error sa data ng modelo. At ang asosasyon ay naghahanap ng mga relasyon sa pagitan ng mga variable. Karaniwang ginagamit ang data mining upang sagutin ang mga tanong tulad ng ano ang mga pangunahing produkto na maaaring makatulong upang makakuha ng mataas na kita sa susunod na taon sa Wal-Mart?

Tulad ng nabanggit sa itaas, ang Data warehousing ay ginagamit din para sa pagsusuri ng data, ngunit ng iba't ibang hanay ng mga user at isang bahagyang naiibang layunin sa isip. Halimbawa, pagdating sa sektor ng tingi, ang mga gumagamit ng Data warehousing ay mas nababahala sa kung anong mga uri ng pagbili ang sikat sa mga customer, kaya ang mga resulta ng pagsusuri ay makakatulong sa customer sa pamamagitan ng pagpapabuti ng karanasan ng customer. Ngunit ang mga Data miners ay unang hinuhulaan ang isang hypothesis tulad ng kung aling mga customer ang bumili ng isang partikular na uri ng produkto at pag-aralan ang data upang subukan ang hypothesis. Ang pag-iimbak ng data ay maaaring isagawa ng isang pangunahing retailer na unang nag-stock sa mga tindahan nito na may parehong laki ng mga produkto upang malaman sa ibang pagkakataon na ang mga tindahan sa New York ay nagbebenta ng mas maliit na laki ng imbentaryo nang mas mabilis kaysa sa mga tindahan sa Chicago. Kaya, sa pamamagitan ng pagtingin sa resultang ito, maaaring i-stock ng retailer ang tindahan sa New York ng mas maliliit na laki kumpara sa mga tindahan sa Chicago.

Kaya, tulad ng malinaw mong nakikita, ang dalawang uri ng pagsusuri na ito ay mukhang magkapareho sa mata. Parehong nag-aalala tungkol sa pagtaas ng kita batay sa makasaysayang data. Ngunit siyempre, may mga pangunahing pagkakaiba. Sa madaling salita, ang Data Mining at Data Warehousing ay nakatuon sa pagbibigay ng iba't ibang uri ng analytics, ngunit tiyak para sa iba't ibang uri ng mga user. Sa madaling salita, naghahanap ang Data Mining ng mga ugnayan, mga patter upang suportahan ang isang istatistikal na hypothesis. Ngunit, ang Data Warehousing ay sumasagot sa isang medyo mas malawak na tanong at hinihiwa-hiwalay nito ang data mula doon pasulong upang makilala ang mga paraan ng pagpapabuti sa hinaharap.

Inirerekumendang: