Pagkakaiba sa Pagitan ng Data Mining at OLAP

Pagkakaiba sa Pagitan ng Data Mining at OLAP
Pagkakaiba sa Pagitan ng Data Mining at OLAP

Video: Pagkakaiba sa Pagitan ng Data Mining at OLAP

Video: Pagkakaiba sa Pagitan ng Data Mining at OLAP
Video: The beautiful woman went on a blind date instead of a friend and met her own president! 2024, Nobyembre
Anonim

Data Mining vs OLAP

Ang parehong data mining at OLAP ay dalawa sa mga karaniwang teknolohiya ng Business Intelligence (BI). Ang business intelligence ay tumutukoy sa mga pamamaraang nakabatay sa computer para sa pagtukoy at pagkuha ng kapaki-pakinabang na impormasyon mula sa data ng negosyo. Ang data mining ay ang larangan ng computer science na tumatalakay sa pagkuha ng mga kawili-wiling pattern mula sa malalaking set ng data. Pinagsasama nito ang maraming pamamaraan mula sa artificial intelligence, statistics at database management. Ang OLAP (online analytical processing) gaya ng iminumungkahi ng pangalan ay isang compilation ng mga paraan upang mag-query ng mga multi-dimensional na database.

Ang Data mining ay kilala rin bilang Knowledge Discovery in data (KDD). Tulad ng nabanggit sa itaas, ito ay isang larangan ng computer science, na tumatalakay sa pagkuha ng dati nang hindi alam at kawili-wiling impormasyon mula sa raw data. Dahil sa exponential growth ng data, lalo na sa mga lugar tulad ng negosyo, ang data mining ay naging napakahalagang tool para i-convert ang malaking kayamanan ng data na ito sa business intelligence, dahil ang manu-manong pagkuha ng mga pattern ay naging tila imposible sa nakalipas na ilang dekada. Halimbawa, ito ay kasalukuyang ginagamit para sa iba't ibang mga aplikasyon tulad ng pagsusuri sa social network, pagtuklas ng pandaraya at marketing. Karaniwang tinatalakay ng data mining ang sumusunod na apat na gawain: clustering, classification, regression, at association. Ang clustering ay pagtukoy ng mga katulad na grupo mula sa hindi nakaayos na data. Ang pag-uuri ay mga panuntunan sa pag-aaral na maaaring ilapat sa bagong data at kadalasang kinabibilangan ng mga sumusunod na hakbang: paunang pagproseso ng data, pagdidisenyo ng pagmomodelo, pag-aaral/pagpili ng feature at pagsusuri/pagpapatunay. Ang regression ay paghahanap ng mga function na may kaunting error sa data ng modelo. At ang asosasyon ay naghahanap ng mga relasyon sa pagitan ng mga variable. Karaniwang ginagamit ang data mining upang sagutin ang mga tanong tulad ng kung ano ang mga pangunahing produkto na maaaring makatulong upang makakuha ng mataas na kita sa susunod na taon sa Wal-Mart.

Ang OLAP ay isang klase ng mga system, na nagbibigay ng mga sagot sa mga multi-dimensional na query. Karaniwang ginagamit ang OLAP para sa marketing, pagbabadyet, pagtataya at mga katulad na aplikasyon. Hindi sinasabi na ang mga database na ginamit para sa OLAP ay na-configure para sa kumplikado at ad-hoc na mga query na may mabilis na pagganap sa isip. Karaniwan ang isang matrix ay ginagamit upang ipakita ang output ng isang OLAP. Ang mga row at column ay nabuo sa pamamagitan ng mga sukat ng query. Madalas silang gumagamit ng mga paraan ng pagsasama-sama sa maraming talahanayan upang makakuha ng mga buod. Halimbawa, maaari itong magamit upang malaman ang tungkol sa mga benta ng taong ito sa Wal-Mart kumpara noong nakaraang taon? Ano ang hula sa mga benta sa susunod na quarter? Ano ang masasabi tungkol sa trend sa pamamagitan ng pagtingin sa porsyento ng pagbabago?

Bagama't halatang magkatulad ang Data mining at OLAP dahil nagpapatakbo sila sa data para makakuha ng intelligence, ang pangunahing pagkakaiba ay nagmumula sa kung paano gumagana ang mga ito sa data. Ang mga tool ng OLAP ay nagbibigay ng multidimensional data analysis at nagbibigay sila ng mga buod ng data ngunit sa kaibahan, ang data mining ay nakatuon sa mga ratio, pattern at impluwensya sa set ng data. Iyon ay isang pakikitungo sa OLAP sa pagsasama-sama, na bumubuhos sa pagpapatakbo ng data sa pamamagitan ng "dagdag" ngunit ang data mining ay tumutugma sa "dibisyon". Ang iba pang kapansin-pansing pagkakaiba ay habang ang mga tool sa pagmimina ng data ay nagmomodelo ng data at nagbabalik ng mga naaaksyong panuntunan, magsasagawa ang OLAP ng mga diskarte sa paghahambing at contrast sa dimensyon ng negosyo nang real time.

Inirerekumendang: