DBMS vs Data Mining
Ang A DBMS (Database Management System) ay isang kumpletong system na ginagamit para sa pamamahala ng mga digital database na nagbibigay-daan sa pag-imbak ng nilalaman ng database, paglikha/pagpapanatili ng data, paghahanap at iba pang mga functionality. Sa kabilang banda, ang Data Mining ay isang larangan sa computer science, na tumatalakay sa pagkuha ng dati nang hindi alam at kawili-wiling impormasyon mula sa raw data. Karaniwan, ang data na ginamit bilang input para sa proseso ng Data mining ay iniimbak sa mga database. Gumagamit ng Data Mining ang mga user na may hilig sa mga istatistika. Gumagamit sila ng mga istatistikal na modelo upang maghanap ng mga nakatagong pattern sa data. Interesado ang mga data miners sa paghahanap ng mga kapaki-pakinabang na ugnayan sa pagitan ng iba't ibang elemento ng data, na sa huli ay kumikita para sa mga negosyo.
DBMS
Ang DBMS, kung minsan ay tinatawag na database manager, ay isang koleksyon ng mga computer program na nakatuon para sa pamamahala (ibig sabihin, organisasyon, storage at retrieval) ng lahat ng database na naka-install sa isang system (i.e. hard drive o network). Mayroong iba't ibang uri ng Database Management System na umiiral sa mundo, at ang ilan sa mga ito ay idinisenyo para sa wastong pamamahala ng mga database na na-configure para sa mga partikular na layunin. Ang pinakasikat na komersyal na Database Management System ay Oracle, DB2 at Microsoft Access. Ang lahat ng mga produktong ito ay nagbibigay ng paraan ng paglalaan ng iba't ibang antas ng mga pribilehiyo para sa iba't ibang mga gumagamit, na ginagawang posible para sa isang DBMS na kontrolado nang sentral ng isang administrator o mailaan sa maraming iba't ibang tao. Mayroong apat na mahahalagang elemento sa anumang Database Management System. Ang mga ito ay ang wika ng pagmomodelo, mga istruktura ng data, wika ng query at mekanismo para sa mga transaksyon. Ang wika ng pagmomodelo ay tumutukoy sa wika ng bawat database na naka-host sa DBMS. Sa kasalukuyan, ang ilang mga tanyag na diskarte tulad ng hierarchal, network, relational at object ay nasa pagsasanay. Nakakatulong ang mga istruktura ng data na ayusin ang data gaya ng mga indibidwal na tala, file, field at ang mga kahulugan at bagay ng mga ito gaya ng visual media. Pinapanatili ng wika ng query ng data ang seguridad ng database sa pamamagitan ng pagsubaybay sa data sa pag-log in, mga karapatan sa pag-access sa iba't ibang user, at mga protocol upang magdagdag ng data sa system. Ang SQL ay isang sikat na query language na ginagamit sa Relational Database Management Systems. Sa wakas, ang mekanismo na nagbibigay-daan para sa mga transaksyon ay nakakatulong sa concurrency at multiplicity. Sisiguraduhin ng mekanismong iyon na ang parehong talaan ay hindi mababago ng maraming user nang sabay-sabay, kaya pinapanatili ang integridad ng data sa taktika. Bukod pa rito, nagbibigay din ang DBMS ng backup at iba pang mga pasilidad.
Data Mining
Ang Data mining ay kilala rin bilang Knowledge Discovery in Data (KDD). Tulad ng nabanggit sa itaas, ito ay isang felid ng computer science, na tumatalakay sa pagkuha ng dati nang hindi alam at kawili-wiling impormasyon mula sa raw data. Dahil sa exponential growth ng data, lalo na sa mga lugar tulad ng negosyo, ang data mining ay naging napakahalagang tool para i-convert ang malaking kayamanan ng data na ito sa business intelligence, dahil ang manu-manong pagkuha ng mga pattern ay naging tila imposible sa nakalipas na ilang dekada. Halimbawa, ito ay kasalukuyang ginagamit para sa iba't ibang mga aplikasyon tulad ng pagsusuri sa social network, pagtuklas ng pandaraya at marketing. Karaniwang tinatalakay ng data mining ang sumusunod na apat na gawain: clustering, classification, regression, at association. Ang clustering ay pagtukoy ng mga katulad na grupo mula sa hindi nakaayos na data. Ang pag-uuri ay mga panuntunan sa pag-aaral na maaaring ilapat sa bagong data at karaniwang kasama ang mga sumusunod na hakbang: paunang pagproseso ng data, pagdidisenyo ng pagmomodelo, pag-aaral/pagpili ng feature at Pagsusuri/pagpapatunay. Ang regression ay paghahanap ng mga function na may kaunting error sa data ng modelo. At ang asosasyon ay naghahanap ng mga relasyon sa pagitan ng mga variable. Karaniwang ginagamit ang data mining upang sagutin ang mga tanong tulad ng ano ang mga pangunahing produkto na maaaring makatulong upang makakuha ng mataas na kita sa susunod na taon sa Wal-Mart?
Ano ang pagkakaiba ng DBMS at Data mining?
Ang DBMS ay isang ganap na sistema para sa pabahay at pamamahala ng isang set ng mga digital database. Gayunpaman ang Data Mining ay isang pamamaraan o isang konsepto sa computer science, na tumatalakay sa pagkuha ng kapaki-pakinabang at dati nang hindi kilalang impormasyon mula sa raw data. Kadalasan, ang mga hilaw na data na ito ay naka-imbak sa napakalaking database. Samakatuwid, ginagamit ng mga Data miners ang mga umiiral na functionality ng DBMS upang pangasiwaan, pamahalaan at maging preprocess ang raw data bago at sa panahon ng proseso ng Data mining. Gayunpaman, ang isang DBMS system lamang ay hindi magagamit upang pag-aralan ang data. Ngunit, ang ilang DBMS sa kasalukuyan ay may mga inbuilt na tool o kakayahan sa pagsusuri ng data.