Pagkakaiba sa Pagitan ng Pinangangasiwaang Machine Learning at Unsupervised Machine Learning

Talaan ng mga Nilalaman:

Pagkakaiba sa Pagitan ng Pinangangasiwaang Machine Learning at Unsupervised Machine Learning
Pagkakaiba sa Pagitan ng Pinangangasiwaang Machine Learning at Unsupervised Machine Learning

Video: Pagkakaiba sa Pagitan ng Pinangangasiwaang Machine Learning at Unsupervised Machine Learning

Video: Pagkakaiba sa Pagitan ng Pinangangasiwaang Machine Learning at Unsupervised Machine Learning
Video: How AI Could Solve Our Renewable Energy Problem 2024, Nobyembre
Anonim

Mahalagang Pagkakaiba – Pinangangasiwaan kumpara sa Hindi Pinangangasiwaang Machine Learning

Supervised learning at unsupervised learning ay dalawang pangunahing konsepto ng machine learning. Ang Supervised Learning ay isang Machine Learning na gawain ng pag-aaral ng isang function na nagmamapa ng input sa isang output batay sa mga halimbawang pares ng input-output. Ang Unsupervised Learning ay ang Machine Learning na gawain ng paghihinuha ng isang function upang ilarawan ang nakatagong istraktura mula sa walang label na data. Ang pangunahing pagkakaiba sa pagitan ng pinangangasiwaan at hindi pinangangasiwaang machine learning ay ang pinangangasiwaang pag-aaral ay gumagamit ng may label na data habang ang hindi pinangangasiwaang pag-aaral ay gumagamit ng walang label na data.

Ang Machine Learning ay isang larangan sa Computer Science na nagbibigay ng kakayahan para sa isang computer system na matuto mula sa data nang hindi tahasang nakaprograma. Pinapayagan nitong pag-aralan ang data at hulaan ang mga pattern sa loob nito. Mayroong maraming mga aplikasyon ng machine learning. Ang ilan sa mga ito ay pagkilala sa mukha, pagkilala sa kilos at pagkilala sa pagsasalita. Mayroong iba't ibang mga algorithm na nauugnay sa machine learning. Ilan sa mga ito ay regression, classification at clustering. Ang pinakakaraniwang mga programming language para sa pagbuo ng machine learning based na mga application ay R at Python. Maaari ding gamitin ang iba pang mga wika gaya ng Java, C++ at Matlab.

Ano ang Pinangangasiwaang Pag-aaral?

Sa mga machine learning based system, gumagana ang modelo ayon sa isang algorithm. Sa pinangangasiwaang pag-aaral, ang modelo ay pinangangasiwaan. Una, kinakailangan na sanayin ang modelo. Gamit ang nakuhang kaalaman, maaari nitong hulaan ang mga sagot para sa mga hinaharap na pagkakataon. Ang modelo ay sinanay gamit ang isang may label na dataset. Kapag ang isang wala sa sample na data ay ibinigay sa system, maaari nitong hulaan ang resulta. Ang sumusunod ay isang maliit na extract mula sa sikat na IRIS dataset.

Pagkakaiba sa pagitan ng Supervised at Unsupervised Learning_Figure 02
Pagkakaiba sa pagitan ng Supervised at Unsupervised Learning_Figure 02

Ayon sa talahanayan sa itaas, ang Sepal length, Sepal width, Patel length, Patel width at Species ay tinatawag na mga attribute. Ang mga hanay ay kilala bilang mga tampok. May data ang isang row para sa lahat ng attribute. Samakatuwid, ang isang hilera ay tinatawag na isang pagmamasid. Ang data ay maaaring numerical o pangkategorya. Ang modelo ay binibigyan ng mga obserbasyon na may katumbas na pangalan ng species bilang input. Kapag nagbigay ng bagong obserbasyon, dapat hulaan ng modelo ang uri ng species kung saan ito nabibilang.

Sa pinangangasiwaang pag-aaral, may mga algorithm para sa pag-uuri at regression. Ang pag-uuri ay ang proseso ng pag-uuri ng may label na data. Ang modelo ay lumikha ng mga hangganan na naghihiwalay sa mga kategorya ng data. Kapag ang bagong data ay ibinigay sa modelo, maaari itong ikategorya batay sa kung saan umiiral ang punto. Ang K-Nearest Neighbors (KNN) ay isang modelo ng pag-uuri. Depende sa halaga ng k, napagpasyahan ang kategorya. Halimbawa, kapag ang k ay 5, kung ang isang partikular na data point ay malapit sa walong data point sa kategorya A at anim na data point sa kategorya B, ang data point ay mauuri bilang A.

Ang regression ay ang proseso ng paghula sa takbo ng nakaraang data upang mahulaan ang kinalabasan ng bagong data. Sa regression, ang output ay maaaring binubuo ng isa o higit pang tuluy-tuloy na variable. Ginagawa ang hula gamit ang isang linya na sumasaklaw sa karamihan ng mga punto ng data. Ang pinakasimpleng modelo ng regression ay isang linear regression. Ito ay mabilis at hindi nangangailangan ng mga parameter ng pag-tune tulad ng sa KNN. Kung nagpapakita ng parabolic trend ang data, hindi angkop ang linear regression model.

Pagkakaiba sa pagitan ng Supervised at Unsupervised Learning
Pagkakaiba sa pagitan ng Supervised at Unsupervised Learning

Iyan ang ilang halimbawa ng mga algorithm ng pinangangasiwaang pag-aaral. Sa pangkalahatan, ang mga resultang nabuo mula sa mga pinangangasiwaang pamamaraan ng pag-aaral ay mas tumpak at maaasahan dahil ang input data ay kilala at may label. Samakatuwid, ang mga nakatagong pattern lang ang dapat suriin ng makina.

Ano ang Unsupervised Learning?

Sa unsupervised learning, hindi pinangangasiwaan ang modelo. Ang modelo ay gumagana sa sarili nitong, upang mahulaan ang mga kinalabasan. Gumagamit ito ng mga algorithm sa pag-aaral ng machine para magkaroon ng konklusyon sa walang label na data. Sa pangkalahatan, ang hindi sinusubaybayang mga algorithm sa pag-aaral ay mas mahirap kaysa sa mga pinangangasiwaang algorithm ng pag-aaral dahil kakaunti ang impormasyon. Ang clustering ay isang uri ng unsupervised learning. Maaari itong magamit upang pangkatin ang hindi kilalang data gamit ang mga algorithm. Ang k-mean at density-based clustering ay dalawang clustering algorithm.

k-mean algorithm, random na naglalagay ng k centroid para sa bawat cluster. Pagkatapos ang bawat punto ng data ay itinalaga sa pinakamalapit na sentroid. Ang distansyang Euclidean ay ginagamit upang kalkulahin ang distansya mula sa punto ng data hanggang sa sentroid. Ang mga punto ng data ay inuri sa mga pangkat. Ang mga posisyon para sa k centroids ay kinakalkula muli. Ang bagong posisyon ng sentroid ay tinutukoy ng mean ng lahat ng puntos sa pangkat. Muli, ang bawat punto ng data ay itinalaga sa pinakamalapit na sentroid. Umuulit ang prosesong ito hanggang sa hindi na nagbabago ang mga sentroid. Ang k-mean ay isang mabilis na clustering algorithm, ngunit walang tinukoy na pagsisimula ng mga clustering point. Gayundin, mayroong mataas na variation ng clustering models batay sa initialization ng mga cluster point.

Ang isa pang clustering algorithm ay Density based clustering. Ito ay kilala rin bilang Density Based Spatial Clustering Applications na may ingay. Gumagana ito sa pamamagitan ng pagtukoy sa isang kumpol bilang pinakamataas na hanay ng mga nakakonektang punto ng density. Ang mga ito ay dalawang parameter na ginagamit para sa density based clustering. Ang mga ito ay Ɛ (epsilon) at pinakamababang puntos. Ang Ɛ ay ang pinakamataas na radius ng kapitbahayan. Ang pinakamababang puntos ay ang pinakamababang bilang ng mga puntos sa Ɛ kapitbahayan upang tukuyin ang isang kumpol. Iyan ang ilang halimbawa ng clustering na nahuhulog sa hindi pinangangasiwaang pag-aaral.

Sa pangkalahatan, ang mga resultang nabuo mula sa hindi sinusubaybayang mga algorithm sa pag-aaral ay hindi masyadong tumpak at maaasahan dahil kailangang tukuyin at lagyan ng label ng machine ang input data bago tukuyin ang mga nakatagong pattern at function.

Ano ang Pagkakatulad sa Pagitan ng Pinangangasiwaang Machine Learning?

Parehong Supervised at Unsupervised Learning ay mga uri ng Machine Learning

Ano ang Pagkakaiba sa pagitan ng Pinangangasiwaang Machine Learning at Unsupervised Machine Learning?

Supervised vs Unsupervised Machine Learning

Ang Supervised Learning ay ang Machine Learning na gawain ng pag-aaral ng isang function na nagmamapa ng input sa isang output batay sa mga halimbawang pares ng input-output. Ang Unsupervised Learning ay ang Machine Learning na gawain ng paghihinuha ng isang function upang ilarawan ang nakatagong istraktura mula sa walang label na data.
Pangunahing Functionality
Sa pinangangasiwaang pag-aaral, hinuhulaan ng modelo ang resulta batay sa may label na data ng input. Sa unsupervised learning, hinuhulaan ng modelo ang resulta nang walang label na data sa pamamagitan ng pagtukoy sa mga pattern sa sarili nitong.
Katumpakan ng mga Resulta
Ang mga resultang nabuo mula sa mga pinangangasiwaang paraan ng pag-aaral ay mas tumpak at maaasahan. Ang mga resultang nabuo mula sa mga hindi pinangangasiwaang paraan ng pag-aaral ay hindi masyadong tumpak at maaasahan.
Pangunahing Algorithm
May mga algorithm para sa regression at klasipikasyon sa pinangangasiwaang pag-aaral. May mga algorithm para sa clustering sa unsupervised learning.

Buod – Pinangangasiwaan vs Unsupervised Machine Learning

Ang Supervised Learning at Unsupervised Learning ay dalawang uri ng Machine Learning. Ang Supervised Learning ay ang Machine Learning na gawain ng pag-aaral ng isang function na nagmamapa ng input sa isang output batay sa mga halimbawang pares ng input-output. Ang Unsupervised Learning ay ang Machine Learning na gawain ng paghihinuha ng isang function upang ilarawan ang nakatagong istraktura mula sa walang label na data. Ang pagkakaiba sa pagitan ng pinangangasiwaan at hindi pinangangasiwaang machine learning ay ang pinangangasiwaang pag-aaral ay gumagamit ng may label na data habang ang unsupervised leaning ay gumagamit ng walang label na data.

Inirerekumendang: