Kaj je strojno učenje in kako deluje
Strojno učenje je razburljiva veja umetne inteligence, ki je vsepovsod okoli nas. Strojno učenje izkorišča moč podatkov na nove načine, na primer tako, da vam Facebook predlaga članke v vašem feedu. Ta neverjetna tehnologija pomaga računalniškim sistemom, da se učijo in izboljšujejo na podlagi izkušenj z razvojem računalniških programov, ki lahko samodejno dostopajo do podatkov in izvajajo naloge prek napovedi in zaznavanja.
Ko v stroj vnesete več podatkov, to pomaga algoritmom pri učenju računalnika in tako izboljša dostavljene rezultate. Ko pozovete Alexo, naj predvaja vašo najljubšo glasbeno postajo na Amazon Echo, bo prešla na postajo, ki ste jo najpogosteje predvajali. Svojo izkušnjo poslušanja lahko še izboljšate in izpopolnite tako, da Alexi poveste, naj preskoči skladbe, prilagodi glasnost in še veliko drugih možnih ukazov. Vse to omogočata strojno učenje in hiter napredek umetne inteligence.
Začnimo z odgovorom na vprašanje: Kaj je strojno učenje?
Kaj natančno je strojno učenje?
Za začetek je strojno učenje osrednje podpodročje umetne inteligence (UI). Aplikacije za strojno učenje se učijo iz izkušenj (ali natančneje iz podatkov), kot to počnejo ljudje, brez neposrednega programiranja. Ko so te aplikacije izpostavljene novim podatkom, se same učijo, rastejo, spreminjajo in razvijajo. Z drugimi besedami, strojno učenje vključuje računalnike, ki najdejo pomembne informacije, ne da bi jim bilo treba povedati, kje naj jih iščejo. Namesto tega to storijo z uporabo algoritmov, ki se učijo iz podatkov v ponavljajočem se procesu.
Koncept strojnega učenja je znan že dolgo (spomnite se na primer na stroj Enigma iz druge svetovne vojne). Vendar je zamisel o avtomatizaciji uporabe zapletenih matematičnih izračunov za velike količine podatkov stara šele nekaj let, čeprav zdaj dobiva vse večji zagon.
Na visoki ravni je strojno učenje sposobnost samostojnega prilagajanja novim podatkom s pomočjo iteracij. Aplikacije se učijo iz prejšnjih izračunov in transakcij ter uporabljajo “prepoznavanje vzorcev” za ustvarjanje zanesljivih in utemeljenih rezultatov.
Kako deluje strojno učenje?
Strojno učenje je nedvomno ena najbolj vznemirljivih podskupin umetne inteligence. Dokonča nalogo učenja iz podatkov z določenimi vhodnimi podatki za stroj. Pomembno je, da razumemo, zakaj strojno učenje deluje in s tem, kako ga je mogoče uporabiti v prihodnosti.
Postopek strojnega učenja se začne z vnosom podatkov za učenje v izbrani algoritem. Podatki za usposabljanje so znani ali neznani podatki za razvoj končnega algoritma strojnega učenja. Vrsta vnesenih podatkov za usposabljanje vpliva na algoritem in ta koncept bo v nadaljevanju obravnavan v trenutku.
V algoritem strojnega učenja se vnesejo novi vhodni podatki, da se preveri, ali algoritem deluje pravilno. Napovedi in rezultati se nato medsebojno preverijo.
Če se napoved in rezultati ne ujemajo, se algoritem večkrat ponovno usposobi, dokler podatkovni znanstvenik ne dobi želenega rezultata. Tako se algoritem strojnega učenja nenehno sam uči in pripravlja optimalen odgovor, sčasoma pa postopoma povečuje natančnost.
Katere so vrste strojnega učenja?
Strojno učenje je kompleksno, zato je razdeljeno na dve osnovni področji, nadzorovano učenje in nenadzorovano učenje. Vsako ima poseben namen in delovanje, daje rezultate in uporablja različne oblike podatkov. Približno 70 odstotkov strojnega učenja predstavlja nadzorovano učenje, medtem ko nenadzorovano učenje predstavlja od 10 do 20 odstotkov. Preostali del predstavlja učenje z ojačitvijo.
Nadzorovano učenje
Pri nadzorovanem učenju za učne podatke uporabljamo znane ali označene podatke. Ker so podatki znani, je učenje zato nadzorovano, tj. usmerjeno v uspešno izvedbo. Vhodni podatki gredo skozi algoritem strojnega učenja in se uporabijo za usposabljanje modela. Ko je model usposobljen na podlagi znanih podatkov, lahko v model uporabite neznane podatke in dobite nov odziv.
V tem primeru model poskuša ugotoviti, ali je podatek jabolko ali drugo sadje. Ko je model dobro usposobljen, bo ugotovil, da je podatek jabolko, in podal želeni odziv.
Nenadzorovano učenje
Pri nenadzorovanem učenju so učni podatki neznani in neoznačeni, kar pomeni, da nihče prej ni obravnaval teh podatkov. Brez vidika znanih podatkov vhodnih podatkov ni mogoče usmerjati algoritma, od koder izvira izraz nenadzorovano. Ti podatki se posredujejo algoritmu strojnega učenja in se uporabijo za usposabljanje modela. Usposobljeni model poskuša poiskati vzorec in dati želeni odziv. V tem primeru je pogosto tako, kot da bi algoritem poskušal razbiti kodo kot stroj Enigma, vendar brez neposrednega sodelovanja človeškega uma, temveč s strojem.
V tem primeru so neznani podatki sestavljeni iz jabolk in hrušk, ki so si med seboj podobni. Usposobljeni model jih poskuša združiti tako, da dobimo enake stvari v podobnih skupinah.
Učenje z okrepitvijo
Podobno kot pri tradicionalnih vrstah analize podatkov tudi tu algoritem odkriva podatke s postopkom poskusov in napak, nato pa se odloči, katero dejanje prinaša večje nagrade. Učenje z okrepitvijo sestavljajo tri glavne komponente – agent, okolje in dejanja. Agent je učenec ali odločevalec, okolje vključuje vse, s čimer je agent v interakciji, dejanja pa so tisto, kar agent počne.
Učenje z okrepitvijo se zgodi, ko agent izbere dejanja, ki povečajo pričakovano nagrado v določenem času. To je najlažje doseči, če agent deluje v okviru dobre politike.
Zakaj je strojno učenje pomembno?
Da bi bolje odgovorili na vprašanje, kaj je strojno učenje, in razumeli uporabo strojnega učenja, upoštevajte nekaj aplikacij strojnega učenja. Samovozeči Googlov avtomobil, odkrivanje kibernetskih goljufij ter spletni priporočilni sistemi družb Facebook, Netflix in Amazon. Stroji omogočajo vse te stvari, saj filtrirajo uporabne informacije in jih na podlagi vzorcev sestavljajo skupaj, da dobijo natančne rezultate.
Zaradi hitrega razvoja na področju strojnega učenja so se posledično povečali primeri uporabe, zahteve in sam pomen strojnega učenja v sodobnem življenju. V zadnjih nekaj letih je postala tudi beseda Big Data (veliki podatki). To je deloma posledica večje izpopolnjenosti strojnega učenja, ki omogoča analizo velikih količin velikih podatkov. Strojno učenje je spremenilo tudi način pridobivanja in interpretacije podatkov z avtomatizacijo splošnih metod/algoritmov in s tem nadomestilo tradicionalne statistične tehnike.
Zdaj, ko veste, kaj je strojno učenje, kakšne so njegove vrste in kakšen je njegov pomen, preidimo na uporabo strojnega učenja.
Glavne uporabe strojnega učenja
Tipični rezultati uporabe strojnega učenja običajno vključujejo rezultate spletnega iskanja, oglase v realnem času na spletnih straneh in mobilnih napravah, filtriranje neželene elektronske pošte, odkrivanje vdorov v omrežja ter prepoznavanje vzorcev in slik. Vse to so stranski proizvodi uporabe strojnega učenja za analizo velikih količin podatkov.
Tradicionalno je analiza podatkov temeljila na poskusih in napakah, kar je bil pristop, ki je zaradi naraščanja velikih, heterogenih podatkovnih nizov postajal vse manj praktičen. Strojno učenje zagotavlja pametne alternative za analizo podatkov velikega obsega. Strojno učenje lahko z razvojem hitrih in učinkovitih algoritmov ter podatkovno zasnovanih modelov za obdelavo podatkov v realnem času zagotovi natančne rezultate in analize.
Kako se odločiti, kateri algoritem strojnega učenja uporabiti?
Na voljo je na desetine različnih algoritmov, vendar ni najboljše izbire ali takšnega, ki bi ustrezal vsem razmeram. V številnih primerih se morate zateči k poskusom in napakam. Vendar pa lahko postavite nekaj vprašanj, ki vam lahko pomagajo zožiti izbiro.
- Kakšna je velikost podatkov, s katerimi boste delali?
- Kakšna je vrsta podatkov, s katerimi boste delali?
- Kakšne vrste vpogledov iščete v podatkih?
- Kako boste ta spoznanja uporabili?
Predpogoji za strojno učenje
Za tiste, ki jih zanima več o tem, kaj je strojno učenje, je treba izpolniti nekaj zahtev, da bi bili uspešni pri ukvarjanju s tem področjem. Te zahteve vključujejo:
- osnovno znanje programskih jezikov, kot so Python, R, Java, JavaScript itd.
- vmesno znanje statistike in verjetnosti.
- osnovno znanje linearne algebre. V modelu linearne regresije se skozi vse podatkovne točke potegne črta, ki se uporabi za izračun novih vrednosti.
- Razumevanje računa.
- Znanje o tem, kako neobdelane podatke očistiti in strukturirati v želeno obliko, da se skrajša čas, potreben za sprejemanje odločitev.
Ti predpogoji bodo izboljšali vaše možnosti za uspešno nadaljevanje kariere na področju strojnega učenja.