Kas yra mašininis mokymasis ir kaip jis veikia
Mašininis mokymasis yra įdomi dirbtinio intelekto šaka, kuri mus supa. Mašininis mokymasis išryškina duomenų galią naujais būdais, pavyzdžiui, „Facebook” siūlo straipsnius jūsų naujienų sraute. Ši nuostabi technologija padeda kompiuterinėms sistemoms mokytis ir tobulėti iš patirties, kuriant kompiuterines programas, kurios gali automatiškai pasiekti duomenis ir atlikti užduotis naudodamosi prognozėmis ir aptikimais.
Kai į mašiną įvedate daugiau duomenų, tai padeda algoritmams mokyti kompiuterį, taip gerinant pateikiamus rezultatus. Kai paprašysite Alexos per „Amazon Echo” paleisti mėgstamą muzikos stotį, ji pereis prie dažniausiai jūsų grojamos stoties. Galite dar labiau pagerinti ir patobulinti savo klausymosi patirtį liepdami „Alexa” praleisti dainas, reguliuoti garsumą ir dar daug kitų galimų komandų. Visa tai įmanoma dėl mašininio mokymosi ir sparčios dirbtinio intelekto pažangos.
Pradėkime nuo atsakymo į klausimą – kas yra mašininis mokymasis?
Kas yra mašininis mokymasis?
Pradėkime nuo to, kad mašininis mokymasis yra pagrindinė dirbtinio intelekto (DI) sritis. Mašininio mokymosi programos mokosi iš patirties (tiksliau, duomenų), kaip ir žmonės, be tiesioginio programavimo. Susidūrusios su naujais duomenimis, šios programos pačios mokosi, auga, keičiasi ir tobulėja. Kitaip tariant, mašininis mokymasis apima kompiuterius, kurie randa įžvalgią informaciją, nors jiems nenurodoma, kur jos ieškoti. Vietoj to jie tai daro naudodamiesi algoritmais, kurie mokosi iš duomenų iteraciniame procese.
Mašininio mokymosi sąvoka egzistuoja jau seniai (prisiminkite, pavyzdžiui, Antrojo pasaulinio karo „Enigma” mašiną). Tačiau idėja automatizuoti sudėtingų matematinių skaičiavimų taikymą dideliems duomenims atsirado tik prieš kelerius metus, nors dabar ji įgauna vis didesnį pagreitį.
Aukštu lygiu mašininis mokymasis – tai gebėjimas savarankiškai ir per iteracijas prisitaikyti prie naujų duomenų. Programos mokosi iš ankstesnių skaičiavimų ir operacijų ir naudoja „modelių atpažinimą”, kad gautų patikimus ir pagrįstus rezultatus.
Kaip veikia mašininis mokymasis?
Mašininis mokymasis neabejotinai yra vienas iš įdomiausių dirbtinio intelekto posistemių. Jis užbaigia užduotį mokytis iš duomenų su konkrečiomis įvestimis į mašiną. Svarbu suprasti, dėl ko veikia mašininis mokymasis, taigi, kaip jis gali būti naudojamas ateityje.
Mašininio mokymosi procesas prasideda nuo mokymo duomenų įvedimo į pasirinktą algoritmą. Mokymo duomenys – tai žinomi arba nežinomi duomenys, skirti galutiniam mašininio mokymosi algoritmui sukurti. Įvestų mokymo duomenų tipas turi įtakos algoritmui, ir ši sąvoka tuoj pat bus aptarta plačiau.
Į mašinų mokymosi algoritmą įvedami nauji įvesties duomenys, siekiant patikrinti, ar algoritmas veikia teisingai. Tada prognozės ir rezultatai tikrinami tarpusavyje.
Jei prognozė ir rezultatai nesutampa, algoritmas kelis kartus mokomas iš naujo, kol duomenų mokslininkas gauna norimą rezultatą. Tai leidžia mašininio mokymosi algoritmui nuolat mokytis pačiam ir pateikti optimalų atsakymą, laikui bėgant palaipsniui didinant tikslumą.
Kokie yra mašininio mokymosi tipai?
Mašininis mokymasis yra sudėtingas, todėl jis suskirstytas į dvi pagrindines sritis – prižiūrimąjį mokymąsi ir neprižiūrimąjį mokymąsi. Kiekviena iš jų turi konkretų tikslą ir veiksmą, duoda rezultatų ir naudoja įvairių formų duomenis. Maždaug 70 proc. mašininio mokymosi sudaro prižiūrimas mokymasis, o neprižiūrimas mokymasis – nuo 10 iki 20 proc. Likusią dalį užima pastiprintas mokymasis.
Prižiūrimas mokymasis
Vykdant prižiūrimąjį mokymąsi, mokymo duomenims naudojami žinomi arba pažymėti duomenys. Kadangi duomenys yra žinomi, todėl mokymasis yra prižiūrimas, t. y. nukreiptas į sėkmingą vykdymą. Įvesties duomenys pereina per mašininio mokymosi algoritmą ir naudojami modeliui apmokyti. Kai modelis apmokytas remiantis žinomais duomenimis, į modelį galima įtraukti nežinomus duomenis ir gauti naują atsakymą.
Šiuo atveju modelis bando išsiaiškinti, ar duomenys yra obuolys, ar kitas vaisius. Gerai apmokius modelį, jis nustatys, kad duomenys yra obuolys, ir pateiks norimą atsakymą.
Mokymasis be priežiūros
Mokymosi be priežiūros atveju mokymo duomenys yra nežinomi ir nepažymėti, t. y. niekas prieš tai šių duomenų nenagrinėjo. Nesant žinomų duomenų aspekto, algoritmas negali vadovautis įvesties duomenimis, todėl iš čia kilęs terminas „be priežiūros”. Šie duomenys pateikiami mašininio mokymosi algoritmui ir naudojami modeliui apmokyti. Apmokytas modelis bando ieškoti šablono ir pateikti norimą atsakymą. Šiuo atveju algoritmas dažnai tarsi bando įveikti kodą kaip „Enigma” mašina, tačiau tiesiogiai nedalyvauja žmogaus protas, o mašina.
Šiuo atveju nežinomus duomenis sudaro obuoliai ir kriaušės, kurie atrodo panašūs vienas į kitą. Apmokytas modelis bando juos visus sudėti taip, kad gautumėte panašių dalykų panašias grupes.
Mokymasis naudojant pastiprinimą
Kaip ir tradicinių duomenų analizės tipų atveju, šiuo atveju algoritmas atranda duomenis bandymų ir klaidų būdu ir tada nusprendžia, už kokį veiksmą gaunamas didesnis atlygis. Pastiprintąjį mokymąsi sudaro trys pagrindiniai komponentai – agentas, aplinka ir veiksmai. Agentas yra besimokantis arba sprendimus priimantis asmuo, aplinka apima viską, su kuo agentas sąveikauja, o veiksmai yra tai, ką agentas daro.
Mokymasis naudojant pastiprinimą vyksta tada, kai agentas pasirenka veiksmus, kurie maksimizuoja tikėtiną atlygį per tam tikrą laiką. Tai lengviausia pasiekti, kai agentas dirba pagal patikimą politikos sistemą.
Kodėl mašininis mokymasis yra svarbus?
Norėdami geriau atsakyti į klausimą, kas yra mašininis mokymasis, ir suprasti mašininio mokymosi panaudojimą, panagrinėkite keletą mašininio mokymosi taikymų. Savavaldis „Google” automobilis, kibernetinio sukčiavimo aptikimas, „Facebook”, „Netflix” ir „Amazon” internetinės rekomendacijų sistemos. Visus šiuos dalykus mašinos daro įmanomus, nes filtruoja naudingą informaciją ir, remdamosi šablonais, ją sujungia, kad gautų tikslius rezultatus.
Sparti mašininio mokymosi raida lėmė tai, kad vėliau išaugo mašinų mokymosi naudojimo atvejai, poreikiai ir pati mašinų mokymosi svarba šiuolaikiniame gyvenime. Per pastaruosius kelerius metus plačiai vartojamas žodis „didieji duomenys” (angl. Big Data). Tai iš dalies lėmė išaugęs mašininio mokymosi sudėtingumas, leidžiantis analizuoti didelius didelių duomenų kiekius. Mašininis mokymasis taip pat pakeitė duomenų išgavimo ir interpretavimo būdus, nes automatizavo bendruosius metodus ir (arba) algoritmus, taip pakeisdamas tradicinius statistinius metodus.
Dabar, kai jau žinote, kas yra mašininis mokymasis, jo tipai ir svarba, pereikime prie mašininio mokymosi panaudojimo būdų.
Pagrindiniai mašininio mokymosi panaudojimo būdai
Tipiniai mašininio mokymosi panaudojimo rezultatai paprastai yra interneto paieškos rezultatai, realaus laiko skelbimai interneto puslapiuose ir mobiliuosiuose įrenginiuose, el. pašto nepageidaujamų laiškų filtravimas, įsibrovimų į tinklą aptikimas, modelių ir vaizdų atpažinimas. Visa tai yra šalutiniai mašininio mokymosi naudojimo didžiuliams duomenų kiekiams analizuoti rezultatai.
Tradiciškai duomenų analizė buvo grindžiama bandymais ir klaidomis, o šis metodas tapo vis labiau nepraktiškas, nes atsirado dideli ir nevienalyčiai duomenų rinkiniai. Mašininis mokymasis suteikia išmanių alternatyvų didelės apimties duomenų analizei. Mašininis mokymasis gali padėti gauti tikslius rezultatus ir atlikti analizę, kuriant greitus ir efektyvius algoritmus bei duomenų apdorojimo realiuoju laiku modelius.
Kaip nuspręsti, kokį mašininio mokymosi algoritmą naudoti?
Yra dešimtys skirtingų algoritmų, iš kurių galima rinktis, tačiau nėra geriausio pasirinkimo ar tokio, kuris tiktų kiekvienai situacijai. Daugeliu atvejų tenka griebtis bandymų ir klaidų metodo. Tačiau yra keletas klausimų, kuriuos galite užduoti ir kurie padės susiaurinti pasirinkimo galimybes.
- Kokio dydžio yra duomenys, su kuriais dirbsite?
- Su kokio tipo duomenimis dirbsite?
- Kokių įžvalgų siekiate gauti iš duomenų?
- Kaip šios įžvalgos bus naudojamos?
Mašininio mokymosi išankstinės sąlygos
Norintiems sužinoti daugiau, nei kas yra mašininis mokymasis, reikėtų įvykdyti keletą reikalavimų, kad būtų galima sėkmingai užsiimti šia sritimi. Šie reikalavimai yra šie:
- Pagrindinės programavimo kalbų, tokių kaip Python, R, Java, JavaScript ir kt., žinios.
- Vidutinės statistikos ir tikimybių žinios.
- Pagrindinės tiesinės algebros žinios. Tiesinės regresijos modelyje per visus duomenų taškus brėžiama linija, kuri naudojama naujoms reikšmėms apskaičiuoti.
- Skaičiavimo supratimas.
- Žinios, kaip išvalyti ir susisteminti neapdorotus duomenis iki norimo formato, kad sutrumpėtų sprendimų priėmimo laikas.
Šios išankstinės sąlygos padidins jūsų galimybes sėkmingai siekti mašinų mokymosi karjeros.