Hva er maskinlæring og hvordan fungerer det

Maskinlæring er en spennende gren av kunstig intelligens, og den er overalt rundt oss. Maskinlæring utnytter data på nye måter, for eksempel ved at Facebook foreslår artikler i feeden din. Denne fantastiske teknologien hjelper datasystemer med å lære og forbedre seg på grunnlag av erfaring ved å utvikle dataprogrammer som automatisk får tilgang til data og utfører oppgaver via prediksjoner og deteksjoner.

Etter hvert som du legger inn mer data i en maskin, hjelper dette algoritmene med å lære opp datamaskinen, slik at resultatene blir bedre. Når du ber Alexa om å spille favorittmusikkstasjonen din på Amazon Echo, velger hun den stasjonen du har spilt oftest. Du kan forbedre og raffinere lytteopplevelsen ytterligere ved å be Alexa om å hoppe over sanger, justere volumet og mange flere mulige kommandoer. Maskinlæring og den raske utviklingen av kunstig intelligens gjør alt dette mulig.

La oss begynne med å svare på spørsmålet: Hva er maskinlæring?

Hva er egentlig maskinlæring?

For det første er maskinlæring et sentralt delområde innen kunstig intelligens (AI). Maskinlæringsapplikasjoner lærer av erfaring (eller, for å være nøyaktig, data) på samme måte som mennesker gjør, uten direkte programmering. Når de eksponeres for nye data, lærer, vokser, endrer og utvikler de seg selv. Maskinlæring innebærer med andre ord at datamaskiner finner innsiktsfull informasjon uten å få beskjed om hvor de skal lete. I stedet gjør de dette ved hjelp av algoritmer som lærer av data i en iterativ prosess.

Konseptet med maskinlæring har eksistert lenge (tenk for eksempel på Enigma-maskinen under andre verdenskrig). Ideen om å automatisere anvendelsen av komplekse matematiske beregninger på store datamengder har imidlertid bare eksistert i noen få år, selv om den nå er i ferd med å få mer vind i seilene.

På et overordnet nivå er maskinlæring evnen til å tilpasse seg nye data på egen hånd og gjennom iterasjoner. Applikasjoner lærer av tidligere beregninger og transaksjoner og bruker «mønstergjenkjenning» for å produsere pålitelige og informerte resultater.

Hvordan fungerer maskinlæring?

Maskinlæring er utvilsomt en av de mest spennende delene av kunstig intelligens. Den fullfører oppgaven med å lære av data med spesifikk input til maskinen. Det er viktig å forstå hva som får maskinlæring til å fungere, og hvordan det kan brukes i fremtiden.

Maskinlæringsprosessen starter med å legge inn opplæringsdata i den valgte algoritmen. Opplæringsdata er kjente eller ukjente data som brukes til å utvikle den endelige maskinlæringsalgoritmen. Hvilken type opplæringsdata som legges inn, påvirker algoritmen, og dette konseptet vil vi se nærmere på om et øyeblikk.

Nye inndata mates inn i maskinlæringsalgoritmen for å teste om algoritmen fungerer som den skal. Deretter sammenlignes prediksjonen og resultatene med hverandre.

Hvis prediksjonen og resultatet ikke stemmer overens, trenes algoritmen på nytt flere ganger til dataforskeren får det ønskede resultatet. På denne måten kan maskinlæringsalgoritmen kontinuerlig lære på egen hånd og produsere det optimale svaret, og nøyaktigheten øker gradvis over tid.

Hvilke typer maskinlæring finnes det?

Maskinlæring er komplekst, og derfor er det delt inn i to hovedområder: veiledet læring og ikke-veiledet læring. Hver av dem har et spesifikt formål og en spesifikk funksjon som gir resultater og utnytter ulike former for data. Omtrent 70 prosent av maskinlæring er veiledet læring, mens ikke-veiledet læring utgjør mellom 10 og 20 prosent. Resten går til forsterkningslæring.

Veiledet læring

I veiledet læring bruker vi kjente eller merkede data som opplæringsdata. Siden dataene er kjente, er læringen derfor veiledet, dvs. styrt til vellykket utførelse. Inngangsdataene går gjennom maskinlæringsalgoritmen og brukes til å trene opp modellen. Når modellen er opplært basert på kjente data, kan du bruke ukjente data i modellen og få et nytt svar.

I dette tilfellet prøver modellen å finne ut om dataene er et eple eller en annen frukt. Når modellen er godt trent, vil den identifisere at dataene er et eple og gi den ønskede responsen.

Læring uten tilsyn

Ved ikke-veiledet læring er opplæringsdataene ukjente og umerkede – det vil si at ingen har sett på dataene før. Uten aspektet med kjente data kan algoritmen ikke styres av inndataene, og det er herfra begrepet «unsupervised» stammer. Disse dataene mates inn i maskinlæringsalgoritmen og brukes til å trene opp modellen. Den opplærte modellen prøver å søke etter et mønster og gi den ønskede responsen. I dette tilfellet er det ofte som om algoritmen prøver å knekke en kode som Enigma-maskinen, men uten at et menneske er direkte involvert, men heller en maskin.

I dette tilfellet består de ukjente dataene av epler og pærer som ligner på hverandre. Den opplærte modellen prøver å sette dem sammen slik at du får de samme tingene i lignende grupper.

Forsterkningslæring

I likhet med tradisjonelle typer dataanalyse oppdager algoritmen her data gjennom en prosess med prøving og feiling, og bestemmer deretter hvilken handling som gir høyest belønning. Tre hovedkomponenter utgjør forsterkningslæring – agenten, miljøet og handlingene. Agenten er den som lærer eller tar beslutninger, miljøet omfatter alt som agenten samhandler med, og handlingene er det agenten gjør.

Forsterkningslæring skjer når agenten velger handlinger som maksimerer den forventede belønningen over en gitt tidsperiode. Dette er enklest å oppnå når agenten arbeider innenfor et sunt rammeverk av retningslinjer.

Hvorfor er maskinlæring viktig?

For å få et bedre svar på spørsmålet om hva maskinlæring er, og for å forstå bruken av maskinlæring, kan vi se på noen av bruksområdene for maskinlæring. Den selvkjørende Google-bilen, deteksjon av nettsvindel og anbefalingsmotorer fra Facebook, Netflix og Amazon. Maskiner gjør alle disse tingene mulig ved å filtrere nyttig informasjon og sette den sammen basert på mønstre for å få nøyaktige resultater.

Den raske utviklingen innen maskinlæring har ført til en påfølgende økning i bruksområder, krav og betydningen av maskinlæring i det moderne liv. Big Data har også blitt et mye brukt moteord de siste årene. Dette skyldes delvis at maskinlæring har blitt stadig mer sofistikert, noe som gjør det mulig å analysere store mengder Big Data. Maskinlæring har også endret måten man henter ut og tolker data på ved å automatisere generiske metoder/algoritmer og dermed erstatte tradisjonelle statistiske teknikker.

Nå som du vet hva maskinlæring er, hvilke typer maskinlæring det er og hvor viktig det er, går vi videre til bruksområdene for maskinlæring.

De viktigste bruksområdene for maskinlæring

Typiske resultater fra maskinlæring er blant annet søkeresultater på nettet, sanntidsannonser på nettsider og mobile enheter, filtrering av e-postspam, deteksjon av nettverksinnbrudd og mønster- og bildegjenkjenning. Alt dette er biprodukter av å bruke maskinlæring til å analysere store datamengder.

Tradisjonelt var dataanalyse basert på prøving og feiling, en tilnærming som ble stadig mer upraktisk på grunn av fremveksten av store, heterogene datasett. Maskinlæring gir smarte alternativer for analyse av store datamengder. Maskinlæring kan gi nøyaktige resultater og analyser ved å utvikle raske og effektive algoritmer og datadrevne modeller for databehandling i sanntid.

Hvordan velger du hvilken maskinlæringsalgoritme du skal bruke?

Det finnes dusinvis av ulike algoritmer å velge mellom, men det finnes ingen som passer i alle situasjoner. I mange tilfeller må du prøve og feile. Men det finnes noen spørsmål du kan stille deg for å avgrense valgmulighetene.

Hvor stort er datamaterialet du skal jobbe med?
Hvilken type data skal du jobbe med?
Hva slags innsikt ønsker du å få ut av dataene?
Hvordan skal denne innsikten brukes?

Forutsetninger for maskinlæring

For de som er interessert i å lære mer om hva maskinlæring er, er det noen få krav som bør oppfylles for å lykkes i dette feltet. Disse kravene omfatter blant annet

Grunnleggende kunnskaper i programmeringsspråk som Python, R, Java, JavaScript osv.
Mellomliggende kunnskap om statistikk og sannsynlighet.
Grunnleggende kunnskaper i lineær algebra. I den lineære regresjonsmodellen trekkes det en linje gjennom alle datapunktene, og denne linjen brukes til å beregne nye verdier.
Forståelse av kalkulus.
Kunnskap om hvordan man renser og strukturerer rådata til ønsket format for å redusere tiden det tar å ta beslutninger.

Disse forutsetningene vil øke sjansene dine for å lykkes med en karriere innen maskinlæring.