Hvad er maskinlæring, og hvordan fungerer det

Maskinlæring er en spændende gren af kunstig intelligens, og den er overalt omkring os. Maskinlæring udnytter data på nye måder, f.eks. når Facebook foreslår artikler i dit feed. Denne fantastiske teknologi hjælper computersystemer med at lære og forbedre sig ud fra erfaring ved at udvikle computerprogrammer, der automatisk kan få adgang til data og udføre opgaver via forudsigelser og detektioner.

Når du indlæser flere data i en maskine, hjælper det algoritmerne med at lære computeren og dermed forbedre de leverede resultater. Når du beder Alexa om at afspille din yndlingsmusikstation på Amazon Echo, vil hun gå til den station, du oftest har spillet. Du kan yderligere forbedre og forfine din lytteoplevelse ved at bede Alexa om at springe sange over, justere lydstyrken og mange flere mulige kommandoer. Machine Learning og den hurtige udvikling af kunstig intelligens gør alt dette muligt.

Lad os starte med at besvare spørgsmålet – Hvad er Machine Learning?

Hvad er maskinlæring helt præcist?

Til at begynde med er maskinlæring et centralt underområde af kunstig intelligens (AI). Machine Learning-applikationer lærer af erfaring (eller for at være præcis, data), som mennesker gør, uden direkte programmering. Når de udsættes for nye data, lærer, vokser, forandrer og udvikler disse applikationer sig af sig selv. Med andre ord indebærer maskinlæring, at computere finder indsigtsfulde oplysninger uden at få at vide, hvor de skal lede. I stedet gør de det ved at udnytte algoritmer, der lærer af data i en iterativ proces.

Begrebet machine learning har eksisteret længe (tænk f.eks. på Enigma-maskinen under Anden Verdenskrig). Men ideen om at automatisere anvendelsen af komplekse matematiske beregninger på big data har kun eksisteret i nogle få år, selvom den nu er ved at få mere momentum.

På et højt niveau er maskinlæring evnen til at tilpasse sig nye data uafhængigt og gennem iterationer. Applikationer lærer af tidligere beregninger og transaktioner og bruger “mønstergenkendelse” til at producere pålidelige og informerede resultater.

Hvordan fungerer maskinlæring?

Machine Learning er uden tvivl en af de mest spændende undergrupper af kunstig intelligens. Den fuldfører opgaven med at lære fra data med specifikke input til maskinen. Det er vigtigt at forstå, hvad der får Machine Learning til at fungere og dermed, hvordan det kan bruges i fremtiden.

Machine Learning-processen starter med at indtaste træningsdata i den valgte algoritme. Træningsdata er kendte eller ukendte data, der bruges til at udvikle den endelige Machine Learning-algoritme. Typen af træningsdata påvirker algoritmen, og det koncept vil blive dækket yderligere om et øjeblik.

Nye inputdata føres ind i machine learning-algoritmen for at teste, om algoritmen fungerer korrekt. Forudsigelsen og resultaterne kontrolleres derefter i forhold til hinanden.

Hvis forudsigelsen og resultaterne ikke stemmer overens, trænes algoritmen igen flere gange, indtil dataforskeren får det ønskede resultat. Dette gør det muligt for maskinlæringsalgoritmen hele tiden at lære på egen hånd og producere det optimale svar, der gradvist øges i nøjagtighed over tid.

Hvad er typer af maskinlæring?

Machine Learning er komplekst, og derfor er det blevet opdelt i to primære områder, supervised learning og unsupervised learning. Hver af dem har et specifikt formål og en specifik handling, der giver resultater og udnytter forskellige former for data. Cirka 70 procent af machine learning er supervised learning, mens unsupervised learning står for mellem 10 og 20 procent. Resten udgøres af reinforcement learning.

Overvåget læring

I supervised learning bruger vi kendte eller mærkede data til træningsdataene. Da dataene er kendte, er læringen derfor superviseret, dvs. styret til succesfuld udførelse. Inputdataene går gennem Machine Learning-algoritmen og bruges til at træne modellen. Når modellen er trænet baseret på de kendte data, kan du bruge ukendte data i modellen og få et nyt svar.

I dette tilfælde forsøger modellen at finde ud af, om dataene er et æble eller en anden frugt. Når modellen er blevet trænet godt, vil den identificere, at dataene er et æble, og give det ønskede svar.

Ikke-overvåget læring

I unsupervised learning er træningsdataene ukendte og umærkede – hvilket betyder, at ingen har set på dataene før. Uden aspektet af kendte data kan input ikke styres til algoritmen, hvilket er, hvor udtrykket unsupervised stammer fra. Disse data fodres til Machine Learning-algoritmen og bruges til at træne modellen. Den trænede model forsøger at søge efter et mønster og give det ønskede svar. I dette tilfælde er det ofte, som om algoritmen forsøger at bryde en kode ligesom Enigma-maskinen, men uden at det menneskelige sind er direkte involveret, men snarere en maskine.

I dette tilfælde består de ukendte data af æbler og pærer, som ligner hinanden. Den trænede model forsøger at sætte dem alle sammen, så man får de samme ting i lignende grupper.

Forstærkningslæring

Ligesom traditionelle former for dataanalyse opdager algoritmen her data gennem en proces med forsøg og fejl og beslutter derefter, hvilken handling der resulterer i højere belønninger. Tre hovedkomponenter udgør reinforcement learning – agenten, miljøet og handlingerne. Agenten er den lærende eller beslutningstageren, miljøet omfatter alt, hvad agenten interagerer med, og handlingerne er det, agenten gør.

Forstærkningslæring sker, når agenten vælger handlinger, der maksimerer den forventede belønning over en given tid. Det er nemmest at opnå, når agenten arbejder inden for en sund politisk ramme.

Hvorfor er maskinlæring vigtig?

For bedre at kunne svare på spørgsmålet om, hvad maskinlæring er, og forstå, hvad maskinlæring kan bruges til, kan vi se på nogle af anvendelsesområderne for maskinlæring. Den selvkørende Google-bil, afsløring af cybersvindel og online anbefalingsmotorer fra Facebook, Netflix og Amazon. Maskiner gør alle disse ting mulige ved at filtrere nyttige informationer og sætte dem sammen baseret på mønstre for at få nøjagtige resultater.

Den hurtige udvikling inden for maskinlæring har forårsaget en efterfølgende stigning i brugssager, krav og den rene og skære betydning af maskinlæring i det moderne liv. Big Data er også blevet et meget brugt buzzword i de sidste par år. Det skyldes til dels den øgede sofistikering af Machine Learning, som gør det muligt at analysere store dele af Big Data. Machine Learning har også ændret den måde, man udtrækker og fortolker data på, ved at automatisere generiske metoder/algoritmer og dermed erstatte traditionelle statistiske teknikker.

Nu hvor du ved, hvad machine learning er, hvilke typer det er, og hvor vigtigt det er, så lad os gå videre til brugen af machine learning.

De vigtigste anvendelser af machine learning

Typiske resultater fra maskinlæring omfatter normalt websøgeresultater, realtidsannoncer på websider og mobile enheder, e-mailspamfiltrering, detektering af netværksindtrængen og mønster- og billedgenkendelse. Alt dette er biprodukter af at bruge machine learning til at analysere massive datamængder.

Traditionelt var dataanalyse baseret på forsøg og fejl, en tilgang, der blev mere og mere upraktisk takket være stigningen i store, heterogene datasæt. Maskinlæring giver smarte alternativer til dataanalyse i stor skala. Machine learning kan producere præcise resultater og analyser ved at udvikle hurtige og effektive algoritmer og datadrevne modeller til databehandling i realtid.

Hvordan beslutter du, hvilken maskinlæringsalgoritme du skal bruge?

Der er snesevis af forskellige algoritmer at vælge imellem, men der er ikke noget bedste valg eller en, der passer til alle situationer. I mange tilfælde er man nødt til at prøve sig frem. Men der er nogle spørgsmål, du kan stille, som kan hjælpe med at indsnævre dine valg.

  • Hvad er størrelsen på de data, du skal arbejde med?
  • Hvad er det for en type data, du vil arbejde med?
  • Hvilken slags indsigt leder du efter fra dataene?
  • Hvordan vil du bruge disse indsigter?

Forudsætninger for maskinlæring

For dem, der er interesserede i at lære mere om, hvad Machine Learning er, er der nogle få krav, der skal opfyldes for at få succes inden for dette felt. Disse krav omfatter:

  • Grundlæggende kendskab til programmeringssprog som Python, R, Java, JavaScript osv.
  • Mellemliggende viden om statistik og sandsynlighed.
  • Grundlæggende viden om lineær algebra. I den lineære regressionsmodel trækkes en linje gennem alle datapunkterne, og denne linje bruges til at beregne nye værdier.
  • Forståelse af calculus.
  • Viden om, hvordan man renser og strukturerer rådata til det ønskede format for at reducere den tid, det tager at træffe beslutninger.

Disse forudsætninger vil forbedre dine chancer for at få succes med en karriere inden for machine learning.