AI-skolan, del 1: Från muffins till mänsklig hjärna
AI-skolan, del 1: Från muffins till mänsklig hjärna
För människor är det enkelt att skilja mellan hundar och muffins, men för en AI-modell är det en utmaning. Denna till synes banala jämförelse belyser fundamentala skillnader mellan mänsklig och artificiell intelligens. I den första delen av AI-skolan utforskar vi hur AI fungerar, försöken att imitera mänskliga hjärnor samt förklarar betydelsen av olika AI-termer.
Artificiell intelligens (AI) är inte ett nytt fenomen men intresset för tekniken har svängt kraftigt genom åren. För närvarande befinner vi oss mitt i en period av intensiv uppmärksamhet och dagliga rapporter om nya AI-genombrott. Trots detta är AI-tekniken fortfarande långt ifrån att kunna efterlikna mänsklig intelligens och beteende i dess fulla bredd.
”Även i skuggan av den mest avancerade AI, lyser den mänskliga hjärnans unika förmåga till empati och intuition som en oförutsägbar stjärna.” Citat: Chat GPT
Idag kan AI spegla specifika mänskliga färdigheter, såsom:
- Logisk-matematisk förmåga: Snabb problemlösning och mönsterigenkänning, tillämpat inom områden som algoritmisk handel och dataanalys.
- Språklig förmåga: Möjliggör förståelse och generering av mänskligt språk, används i översättningsverktyg, chattbotar och röstassistenter.
- Spatial förmåga: Essentiell för robotik och självkörande fordon som navigerar och interagerar med sin omgivning.
- Musikalisk förmåga: AI som skapar eller analyserar musik baserat på befintliga kompositioner.
- Kroppslig-kinestetisk förmåga: Precision och koordination i robotik, exempelvis inom kirurgi eller tillverkning.
- Interpersonell förmåga: Hantering av social interaktion, används i utbildnings- och vårdsektorn.
- Intrapersonell förmåga: Hjälp med personlig insikt och självreflektion, exempelvis i AI-drivna hälsoappar.
- Naturalistisk förmåga: Identifiering och klassificering av växt- och djurliv, viktigt inom miljöövervakning och jordbruk.
De kvarvarande utmaningarna för AI inkluderar emotionell intelligens, medvetenhet, moral, etik, kreativitet, och förmågan att reflektera över sin egen existens. Dessa förmågor är unika för människan och utgör gränser som AI än så länge inte kan överskrida. Kanske kan de aldrig erövras av maskiner.
Det nuvarande intresset för AI beror till stor del på framsteg inom maskininlärning, datorer som lär sig från stora mängder data istället för att följa programmerade instruktioner. Detta liknar hur man lär ett barn genom att upprepade gånger visa hur något fungerar.
En av de mest banbrytande AI-modellerna utnyttjar principerna för djupinlärning och neurala nätverk. Dessa neurala nätverk, som strävar efter att härma den mänskliga hjärnans komplexa funktionssätt, är uppbyggda av flera lager av sammankopplade ”noder” som liknar hjärnans neuroner. Dessa noder kan bearbeta och integrera information på sofistikerade sätt. Djupinlärning innebär att dessa modeller använder många lager för att uppnå en mer avancerad form av inlärning och problemlösning.
Exemplet hundar och muffins, se bilden nedan, visar dock skillnaden mellan mänskliga hjärnor och AI. För människor är det enkelt att se vilken bild som föreställer en hund och vilken som föreställer en muffin. För AI är det en utmaning. För att en dator ska kunna klara uppgiften krävs omfattande träning för att lära sig urskilja subtila mönster som skiljer hundar från muffins. Trots det kan den luras av de visuella likheterna om det inte finns tillräckligt många lager i nätverket.
Bildtext: Det här är en skärmdump av en populär bild som cirkulerat på internet.
För att lära AI-modellen att se skillnad på hundar och muffin används övervakad inlärning, vilket på engelska kallas “supervised learning”. Det innebär att den lär sig genom bilder som fått etiketter som talar om vad de föreställer.
Oövervakat inlärning innebär att AI-modellen lär sig från datamängder som saknar etiketter. Metoden används för att se mönster och samband.
Ett exempel är Netflix. Bolaget använder övervakad inlärning för att direkt förutsäga tittares preferenser baserat på tidigare beteenden och betyg. Men Netflix använder oövervakad inlärning för att utforska och identifiera underliggande mönster eller kluster i användardata, vilket gör det möjligt för Netflix att upptäcka nya insikter om hur olika typer av innehåll relaterar till varandra och hur de kan rekommenderas på ett mer nyanserat sätt.
Generativ AI är en av de mest spännande innovationerna under de senaste åren, med tjänster som Chat GPT som tydliga exempel. Dessa banbrytande system kan generera innehåll – från text och bilder till musik – som imponerande nog speglar människans kreativa uttryck. Till skillnad från traditionella AI-system som fokuserar på att analysera data och dra slutsatser, har generativa AI-modeller förmågan att skapa helt nya, originella verk. De assimilerar mönster, stilar och strukturer från träningsdata för att sedan producera nytt, unikt innehåll.
Generativ AI revolutionerar skapandeprocessen och öppnar för oändliga möjligheter inom kreativitet och innovation. Men, vänta här, sade vi inte alldeles nyss att dagens AI saknar förmåga att vara kreativ? Jo, och än så länge saknar AI människans kreativitet, det handlar snarare om att lära sig hur en människa skulle ha ritat eller skrivit.
För att få ett bra resultat krävs dock en välskriven prompt. En prompt inom kontexten av programmering, speciellt när det gäller interaktion med artificiell intelligens (AI) eller andra interaktiva system, är en inmatning eller ett kommando som användaren ger till systemet för att initiera en process eller få fram ett svar. Prompten fungerar som en uppmaning eller en förfrågan till systemet att utföra en specifik uppgift eller ge information baserat på de instruktioner eller data som angetts.
Bildtext: Bild av AI genererad av Chat GPT.
I sammanhanget av AI, såsom chatbotar eller bildgenererande AI, refererar prompten oftast till den text, fråga eller beskrivning som användaren matar in för att guida AI i vad den ska generera eller vilket svar den ska ge. Till exempel, i bildgenererande AI, kan en prompt vara en detaljerad beskrivning av en scen som användaren vill att AI:n ska skapa en bild av. Inom chattbotar eller textbaserade AI-modeller är en prompt vanligen en fråga eller ett påstående som användaren vill ha ett svar på eller en fortsättning på.
Prompten är alltså avgörande för hur väl AI kan förstå och uppfylla användarens önskemål, och konsten att formulera effektiva prompts är en viktig färdighet när man interagerar med avancerade AI-system.
Det talas ibland om prompt ingenjör eller prompt skrivare som ett framtidsyrke, en profession med förmågan att effektivt tala med AI-modeller.
I nästa avsnitt av AI-skolan kommer vi att prata mer om Chat GPT och andra AI chatbotar.
Ordlista
- Artificiell intelligens (AI): Teknik som möjliggör för maskiner att utföra uppgifter som traditionellt kräver mänsklig intelligens, såsom att förstå språk, igenkänna bilder, lösa problem och lära sig från erfarenheter.
- Maskininlärning: En gren inom artificiell intelligens som fokuserar på att bygga system som kan lära sig från och anpassa sig till data utan att vara explicit programmerade för specifika uppgifter. Detta uppnås genom algoritmer som kan bearbeta stora datamängder och förbättra sina förutsägelser eller beslut baserat på lärdomar.
- Generativ AI: En typ av artificiell intelligens som kan generera nytt, originalinnehåll eller data som liknar befintligt material. Detta inkluderar att skapa text, bilder, musik och andra former av kreativa uttryck baserat på inlärda mönster och stilar från träningsdata.
- Djupinlärning: En avancerad underkategori av maskininlärning som använder stora neurala nätverk med många lager (djupa nätverk) för att analysera komplexa mönster i data. Djupinlärning är särskilt kraftfull för uppgifter som bild- och taligenkänning.
- Neurala nätverk: Datormodeller designade för att efterlikna hur det mänskliga hjärnans neuroner signalerar till varandra. Neurala nätverk består av noder ordnade i lager, där varje lager tar emot input, bearbetar den och skickar output till nästa lager.
- Prompt: En inmatning eller ett kommando som användaren ger till ett AI-system för att initiera en process eller få ett svar.
- Chat GPT är en avancerad språkmodell utvecklad av OpenAI som använder tekniken bakom generativ AI för att skapa textbaserade svar som efterliknar mänskligt skriftspråk.
- Supervised Learning (Övervakad inlärning): Modeller tränas på data som redan har svar (etiketter). Exempel: E-postspamfilter som lär sig märka e-post som ”spam” eller ”inte spam” baserat på tidigare märkta exempel.
- Unsupervised Learning (Oövervakad inlärning): Modeller utforskar oetiketterad data för att hitta mönster eller strukturer på egen hand.
Skribent:
Margaretha Levander är en erfaren affärsjournalist med fokus på näringsliv, teknologi och samhällsfrågor. Sedan hennes flytt till Silicon Valley i Kalifornien för nästan sju år sedan har hon varit engagerad i att bevaka och analysera de senaste trenderna och händelserna inom näringslivet, tech och det amerikanska samhället. I Sverige arbetade Margaretha i många år som redaktör och journalist för medier som Dagens Industri, Affärsvärlden och Dagens Samhälle. Hennes kompetens och insikter har gjort henne till en respekterad röst inom näringslivs- och samhällsfrågor samt en pålitlig källa för nyheter och analyser.
Nyligen har Margaretha även fördjupat sig inom artificiell intelligens genom studier vid Stanford University. Med sin nyvunna expertis inom AI, baserad i teknikens hjärta, Silicon Valley, följer hon noggrant utvecklingen inom detta dynamiska fält. Hon ser med spänning fram emot att utforska och rapportera om de spännande framstegen inom AI under de kommande åren.