Pohjamallit – tekoälyn luovuuden tukipilari

  • Kirjoittaja: Niila Tamminen, lehtori, Humanistinen ammattikorkeakoulu, 03.10.2023

Tämä blogikirjoitus on osa Tekoälytiistai-blogisarjaa, jonka jokaisessa osassa esittelemme yhden näkökulman tekoälyn hyödyntämiseen. Kutsumme tätä blogisarjaa Tekoälytiistaiksi, koska blogitekstejä julkaistaan joka tiistai syys- ja lokakuussa. Blogisarjan tuotantoa koordinoi Digioppimisen kehittämisryhmä Dingo.

Tekoälytiistai.

Tekoälyä koskevassa artikkelissa syvennymme sen teknisiin perusteisiin, paljastaen virtuaalisen konepellin alla piilevät tekijät. Kaikki tekoälyn toiminta perustuu massiiviseen taustadataan, joka vaatii huolellista käsittelyä, luokittelua ja soveltamista, jotta siitä voi olla hyötyä.

Ennen koneoppimisen algoritmien kehittämisen aikakautta dataa käsiteltiin staattisesti, perustuen ennalta määriteltyihin algoritmeihin. Niin uutuudentuoksuinen kuin se tuntuukin olevan, tekoäly ei ole uusi ilmiö, ja sen historia ulottuu useiden vuosikymmenten taakse. Yksi merkittävistä virstanpylväistä oli termi “koneoppiminen,” joka esiteltiin vuonna 1959 Arthur Samuelin toimesta.

Koneoppiminen toimii laajana käsitteenä ongelmien ratkaisemisessa, joissa ei luoteta ihmisen määrittelemiin algoritmeihin, vaan pyritään siihen, että koneet voivat itsenäisesti löytää uusia algoritmeja kyseistä ongelmaa varten ilman eksplisiittistä ohjausta. Näin ollen koneoppiminen edustaa tekoälyn perustavaa tieteenalaa, joka keskittyy algoritmien kehittämiseen, jotka kykenevät oppimaan ja sopeutumaan datasta.

Pohjamallit kaiken takana

Pohjamalli on oleellinen käsite koneoppimisessa. Se on malli, joka koulutetaan valtavalla datamäärällä, ja se voidaan sitten soveltaa erilaisiin tehtäviin (Stanford HAI 2021). Pohjamallien vahvuus piilee niiden kyvyssä käsitellä monipuolisia tehtäviä. Niitä voidaan hyödyntää esimerkiksi tiedon etsimisessä, tekstin, kuvien ja äänen analysoinnissa, tuottamisessa, sekä erilaisen datan hankinnassa, luokittelussa ja jatkokäsittelyssä.

Tarkastellaanpa pientä esimerkkiä: Internetissä arvellaan olevan yli 5 miljardia verkkosivua. Keskimääräisen ihmisen tarvitsisi yli 200 000 vuotta lukea ne kaikki minuutissa per sivu, olettaen kahdeksan tunnin työpäivän. Kuitenkin koulutetun pohjamallin avulla tämä tehtävä voidaan suorittaa muutamassa kuukaudessa. Pohjamalli kykenee muistamaan kaiken ja yhdistelemään massiivisen määrän erilaista informaatiota, tuottaen sitä sitten tarvittaessa ihmisille.

Pohjamallit ovat siis kuin valtavia tietosanakirjoja, jotka sisältävät runsaasti tietoa maailmasta. Toisin kuin tavallisessa tietosanakirjassa, nämä mallit koostuvat kerätystä aineistosta, joka käy läpi erilaisia käsittelyvaiheita, jotta sovellusta voidaan kutsua älykkääksi tai tekoälypohjaiseksi. Tämä käsittely sisältää päällekkäisyyksien poistamisen, puuttuvan datan täydentämisen ja tärkeiden piirteiden erottelun aineistosta.

Kuvassa piirroskuva, Kuva on isometrinen kuva ihmisistä, jotka ovat vuorovaikutuksessa erilaisten tietokoneen näyttöjen ja laitteiden kanssa. Kuva on viileässä väripaletissa, jossa on sinisiä, vihreitä ja oransseja. Ihmisiä näytetään työskentelevän erilaisissa tehtävissä, kuten datan analysoinnissa, ohjelmoinnissa ja valvonnassa. Laitteet ja näytöt näkyvät eri kokoisina.
Taustamallit vaativat koulutusta, joko ihmisten tai koneiden toimesta. Kuva: www.freepik.com.

Pohjamalli pitää kouluttaa

Nykyiset pohjamallit voivat joskus kärsiä ongelmista, kuten aineiston vinoumista, puolueellisuudesta tai epätäydellisyydestä. Tämä saattaa johtaa vääristymiin ja stereotypioihin mallin toiminnassa, erityisesti jos malli koulutetaan puutteellisella tai vääristyneellä datalla, niin kuin esimerkiksi internetissä usein on. Siksi on tärkeää tarkkailla ja varmistaa tausta-aineiston laatu ja puolueettomuus.

Kun tausta-aineisto on valmiina, valittu pohjamalli koulutetaan tiettyyn tehtävään. Koulutuksen aikana malli altistetaan aineistolle toistuvasti, ja se pyrkii oppimaan aineiston ominaisuudet ja yhteydet käytettyjen algoritmien ohjaamana. Koulutusprosessissa malli optimoi parametrejaan ja pyrkii vähentämään mahdolliset virheet ja epätarkkuudet. Jos malli ei toimi odotetusti, se vaatii hienosäätöä ja korjaustoimenpiteitä.

Pohjamallien käyttämät oppivat algoritmit ovat lopulta opettaneet tekoälylle niin paljon erilaisia taitoja, että ne pystyvät ymmärtämään kieltä, tekemään päätelmiä, ja luomaan yhteyksiä asioihin, jotka voivat olla ihmisille haastavia. Joskus ne voivat olla jopa liian innokkaita, ja niitä on syytetty hallusinaatioista – ne saattavat keksiä tietoa omasta päästään, luoda lähteitä tai epäonnistua peruskoulutasoisten asioiden hallinnassa. Tämä kaikki on tärkeää ottaa huomioon, erityisesti vuonna 2023, kun pohjamallit ovat vielä melko nuoria. Esimerkiksi suositun Chat-GPT:n taustalla oleva pohjamalli (viimeisin versio GPT-4) on vasta viiden vuoden ikäinen. Jo alkeellisempi versio pohjamallista, kuten GPT-2, sai aikanaan paljon huomiota. Eräs the Verge -verkkolehden toimittaja kuvaili sitä seuraavasti: “Anna sille tekaistu otsikko, ja se kirjoittaa lopun artikkelista, mukaan lukien keksityt lainaukset ja tilastot. Syötä sille lyhyt tarinan aloituslause, ja se jatkaa tarinaa.”

Pohjamallit kehittyvät huimaa vauhtia, eikä niiden kehitykselle näy loppua. Teknologia on niin merkittävä, että Alphabetin toimitusjohtaja Sundar Pichai on verrannut sitä tulen keksimiseen (Nolan 2023). Kuten tuli, myös tekoäly ja sen pohjamallit voivat olla hyviä renkejä, mutta huonoja isäntiä.

Lähteet

Samuel, Arthur 1959. Some Studies in Machine Learning Using the Game of Checkers. IBM Journal of Research and Development. 3: 210–229.

Stanford HAI. Introducing the Center for Research on Foundation Models (CRFM). Viitattu 11.8.2023

Vincent, James 2019. OpenAI’s new multitalented AI writes, translates, and slanders. The Verge. Viitattu 7.7.2023.

Nolan, Beatrice 2023. Sundar Pichai says AI technology could be more profound than fire or electricity. Viitattu 1.7.2023.