Tekoäly oppii suomea
Tekoäly kehittyy huimaavan nopeasti ja sen vaikutus on koko ajan laajempi. Tekoäly perustuu ns. generatiivisille kielimalleille. On ensiarvoisen tärkeää, että käytettävissä on suomenkielinen kielimalli. Onneksi sellainen on jo kehitetty Turun yliopiston tutkijaryhmän ja Kajaanissa sijaitsevan supertietokone LUMIn avulla. Suomenkielisten kielimallien kehittäminen ei luonnollisesti kiinnosta muualla kuin Suomessa.
Turun yliopistossa on työstetty suurta suomen kielen kielimallia. LUMI-supertietokoneen valtavaa laskentatehoa hyödynnettiin kun luotiin suomen kieleen pohjautuvaa GPT-3 tason kielimallia. FinGPT3-kielimalli on avoin ja kaikkien käytettävissä päinvastoin kuin kaupalliset kielimallit. FunGPT3:n luomisessa on käytetty kansalliskirjaston digitaalisia arkistoja, kielipankkien uutisvarastoja ja suomenkielistä internetiä.
Seuraavaksi tutkimusryhmä, TurkuNLP, keskittyy dialogimallin kehittämiseen. Joukkoistusprojektin kautta kerätään suomenkielisiä vuoropuheluita LUMIn dataksi. Turku NLP tekee yhteistyötä Aalto-yliopiston puheentunnistuksen tutkijoiden kanssa.
Aiheesta kirjoittivat Yle, HS ja CSC. ■
Laura Honkasalo
Laura Honkasalo on espoolainen kirjailija, joka asuu neljäsosan vuodesta Kemiönsaarella. Häntä kiinnostaa erityisesti historia, kauhu ja kuvataide. Honkasalo rakastaa lapsia, koiria ja talvea. Kuva: Milka Alanen.