Voiko kielimallin avulla kirjoittaa itse omistamaansa tekstiä?
Tekoälyn tuore ilmentymä ovat kielimallit, jotka tuottavat automaattisesti tekstiä. Mutta kuka – tai mikä – omistaa kielimallin avulla tuotetun tekstin? Pohdin tässä tekstissä asiaa kielimallien toiminnan ja niiden käyttäjän näkökulmasta, en tekijänoikeuksien ja lainsäädännön.
Kielimallit perustuvat koneoppimiseen. Ne on yleensä tehty miljardien sanojen opetusaineistoilla, jotka sisältävät miljoonien eri kirjoittajien tekstejä. Kielimalli on näistä teksteistä löytyneiden tilastollisten säännönmukaisuuksien valtava kokoelma. Tekstin tuottaminen tapahtuu poimimalla sanoja opittujen säännönmukaisuuksien mukaisesti.
Tietokoneohjelmalla tuskin voi olla omistajuutta tekstiin, mutta tekstin luovuus on monisyisempi kysymys. Kielimallin toimintamekanismi tähtää opetusaineiston matkimiseen, toisin sanoen mahdollisimman tutun näköiseen tulokseen. Paradoksaalisesti tulos voi kuitenkin olla luova, koska säännönmukaisuuksien löytäminen ja soveltaminen onnistuvat puutteellisesti.
Kielimallien suurin rajoitus on se, että ne käsittelevät vain sanoja, eivät sanojen ja ilmaisujen merkityksiä: kaikki tieto, mitä kielimallilla on käytettävissään, on sanojen ja kirjainten esiintyminen suhteessa toisiinsa. Kielimallilla ei ole mitään sanottavaa, ellei sitä erikseen anneta sille, ja sen näkemykset ovat tekstien tilastollisia säännönmukaisuuksia. Jos kielimallin tuottama teksti on sisällöllisesti luovaa, se on oleellisesti vahinko ja kielimallin käsityskyvyn ulkopuolella. On vaikea nähdä sitä silloin tulosten omistajanakaan.
”Kirjoita menestysromaani kahdessa minuutissa”, kehottaa netissä pyörivä mainos. Epärealistisen menestyslupauksen lisäksi viestiin sisältyy ajatus, että kielimallin tuottaman tekstin kirjoittaja on sen käyttäjä. Kukaan vakavasti kirjoittamiseen tai lukemiseen suhtautuva tuskin ajattelee näin.
Mielenkiintoista sen sijaan on pohtia, miten kirjailija voisi käyttää kielimallia apunaan. Kirjoittamisen tueksi on kehitetty useita kielimalleihin perustuvia ohjelmia, esimerkiksi Sudowrite. Ne tarjoavat apua tekstin ideointiin ja suunnitteluun, antavat palautetta ja muutosehdotuksia, ja muokkaavat tekstiä käyttäjän pyyntöjen perusteella.
Erään tutkimuksen mukaan kielimallista voi olla hyötyä: vaikka kielimallin tuottama teksti tai ideat ovat puutteellisia, ne voivat antaa sytykkeitä kirjoittajan omalle luovuudelle (Yuan ym. 2022).
Mutta tuntuuko kielimallin avustuksella kirjoitettu teksti omalta? Voi tuntua, kertoo sama tutkimus. Sen aineistossa kielimallista saatu hyöty ei vähentänyt kirjoittajan kokemaa omistajuutta. Tutkimusryhmässäni on saatu vastaava tulos kielimalleja edeltävästä tietokoneavusteisesta kirjoittamisesta (Kantosalo ja Riihiaho 2019).
Näyttää siis siltä, että kielimallin avulla olisi mahdollista kirjoittaa luovemmin ilman, että omistajuuden kokemuksesta tarvitsee tinkiä. Kokemukset ovat luonnollisesti subjektiivisia, ja mainituissa tutkimuksissa koehenkilöt olivat harrastelijakirjoittajia tai koululaisia, joten tulosten yleistymiseen esimerkiksi ammattikirjailijoihin on epäselvää.
Edellä mainittu kokemus omistajuuden säilymisestä on mielenkiintoinen. Merkittävä selitys sille lienee hallinnan säilyttäminen kirjoittajalla: hän päättää, mihin ja miten työkaluja käyttää, ja mitä sen tuottamilla tuloksilla tekee. Spekulatiivisempi selitys on se, ettei kielimallilla ylempänä kuvaamistani syistä nähdä sellaista omaa toimijuutta, joka vähentäisi kirjoittajan omistajuutta.
Kielimallien kehittyminen parantanee edelleen niiden tuottaman tekstin laatua. Näköpiirissä ei kuitenkaan ole malleja, jotka aidosti ottaisivat huomioon kirjallisuuden välittämät ja luomat merkitykset ja tunteet. Yksinoikeus moraaliseen omistajuuteen säilyy nähdäkseni toistaiseksi kirjailijalla – joka mahdollisesti käyttää kielimalleihin perustuvia työkaluja apunaan.
Hannu Toivonen
Hannu Toivonen on tietojenkäsittelytieteen professori ja tekoälytutkija. Tieteellisen työn lisäksi hän on kehittänyt tekoälyä luoviin sovelluksiin. Hannu on kirjoittanut tekoälystä helppolukuisen tietokirjan Mitä tekoäly on? 100 kysymystä ja vastausta. Kuva: Teos.