Käsitellään generatiivista tekoälyä. Se on koulutettu netistä kerätyllä aineistolla – tekstillä, kuvilla, musiikilla, taiteella, videoilla. Kuten moni tietää, netissä oleva sisältö ei ole vapaata riistaa vaan sitä suojaavat tekijänoikeudet sekä lähioikeudet. Eli millä luvalla tämä koulutus on siis tehty? Ja onko lopputulos suojattu?
Lyhyesti: Ilman lupia on koulutettu eikä lopputuloksilla ole tekijänoikeussuojaa.
Tekoäly ei saa tekijänoikeuksia tuotoksiinsa
Ainakaan vielä. Toistaiseksi maailmanlaajuiset tekijänoikeuskäytännöt ovat tässä asiassa selvät. Yksinoikeuksia voi syntyä vain oikeushenkilöille, eli joko ihmisille tai rekisteröidyille organisaatioille. Yksinoikeuksia ei synny eläimille, koneille, sattumalle tai tekoälyllekään.
Tietenkin pikkaisen haastavaa on se, että tekoälyn tuotokset alkavat olla yhä vaikeammin erotettavissa ihmisen tekemistä. Miksi ihmisen tekemä teksti on suojattu, mutta tekoäly tuottama vastaava teksti ei ole?
Toisaalta, samaa on aiemminkin mietitty. Modernin taiteen yksinoikeudet ovat välillä haastavia, jos taideteos koostuu punaisesta täplästä valkoisella taustalla. Eikö kukaan muu todella saa tehdä punaista täplää valkoisella taustalla, jos tuo taideteos on kerran saanut tekijänoikeussuojan?
No, voidaan kuitenkin toistaiseksi lähteä siitä, että tekoälyn tuotokset eivät ole tekijänoikeuden suojaamia. Toki jos ihminen on enemmän ohjaimissa ja tekoäly on tukiäly, voi ihminen saadakin yksinoikeudet lopputulokseen. Jos ihminen on tuonut ainutlaatuisen, omaperäisen, luovan osuutensa kokonaisuuteen, on tämä osa suojattu.
Saako tekoälyn kouluttaa netin sisällöillä?
Netin sisällöt ovat siis tekijänoikeuden suojaamia. Kaikenlainen tämän sisällön hyödyntäminen julkisesti ilman luvan kysymistä tekijältä on siis kiellettyä, ellei jokin lain pykälä tai muu lisenssi käyttöä salli.
Tässä on taustalla USAn fair use -periaate. Aikoinaan netin hakukoneiden kohdalla oli sama mietintä. Saako hakukone käydä läpi koko netin ja tarjota hakutuloksia? Fair use -periaatteen mukaan tämä todettiin sallituksi.
Käyttö on sallittua (”fair”) jos seuraavat kriteerit kokonaisarvioituna ovat reiluja:
- Käytön luonne, kuten sen kaupallisuus
- Teoksen luonne
- Aineistosta käytetty osuus
- Käytön vaikutus alkuperäisen teoksen markkina-arvoon.
Arviointi vaatii vähän miettimistä, mutta hakukoneen näkee hyvin olevan reilu. Se ei sinänsä vähennä netin sisältöjen arvoa, koska se nimenomaan ohjaa verkon käyttäjät kyseisen sisällön äärelle.
OpenAI ja muut ovat siis imuroineet netin sisäänsä ja kouluttaneet generatiivisia tekoälytyökaluja. Ne voivat tuottaa alkuperäisen teoksen kanssa kilpailevia tuotoksia ja pääasiassa tekevät alkuperäiset teokset vähemmän arvokkaiksi. Ei siis ole mitenkään selvää, että fair use -periaatteet toteutuvat.
Vastauksia tähän ei vielä ole. USAssa on useita oikeustapauksia käynnissä, joten odotellaan niitä. Loppupäätelmät voivat olla hyvin erilaisia tekstin, musiikin tai kuvien tuottamisen osalta. Periaatteessa kunkin kohdalla voidaan päätyä joihinkin seuraavista päätelmistä:
- On reilua, sai tehdä.
- Tekoälypalvelun tarjoajan on maksettava tekijänoikeusjärjestöille osuus myynnistä.
- Kielletään koko touhu ja perutaan palvelut.
- Annetaan tekijöille oikeus kieltää omien teosten käyttö tekoälyn koulutuksessa.
- Rajataan koulutusaineisto ainoastaan niille teoksille, joihin on erikseen annettu lupa.
Toisaalta, Pandoran lipas on jo auki. Vaikka tekoälypalveluja alettaisiin rajoittaa, muissa valtioissa sijaitsevat sekä yleensä lain ulkopuoliset toimijat ovat jo saaneet omat kopionsa malleista ja jatkavat niiden käyttöä säännöistä riippumatta.
Miten siis kannattaa nyt toimia?
Ehkä itse lähtisin siitä, että kovin arvokkaita tuotoksia en rakentaisi generatiivisen tekoälyn varaan, koska lakitilanne voi muuttua lähitulevaisuudessa ja ne omat tekoälyn höystämät tuotokset voivatkin muuttua lainvastaisiksi. Olen henkisesti valmistautunut vaihtamaan tämänkin artikkelin kuvan, mikäli tilanne sitä vaatii.