LISSABON, Portugali – Tekniset jättiläiset investoivat yhä enemmän niin sanottujen “suvereenien” tekoälymallien kehittämiseen pyrkiessään lisäämään kilpailukykyä keskittymällä enemmän paikalliseen infrastruktuuriin.
Tietosuvereniteetilla tarkoitetaan ajatusta, että ihmisten tiedot tulisi tallentaa sen maan tai maanosan infrastruktuuriin, jossa he asuvat.
“Suvereeni tekoäly on suhteellisen uusi termi, joka on ilmaantunut noin viimeisen vuoden aikana”, Chris Gow, IT-verkkojätti Ciscon Brysselissä toimivan EU:n julkisen politiikan johtaja, kertoi CNBC:lle.
Tällä hetkellä monet suurimmista suurista kielimalleista (LLM), kuten OpenAI:n ChatGPT ja Anthropicin Claude, käyttävät Yhdysvalloissa sijaitsevia palvelinkeskuksia tietojen tallentamiseen ja pyyntöjen käsittelyyn pilven kautta.
Tämä on johtanut Euroopan poliitikkojen ja sääntelijöiden huoleen, koska he näkevät riippuvuuden Yhdysvaltain teknologiasta haitallisena maanosan kilpailukyvylle ja mikä huolestuttavammalta, teknologiselle kestävyydelle.
Mistä “AI-suvereniteetti” tuli?
Tietojen ja teknologisen itsemääräämisoikeuden käsite on aiemmin ollut Euroopan asialistalla. Se johtui osittain siitä, että yritykset reagoivat uusiin säädöksiin.
Esimerkiksi Euroopan unionin yleinen tietosuoja-asetus velvoittaa yrityksiä käsittelemään käyttäjätietoja turvallisella ja säännöstenmukaisella tavalla, joka kunnioittaa heidän oikeuttaan yksityisyyteen. EU:ssa kokeneet tapaukset ovat myös herättäneet epäilyksiä siitä, voidaanko Euroopan kansalaisia koskevia tietoja siirtää turvallisesti rajojen yli.
Euroopan yhteisöjen tuomioistuin mitätöi vuonna 2020 EU:n ja Yhdysvaltojen välisen tiedonjakokehyksen sillä perusteella, että sopimus ei tarjoa samaa suojan tasoa kuin EU:ssa yleisessä tietosuoja-asetuksessa (GDPR). Viime vuonna perustettiin EU:n ja Yhdysvaltojen välinen tietosuojakehys varmistaakseen, että tiedot voivat liikkua turvallisesti EU:n ja Yhdysvaltojen välillä.
Tämä poliittinen kehitys on viime kädessä johtanut ponnisteluihin kohti pilviinfrastruktuurin lokalisointia, jossa tietoja tallennetaan ja käsitellään monia verkkopalveluita varten.
Filippo Sanesi, OVHCloudin globaali markkinointi- ja operaatiopäällikkö, sanoi, että ranskalainen pilviyritys näkee paljon kysyntää Euroopassa sijaitsevalle infrastruktuurilleen, koska he “ymmärtävät arvon, joka on, että heidän tietonsa ovat Euroopassa, ja ne ovat eurooppalaisen lainsäädännön alaisia.”
“Kun tämä datan riippumattomuuden käsite kehittyy ja ihmiset ymmärtävät, mitä se tarkoittaa, näemme, että yhä useammat yritykset ymmärtävät, kuinka tärkeää on, että tietosi ovat paikallisesti ja tietyn lainkäyttövallan ja hallinnon alaisina”, Sanesi kertoi CNBC:lle. “Meillä on paljon dataa”, hän lisäsi. “Nämä tiedot ovat suvereenia tietyissä maissa, erityisten määräysten mukaisesti.”
“Nyt näiden tietojen avulla voit itse asiassa tehdä tuotteita ja palveluita tekoälylle, ja näiden palvelujen pitäisi sitten olla suvereeneja, paikallisten kykyjen on valvottava, otettava käyttöön ja kehitettävä niitä paikallisesti paikalliselle väestölle tai yrityksille.”
Sääntelyviranomaiset eivät ole johtaneet tekoälyn suvereniteetin painostusta – ainakaan vielä, Ciscon Gow’n mukaan. Pikemminkin se tulee yksityisiltä yrityksiltä, jotka avaavat Euroopassa lisää datakeskuksia – tiloja, jotka sisältävät valtavan määrän laskentalaitteita pilvipohjaisten tekoälytyökalujen mahdollistamiseksi, hän sanoi.
Suvereenia tekoälyä ohjaa “enemmän teollisuuden nimeäminen sillä tavalla kuin poliittisten päättäjien puolelta”, Gow sanoi. “Et näe” tekoälyn itsemääräämisoikeutta” -terminologiaa, jota käytetään sääntelijöiden puolella.
Maat ajavat ajatusta tekoälyn suvereniteetista, koska ne tunnustavat, että tekoäly on “tulevaisuus” ja “massivisesti strateginen teknologia”, Gow sanoi.
Hallitukset keskittyvät kotimaisten teknologiayritystensä ja ekosysteemiensä sekä AI-palveluita mahdollistavan kaiken tärkeän taustainfrastruktuurin vahvistamiseen.
“Tekoälyn työkuorma käyttää 20 kertaa enemmän kaistanleveyttä kuin perinteinen työmäärä”, Gow sanoi. Gow’n mukaan kyse on myös työvoiman mahdollistamisesta, koska yritykset tarvitsevat ammattitaitoisia työntekijöitä menestyäkseen.
Kaikkein tärkeintä on kuitenkin data. “Se, mitä näet, on melko vähän yrityksiä tuolta puolelta ajatella LLM:ien kouluttamista lokalisoidulla tiedolla, kielellä”, Gow sanoi.
“Heijastavat arvot”
Italiassa ensimmäinen erityisesti italian kielen dataan koulutettu LLM, nimeltään Italia 9B, lanseerattiin tänä kesänä.
Italia-projektin tavoitteena on tallentaa tuloksia tietylle lainkäyttöalueelle ja luottaa alueen kansalaisten tietoihin, jotta siellä olevien tekoälyjärjestelmien tuottamat tulokset perustuvat enemmän paikallisiin kieliin, kulttuuriin ja historiaan.
“Suvereeni tekoäly tarkoittaa organisaation arvojen heijastamista tai maata, jossa olet, sekä arvoja ja kieltä”, David Hogan, siruvalmistusjättiläisen yritysmyynnistä vastaava johtaja EMEA-alueella. Nvidiakertoi CNBC:lle.
“Ydinhaaste on, että useimmat nykyiset rajamalleista on koulutettu pääasiassa länsimaisen datan perusteella”, Hogan lisäsi.
Esimerkiksi Tanskassa, jossa Nvidia on vahvasti läsnä, viranomaiset ovat Hoganin mukaan huolissaan elintärkeistä palveluista, kuten terveydenhuollosta ja televiestinnästä, joita toimittavat tekoälyjärjestelmät, jotka eivät “heijasta” paikallista tanskalaista kulttuuria ja arvoja.
Tanska julkaisi keskiviikkona merkittävän valkoisen kirjan, jossa hahmotellaan, kuinka yritykset voivat käyttää tekoälyä tulevan EU:n tekoälylain – maailman ensimmäisen suuren tekoälylain – mukaisesti. Asiakirjan on tarkoitus toimia mallina muille EU-maille, joita seurata ja ottaa käyttöön.
“Jos olet Euroopan maassa, joka ei ole yksi suurimmista kansainvälisesti puhutuista kielimaista, luultavasti alle 2% tiedoista on koulutettu kielelläsi – saati sitten kulttuuristasi”, Hogan sanoi.
Kuinka sääntely ruokki ajattelutavan muutosta
Tämä ei tarkoita sitä, etteivätkö säännökset ole osoittautuneet tärkeäksi tekijäksi, joka saa teknologiajättiläiset ajattelemaan enemmän paikallisen tekoälyinfrastruktuurin rakentamista Euroopassa.
OVHCloudin Sanesi sanoi, että EU:n GDPR:n kaltaiset määräykset katalysoivat paljon kiinnostusta tietojen käsittelyn siirtämiseen tietyllä alueella.
Tekoälyn suvereniteetin käsite on myös saamassa sisäänostoa paikallisilta eurooppalaisilta teknologiayrityksiltä.
Aiemmin tällä viikolla Berliinin pääkonttorissa oleva hakukone Ecosia ja sen pariisilainen vertaiskumppani Qwant ilmoittivat yhteisyrityksestä kehittääkseen eurooppalaisen hakuindeksin tyhjästä. Sen tavoitteena on palvella parempia ranskan- ja saksankielisiä tuloksia.
Samaan aikaan ranskalainen teleoperaattori Oranssi on sanonut käyvänsä keskusteluja useiden perustavanlaatuisten tekoälymalliyritysten kanssa älypuhelinpohjaisen “suvereenin AI”-mallin rakentamisesta asiakkailleen, joka heijastaa tarkemmin heidän omaa kieltään ja kulttuuriaan.
“Omien LLM:ien rakentaminen ei olisi järkevää. Joten tällä hetkellä käydään paljon keskustelua siitä, kuinka teemme yhteistyötä olemassa olevien palveluntarjoajien kanssa tehdäksemme siitä paikallisempaa ja turvallisempaa?” Bruno Zerbib, Orangen teknologiajohtaja, kertoi CNBC:lle.
“Käyttötapauksia on paljon [AI data] voidaan käsitellä paikallisesti [on a phone] pilvikäsittelyn sijaan”, Zerbib lisäsi. Orange ei ole vielä valinnut kumppania näille suvereeneille tekoälymallin tavoitteille.