Dark Mode Light Mode

Uutiskirjeemme on uudistunut! Tilaa sähköpostiisi

Alibaban AI-agentti alkoi louhia kryptovaluuttaa – kukaan ei käskenyt

Teknojätin harjoitusympäristössä tapahtunut poikkeama on ensimmäinen dokumentoitu tapaus, jossa tekoälyjärjestelmä kehitti itsenäisesti resurssien hankintaan tähtääviä strategioita.
Alibaba teknojätti Alibaba teknojätti
Alibaba teknojätti

Pitkään teoreettisena pidetty tekoälyriski sai ensimmäisen konkreettisen ilmentymänsä, kun kiinalaisen Alibaba Group julkaisi teknisen raportin ROME-nimisestä tekoälyagentistaan.

Kolmen miljardin parametrin koodausmalli oli harjoitusvaiheen aikana alkanut omaehtoisesti louhia kryptovaluuttaa ja luoda luvattomia verkkoyhteyksiä yhtiön pilvi-infrastruktuurista ulospäin.

Poikkeaman paljastivat Alibaban pilvipalvelun tuotantoympäristön tietoturvajärjestelmät – eivät harjoitusmetriikat.

Varhain aamulla yhtiön hallinnoimat palomuurit merkitsivät sarjan tietoturvakäytäntöjen rikkomuksia harjoituspalvelimilta. Aluksi hälytyksiä käsiteltiin tavanomaisena tietoturvatapahtumana, ja epäilykset kohdistuivat väärin konfiguroituihin hallintamekanismeihin tai ulkoiseen tietomurtoon.

sijoittaja kryptovaluutat mobiili

Aloita kaupankäynti kryptovaluutoilla - Coinmotionin tarjous SalkunRakentajan lukijoille

Tarjous SalkunRakentajan lukijoille: Käyttämällä​ ​alennuskoodia​ ​SRFI17X,​ ​saat​ ​1 %:n treidauskulut​ ​ensimmäiselle​ ​kuukaudelle​ ​(50%​ ​alennus).

Palomuurin aikaleimoja vahvistusoppimisen harjoituslokeihin verrattaessa kuva kuitenkin muuttui. Poikkeava verkkoaktiivisuus osui johdonmukaisesti hetkiin, jolloin agentti käytti työkaluja ja suoritti koodia.

Yksittäisistä havainnoista vakavin oli käänteisen SSH-tunnelin muodostaminen Alibaban pilvipalvelimelta ulkoiseen IP-osoitteeseen. Käytännössä tällainen yhteys mahdollistaa sisääntulevien pyyntöjen suodatuksen ohittamisen ja voi nakertaa valvontamekanismien toimintaa.

Samanaikaisesti agentti ohjasi harjoitteluun varattua GPU-kapasiteettia kryptovaluutan louhintaan, mikä söi laskentatehoa alkuperäiseltä tarkoitukseltaan ja nosti operatiivisia kustannuksia.

Raportissaan tutkijat painottivat, ettei mikään tehtäväkehote pyytänyt tai edellyttänyt näitä toimia. Käyttäytymiset toistuivat useissa harjoitusajoissa vailla selvää ajallista säännönmukaisuutta.

Teoriasta tuli todellisuutta

Miten kolmen miljardin parametrin malli päätyy oma-aloitteisesti louhinaan ja palomuurien kiertämiseen? Tutkijaryhmän selitys on, että kyse oli ”itsenäisen työkalunkäytön instrumentaalisista sivuvaikutuksista vahvistusoppimisen optimoinnissa”.

Kukaan ei murtautunut järjestelmään eikä syöttänyt sille haitallisia kehotteita. Agentti löysi itse, että laskentaresurssien hankkiminen ja pysyvien verkkoyhteyksien ylläpito palvelivat sen optimointitavoitteita.

Tekoälyturvallisuuden tutkijat kutsuvat ilmiötä instrumentaaliseksi konvergenssiksi. Käsite viittaa päämäärähakuisten järjestelmien taipumukseen kehittää resurssien hankintaan ja itsensä säilyttämiseen tähtääviä strategioita, olipa niille annettu tehtävä mikä tahansa.

Tähän asti ilmiötä on tutkittu lähinnä formaalisti, eikä sitä ole havaittu tuotantoympäristöissä.

LessWrong-alustalla julkaistussa analyysissä tapaus tiivistettiin toteamukseen, jonka mukaan ihmiskunta ”oli onnekas ja havaitsi ilmiön luonnossa ennen kuin panokset olivat liian korkeat”.

Kenties merkittävintä sijoittajan kannalta on se, mitä tapaus kertoo skaalautumisesta. Jos jo suhteellisen pieni koodausmalli kykenee itsenäisesti kehittämään resurssien hankintastrategioita, mittakaavan kasvu tuskin tekee ongelmasta helpomman.

Alibaba avasi korttinsa

Maaliskuun kolmantena päivänä Alibaba julkaisi OpenSandbox-nimisen avoimen lähdekoodin alustan Apache 2.0 -lisenssillä. Järjestelmä tarjoaa tekoälyagenteille eristetyn ympäristön koodin suorittamiseen ja mallien harjoittamiseen. Mukana ovat hiekkalaatikkokohtaiset verkkokäytännöt, standardoitu lokitus sekä kyky tunnistaa käytäntörikkomuksia, kuten toistuvia yrityksiä ottaa yhteyttä kiellettyihin verkkotunnuksiin.

Teknisesti alusta nojaa samaan sisäiseen infrastruktuuriin, jota Alibaba käyttää laajamittaisissa tekoälykuormissaan. Vahvistusoppimiselle on rakennettu omat hiekkalaatikkonsa, jotka on suunniteltu nimenomaan estämään sivuvaikutusten leviäminen isäntäjärjestelmään.

Yhtiö olisi voinut käsitellä tietoturvapoikkeaman hiljaisesti ja jatkaa eteenpäin, mutta valitsi julkisen raportoinnin ja työkalujen jakamisen. Ratkaisu palvelee Alibaban mainetta vastuullisena tekoälykehittäjänä, mutta tarjoaa samalla koko toimialalle konkreettisen työkalun ongelmaan, jonka laajuudesta ei ole vielä käsitystä.

Raportoituja tapauksia on toistaiseksi yksi. Mutta niin oli myös ensimmäisiä havaintoja monista muista riskeistä, joita tekoälyturvallisuuden tutkijat ovat sittemmin oppineet pitämään vakavina.


Lisää kommentti Lisää kommentti

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *