
Yhdysvalloissa suurimpiin teknojätteihin painottuvan Nasdaq 100:n indeksifutuurit ovat reippaassa yli kahden prosentin laskussa. Syynä on ilmeisesti kiinalainen tekoäly-yhtiö DeepSeek, joka esitteli päivitetyn tekoälymallinsa viime viikolla ja ilmoitti sen olevan kilpailukykyinen OpenAI:n teknologian kanssa.
Kohua DeepSeekin ympärillä aiheuttavat erityisesti viikonlopun aikana julkaissut raportit, joissa kerrottiin tuotteen olevan kustannustehokas ja toimivan heikompitasoisilla siruilla kuin mitä esimerkiksi amerikkalaiset OpenAI tai Googlen Gemini.
DeepSeekin tutkijat kirjoittivat viime kuussa julkaistussa artikkelissa, että DeepSeek koulutettiin Nvidian vanhemmilla ja vähemmän kehittyneillä H800-siruilla, ja tekoälymallin koulutuskustannukset olivat alle kuusi miljoonaa dollaria.
DeepSeek-tekoälysovelluksen kehittäjät kertovat sen olevan parhaimmistoa avoimen lähdekoodin mallien joukossa ja kilpailevan edistyneimpien suljetun lähdekoodin mallien kanssa maailmanlaajuisesti.
Vertailun vuoksi: OpenAI perustettiin 10 vuotta sitten, sillä on 4 500 työntekijää ja se on kerännyt 6,6 miljardia dollaria pääomaa, kun taas DeepSeek perustettiin alle kaksi vuotta sitten, sillä on 200 työntekijää, ja se kehitettiin alle 10 miljoonalla dollarilla.
DeepSeek horjuttaa yleisesti hyväksyttyjä käsityksiä Yhdysvaltain ylivoimasta tekoälyssä ja Washingtonin vientirajoitusten tehokkuudesta, jotka kohdistuvat Kiinan edistyneisiin siru- ja tekoälykykyihin.
DeepSeekin tuote on “syvästi ongelmallinen sille oletukselle, että Silicon Valley on tehnyt merkittäviä pääomakuluja ja operatiivisia investointeja tekoälytrendiä varten, ja että tämä olisi oikea lähestymistapa”, toteaa uutistoimisto Bloombergille Nirgunan Tiruchelvam, kuluttaja- ja internetsektorin johtaja singaporelaisessa Aletheia Capitalissa.
”Se kyseenalaistaa ne valtavat resurssit, jotka on omistettu tekoälylle”, hän kertoo.
China has created one of the world’s best AI models for only $6 million, as opposed to the billions spent by Facebook, Google, Microsoft etc.
— ADAM (@AdameMedia) January 24, 2025
And DeepSeek is open-sourced, while the US models are proprietary and secretive—exposing the West’s bloated, profit-driven approach to… pic.twitter.com/jzpQd3ZXbl
Huippusirut Kiinan ulottumattomissa
DeepSeekin taustalla olevasta yrityksestä tiedetään vähän. Uutistoimisto Reutersin mukaan yritys on pieni Kiinan Hangzhoussa toimiva startup, joka perustettiin vuonna 2023 samaan aikaan, kun hakukonejätti Baidu julkaisi ensimmäisen kiinalaisen suuren kielimallin.
Sen jälkeen kymmenet kiinalaiset teknologiayritykset ovat julkaisseet omia tekoälymallejaan, mutta DeepSeek on ensimmäinen, jota Yhdysvaltain teknologiayhteisö on ylistänyt suorituskyvyltään vastaavaksi tai jopa paremmaksi kuin huipputason yhdysvaltalaiset mallit.
Kiinan tekoälyteknologian on aiemmin ajateltu olevan vuosia jäljessä Yhdysvalloista. Washingtonin kaupparajoitukset ovat pitäneet uusimmat huippusirut Kiinan ulottumattomissa, mutta DeepSeekin malli on rakennettu avoimen lähdekoodin teknologialla.
Lisää mielenkiintoa kiinalaisyhtiötä kohtaan aiheuttanee myös se, että DeepSeekin tekoälyavustaja ohitti maanantaina kilpailijansa ChatGPT:n ja nousi Yhdysvaltain Applen App Storen korkeimmin arvioiduksi ilmaiseksi sovellukseksi.
”DeepSeekillä ei selvästikään ole käytössään yhtä paljon laskentatehoa kuin Yhdysvaltain hyperskaalaajilla, mutta se on jotenkin onnistunut kehittämään mallin, joka vaikuttaa erittäin kilpailukykyiseltä,” toteaa Raymond Jamesin analyytikko Srini Pajjuri sunnuntaina julkaistussa raportissa.
Mitä DeepSeek tarkoittaa suurten teknojättien tulevaisuudelle?
DeepSeek herättää huolta suurten teknologiayhtiöiden tekoälymalleihin ja datakeskuksiin tekemien valtavien investointien järkevyydestä.
Vaikka markkinoilla ensireaktiot näyttävät olevan sen suuntaisia, että DeepSeekistä on tulossa uhka amerikkalaisille teknojäteille, on johtopäätösten tekeminen vielä ennenaikaista.
Pajjurin mukaan luonnollinen kysymys kuuluu: miten DeepSeekin esiinmarssi vaikuttaa laskentaintensiteetin kasvuun ja laitteiston sekä puolijohteiden kysyntään?
Ekonomisti Ed Yardeni epäilee, että DeepSeekin esiinmarssi voi olla huono uutinen mahtiseitsikon yrityksille, jotka suunnittelivat hallitsevansa tekoälymarkkinoita kalliilla tekoälypalveluillaan.
”Kysymys kuuluu, pettävätkö heidän odotuksensa, koska heidän tekoälyyn liittyvät pääomakustannuksensa kasvavat nopeammin kuin heidän tulonsa. Tämä voisi kaventaa heidän yhteistä voittomarginaaliaan”, Yardeni toteaa.
Toisaalta DeepSeek saattaa vain kasvattaa entisestään Yhdysvaltain hyperskaalaajille paineita hyödyntää avainetuaan – eli pääsyä Nvidian kehittyneisiin siruihin – erottautuakseen halvemmista vaihtoehdoista.
Nvidian osalta uuden sukupolven Blackwell (H200) -tekoälysirujen tuotannon lisääminen vuonna 2025 on ollut keskeinen ilmiö tekoälymarkkinoilla.
Tekoälytrendi on tähän mennessä nojannut pääasiassa suuriin kielimalleihin (LLM), jotka vaativat valtavia määriä dataa koulutusta varten. Suuret kielimallit mahdollistavat sen, että käyttäjät voivat olla vuorovaikutuksessa tekoälyjärjestelmien kanssa ilman, että heidän tarvitsee kirjoittaa algoritmeja.
Avoimen lähdekoodin mallien, jotka ovat kehittäjille ilmaisia, kyvykkyydet ovat kehittyneet nopeasti, ja Meta on noussut niiden johtavaksi puolestapuhujaksi.