DeepSeek julkaisee pian uuden mallinsa
Kiinalainen tekoäly-yhtiö DeepSeek aikoo julkaista ensi viikolla uuden V4-kielimallinsa, yli vuosi edellisen suuren julkaisun jälkeen. Uutuus on monimodaalinen malli, joka pystyy tuottamaan tekstiä, kuvia ja videota.
Hangzhoussa toimiva DeepSeek on tehnyt yhteistyötä kiinalaisten siruvalmistajien Huawein ja Cambriconin kanssa optimoidakseen mallin niiden uusimmille tekoälysiruille. Tavoitteena on vähentää riippuvuutta yhdysvaltalaisista siruvalmistajista, erityisesti Nvidiasta, jonka tuotteisiin kohdistuu Yhdysvaltojen vientirajoituksia.
Julkaisu ajoittuu juuri ennen Kiinan parlamentin vuosittaista “Two Sessions” -kokousta, mikä voi vahvistaa DeepSeekin asemaa kansallisena tekoälymestarina.
Yhtiön edellinen merkittävä julkaisu oli R1-malli tammikuussa 2025. Tuolloin DeepSeek väitti rakentaneensa järjestelmän, joka kilpailee Piilaakson huippumallien kanssa murto-osalla laskentatehosta. Julkaisu aiheutti voimakkaita reaktioita Yhdysvaltain teknologiaosakkeissa.
V4:n odotetaan vauhdittavan siirtymää kiinalaisiin siruihin erityisesti niin sanotussa inferenssissä eli valmiiksi koulutettujen mallien ajamisessa. Koulutusvaiheessa Nvidia hallitsee edelleen markkinaa.
DeepSeekin odotetaan julkaisevan lyhyen teknisen katsauksen V4:n yhteydessä ja laajemman raportin myöhemmin.