DeepSeek pospešeno pripravlja naslednji model, imenovan R2

Umetna inteligenca [Foto: Freepik]

DeepSeek pospešeno pripravlja naslednji model, imenovan R2

Kitajsko zagonsko podjetje DeepSeek je v zadnjih mesecih močno pretreslo svetovne delniške trge in tehnološko industrijo. Prejšnji mesec je sprožilo razprodajo, vredno več kot bilijon dolarjev, z uvedbo cenovno ugodnega modela razmišljanja, ki je prekašal številne zahodne konkurente. Podjetje s sedežem v Hangzhouju zdaj pospešeno pripravlja naslednika svojega januarja predstavljenega modela R1, imenovanega R2, s ciljem utrditi svoj položaj na globalnem tehnološkem zemljevidu.

DeepSeekov vzpon ni le zgodba o tehnološkem preboju, temveč tudi o viziji ustanovitelja Lianga Wenfenga, ki je s svojo inovativnostjo in drugačnim pristopom k vodenju podjetja postal milijarder prek kvantitativnega hedge sklada High-Flyer.

Model R1: Preboj, ki je pretresel trg

DeepSeek je januarja letos predstavil model R1, ki je kljub uporabi manj zmogljivih čipov Nvidia dosegel zmogljivosti, primerljive z modeli ameriških tehnoloških velikanov, katerih razvoj je stal več sto milijard dolarjev, navaja Reuters. Ta cenovno ugoden pristop je sprožil val navdušenja med vlagatelji in hkrati šokiral konkurenco. R1 je postal simbol nove dobe, kjer visoka zmogljivost ni več odvisna od enormnih finančnih vložkov, temveč od pametne optimizacije virov.

Podjetje obljublja, da bo R2 še izboljšal kodiranje in omogočil razmišljanje v jezikih zunaj angleščine, kar bi lahko dodatno razširilo njegov vpliv. Čeprav DeepSeek ni razkril natančnih podrobnosti o časovnici izdaje R2, viri blizu podjetja pravijo, da je prvotni načrt za začetek maja zdaj pospešen, saj želijo čim prej izkoristiti trenutni zagon.

Uspeh R1 ni ostal neopažen. Vijayasimha Alilughatta, glavni operativni direktor indijskega tehnološkega podjetja Zensar, je izdajo R2 označil za potencialno ključni trenutek v industriji. Po njegovem mnenju bi DeepSeekov pristop lahko spodbudil globalna podjetja, da preusmerijo svoja prizadevanja in zmanjšajo odvisnost od peščice dominantnih igralcev. Medtem pa njegov vzpon vznemirja ameriško vlado, ki vodilni položaj na področju tehnologije vidi kot nacionalno prednost. Hkrati kitajska podjetja in oblasti vse bolj integrirajo DeepSeekove modele v svoje sisteme, kar nakazuje, da bi lahko R2 še okrepil tehnološko samozadostnost Kitajske.

Liang Wenfeng: Skromen vizionar z drugačnim pristopom

Za DeepSeekom stoji Liang Wenfeng, skrivnostna figura, ki je od julija 2024 izognila medijski pozornosti. Rojen leta 1985 v podeželski vasi v provinci Guangdong, je Liang diplomiral iz komunikacijskega inženirstva na prestižni univerzi Zhejiang. Njegova kariera se je začela v Šanghaju, kjer je vodil raziskovalni oddelek podjetja za pametno slikanje in že takrat pokazal svoj edinstven slog vodenja. Nekdanji šef Zhou Chaoen ga je opisal kot “skromnega in vase zaprtega”, a hkrati sposobnega privabiti vrhunske inženirje in spodbujati sproščeno delovno okolje.

Pri DeepSeeku in njegovi matični družbi High-Flyer je Liang zavestno zavračal rigidne prakse kitajskih tehnoloških velikanov, kot so dolgi delovniki in hierarhično upravljanje. Namesto tega je ustvaril kulturo sodelovanja, kjer so mladi talenti, vključno s pripravniki in diplomanti generacije Z, igrali ključno vlogo.

Nekdanji zaposleni, kot je 26-letni raziskovalec Benjamin Liu, delovno okolje opisujejo kot osvežujoče, z običajnim osemurnim delovnikom in pristopom, ki je dajal prednost kakovosti pred hitrostjo. Liang je pogosto delal neposredno z ekipo, se učil skupaj z njimi in jim dajal občutek lastništva nad projekti. Ta filozofija se je izkazala za ključno pri razvoju stroškovno učinkovitih modelov, ki so presegli pričakovanja.

High-Flyer, ki financira DeepSeek, je prav tako znan po velikodušnih plačah. Višji podatkovni znanstveniki lahko zaslužijo do 1,5 milijona juanov letno, kar močno presega povprečje konkurence.

Računalniška moč in strateške naložbe

Jedro DeepSeekovega uspeha leži v desetletju naložb High-Flyerja v raziskave in računalniške vire. Sklad je že zgodaj prepoznal potencial tehnologije in leta 2020 napovedal, da bo 70 % svojih prihodkov namenil razvoju, večinoma na področju raziskav. Med letoma 2020 in 2021 je High-Flyer investiralo 1,2 milijarde juanov v dve superračunalniški gruči, vključno z Fire-Flyer II, ki vključuje okoli 10.000 čipov Nvidia A100. Te naložbe so bile ključne, saj je ZDA leta 2022 prepovedala izvoz takšnih čipov na Kitajsko, DeepSeek pa je že imel vzpostavljeno infrastrukturo.

Ta prednost je pritegnila pozornost kitajskih regulatorjev, ki so sprva spraševali o namenu tako obsežne računalniške moči, a se niso odločili za poseg. Danes Peking DeepSeek slavi kot primer tehnološke neodvisnosti, hkrati pa mu je naročil, naj omeji stike z mediji, da bi se izognil nepotrebni mednarodni pozornosti. Nekdanji zaposleni poudarjajo, da je obsežna računalniška moč omogočila hitro eksperimentiranje in optimizacijo, kar je DeepSeeku dalo prednost pred konkurenti, ki so se zanašali na dražje arhitekture.

Globalni vpliv in kitajski objem

DeepSeekov vzpon ima širše posledice. Na Kitajskem so njegove modele sprejela številna podjetja in državne institucije, od energetskih družb do tehnoloških velikanov, kot so Lenovo, Baidu in Tencent. Državni mediji so Lianga povzdignili v simbol nacionalnega ponosa, njegova udeležba na srečanju s premierjem Li Qiangom januarja letos pa nakazuje močno podporo vlade. Kitajski voditelji vidijo DeepSeek kot ključni element v tekmi za tehnološko prevlado nad ZDA.

Medtem zahodni konkurenti prilagajajo strategije. OpenAI in Google sta znižala cene svojih modelov, kar kaže, da DeepSeekov pristop vpliva na celotno industrijo. Vendar pa nekateri zahodni opazovalci izražajo zaskrbljenost. DeepSeekovi modeli so bili v državah, kot sta Južna Koreja in Italija, odstranjeni iz trgovin z aplikacijami zaradi pomislekov glede zasebnosti, kar nakazuje, da bi njegov uspeh lahko sprožil dodatne omejitve, zlasti glede dostopa do naprednih čipov.

Liang sam priznava, da je embargo na vrhunske čipe največji izziv za prihodnost. Kljub temu njegova vizija ostaja jasna: graditi tehnologijo, ki je dostopna, učinkovita in neodvisna od zunanjega pritiska.

Portal24; Foto: Freepik