DeepSeek: Kitajska inovacija, ki pretresa svet umetne inteligence

Umetna inteligenca [Foto: Freepik]

DeepSeek: Kitajska inovacija, ki pretresa svet umetne inteligence

    DeepSeek, kitajsko zagonsko podjetje, ki deluje na področju umetne inteligence, je v tehnološki industriji povzročilo nemalo razburjenja. Podjetje, ki je bilo ustanovljeno leta 2023, je s svojimi prelomnimi dosežki v umetni inteligenci presenetilo tako strokovnjake kot vlagatelje po vsem svetu. Njegov najnovejši model, imenovan DeepSeek R1, se ponaša z zmogljivostjo, ki je primerljiva z najboljšimi svetovnimi rešitvami, kot so modeli OpenAI ali Meta AI, vendar po bistveno nižjih stroških razvoja in uporabe.

    DeepSeek je ustanovil Liang Wenfeng, nekdanji vodja kvantitativnega hedge sklada High-Flyer, ki je prav tako temeljil na umetni inteligenci, piše Bloomberg Europe. Podjetje razvija odprtokodne modele umetne inteligence, kar omogoča skupnosti razvijalcev, da pregleduje in izboljšuje njegovo programsko opremo. Njegova mobilna aplikacija, predstavljena v začetku leta 2024, je hitro postala priljubljena in se povzpela na vrh lestvic prenosov za iPhone v ZDA.

    Glavna prednost DeepSeekove aplikacije je njena sposobnost artikuliranja utemeljitev, preden odgovori na vprašanje uporabnika. Poleg tega je model R1 zasnovan tako, da omogoča licenciranje posameznikom in podjetjem, ki želijo razvijati klepetalne robote z uporabo njegove tehnologije. To omogoča hitro prilagoditev na specifične potrebe in odpira vrata novim inovacijam.

    Primerjava z drugimi vodilnimi modeli

    DeepSeek R1 je že v prvih mesecih uporabe dokazal svojo zmogljivost na več vodilnih merilih uspešnosti, kot so AIME 2024 za matematične naloge, MMLU za splošno znanje in AlpacaEval 2.0 za uspešnost pri vprašanjih in odgovorih. Na lestvici Chatbot Arena, povezani z UC Berkeley, se uvršča med najboljše.

    Pomembna prednost DeepSeekovih modelov je njihova stroškovna učinkovitost. Stroški razvoja in usposabljanja modelov so bistveno nižji v primerjavi z vodilnimi podjetji, kot sta OpenAI in Meta Platforms Inc. To postavlja pod vprašaj potrebo po velikih kapitalskih vlaganjih v drago strojno opremo, kot so napredni polprevodniki podjetja Nvidia Corp. Ameriške omejitve izvoza naprednih tehnologij na Kitajsko, namenjene zaviranju njenega tehnološkega napredka, so s tem dobile nov kontekst, saj DeepSeek dokazuje, da je mogoče doseči visoko učinkovitost tudi z omejenimi sredstvi.

    Kaj vzbuja skrb v ZDA?

    Washington je že pred časom prepovedal izvoz vrhunskih polprevodnikov na Kitajsko, da bi zaustavil njen napredek na področju umetne inteligence. Kljub temu napredek DeepSeeka kaže, da so kitajski inženirji našli načine za obvladovanje teh omejitev. To potrjuje, da trgovinske omejitve niso bile povsem učinkovite pri zaviranju razvoja umetne inteligence na Kitajskem.

    DeepSeekov uspeh je vplival tudi na globalne finančne trge. Konec januarja 2024 so tehnološke delnice, vključno z Nvidio Corp. in ASML Holding NV, utrpele izgube zaradi povečane konkurence in negotovosti. Na drugi strani pa so delnice kitajskih podjetij, povezanih z DeepSeekom, kot je Iflytek Co., poskočile.

    Priljubljenost in svetovno zanimanje

    Mobilna aplikacija DeepSeek je do konca januarja 2024 zabeležila več kot 1,6 milijona prenosov, uvrstila pa se je na vrh lestvic v Avstraliji, Kanadi, ZDA, na Kitajskem, v Singapurju in Združenem kraljestvu. Marc Andreessen, eden izmed vodilnih vlagateljev v tehnološkem sektorju, je DeepSeek poimenoval “trenutek AI’s Sputnik,” kar dodatno potrjuje njegov globalni vpliv.

    Liang Wenfeng, ustanovitelj DeepSeeka, je v intervjuju za kitajski medij poudaril pomen razvijanja domačih virov za umetno inteligenco. Po njegovem mnenju omejitve pri dostopu do naprednih čipov ne bi smele zavirati inovacij. Njegova ekipa raziskovalcev, ki jo sestavljajo sveži diplomanti vrhunskih kitajskih univerz, dokazuje, da je mogoče ustvarjati preboje z omejenimi sredstvi.

    Pomanjkljivosti DeepSeeka

    Kljub izjemnim dosežkom se DeepSeek spopada z omejitvami. Tako kot drugi kitajski modeli umetne inteligence tudi DeepSeek samocenzurira občutljive teme, kot so dogodki na Trgu nebeškega miru ali vprašanja, povezana s Tajvanom. Poleg tega je njegova infrastruktura v oblaku že na preizkušnji zaradi velikega povpraševanja.

    Razvijalci po vsem svetu že eksperimentirajo z DeepSeekovo programsko opremo in jo uporabljajo za ustvarjanje novih orodij. To bi lahko pospešilo sprejetje naprednih modelov umetne inteligence, vendar hkrati sproža vprašanja o potrebi po strožjši regulaciji. Uspeh DeepSeeka bi lahko spodbudil tekmece, kot sta OpenAI in Meta, k znižanju cen in dodatnim inovacijam.

    DeepSeek tako predstavlja nov mejnik v globalnem razvoju umetne inteligence. Njegova sposobnost združevanja učinkovitosti in dostopnosti kaže na možnosti, ki bi lahko spremenile smer tehnološkega napredka, hkrati pa odpirajo nova vprašanja o prihodnosti industrije umetne inteligence.

    Portal24; Foto: Freepik