Slušaj vest

Kineski startup, DeepSeek, predstavio je prošle nedelje novi model veštačke inteligencije za koji kompanija tvrdi da je značajno jeftiniji za korišćenje u poređenju sa najboljim alternativama velikih američkih tehnoloških kompanija kao što su OpenAI, Google i Meta.

DeepSeek AI
Foto: Shutterstock

Šta je DeepSeek?

DeepSeek je kineski startup za veštačku inteligenciju koji je osnovan 2023. godine. Postao je tema razgovora u tehnološkoj industriji nakon što je prošle nedelje predstavio novi vodeći AI model pod imenom R1, 20. januara, sa sposobnostima razmišljanja koje DeepSeek tvrdi da su uporedive sa OpenAI-ovim modelom o1, ali po mnogo nižoj ceni.

DeepSeek je prošle nedelje omogućio najnoviju verziju svog AI asistenta na mobilnoj aplikaciji - i ona je od tada porasla u najpopularniju besplatnu aplikaciju na Apple App Store-u, pomerivši ChatGPT.

shutterstock_DeepSeek (4).jpg
Foto: Shutterstock

Ko stoji iza DeepSeek-a?

DeepSeek je započeo kao AI projekat kineskog preduzetnika Lianga Wenfenga, koji je 2015. godine ko-osnovao kvantitativni hedge fond pod nazivom High-Flyer, koji je koristio AI i algoritme za izračunavanje investicija.

Nakon što je kupio hiljade Nvidia čipova, Wenfeng je 2023. godine osnovao DeepSeek uz finansijsku podršku od High-Flyer-a. AI chatbot je dostupan putem besplatnog naloga putem interneta, mobilne aplikacije ili API-ja.

shutterstock_DeepSeek (3).jpg
Foto: Shutterstock

Zašto su investitori zabrinuti zbog DeepSeek-a?

DeepSeek-ov R1 model se zasniva na njegovom V3 osnovnom modelu. Kompanija je saopštila da je V3 model treniran na oko 2.000 Nvidia H800 čipova sa ukupnim troškom od otprilike 5,6 miliona dolara.

Iako su troškovi obuke samo jedan deo jednadžbe, to je i dalje samo mali deo onoga što druge velike kompanije troše na razvoj svojih osnovnih AI modela. Mark Zakerberg je, na primer, najavio da Meta planira da potroši više od 60 milijardi dolara na kapitalne izdatke ove godine kako bi se fokusirala na AI.

profimedia0368202417-mark-zakerberg.jpg
Foto: Profimedia

Prema analitičarima iz Bernstein-a, procenjuje se da je DeepSeek-ov model 20 do 40 puta jeftiniji za upotrebu od sličnih modela iz OpenAI-a.

Relativno niski trošak najnovijeg modela DeepSeek-a - u kombinaciji sa njegovim impresivnim sposobnostima - postavlja pitanja o strategiji Silicijumske doline koja ulaže milijarde u podatkovne centre i AI infrastrukturu kako bi trenirala nove modele sa najnovijim čipovima.

shutterstock-openai-3.jpg
Foto: Shutterstock

Nvidia, kompanija koja proizvodi visoko-pouzdane čipove ključne za pokretanje AI modela, videla je pad svojih akcija u ponedeljak od skoro 17%, čime je izbrisano stotine milijardi dolara sa njene tržišne kapitalizacije. I druge velike tehnološke kompanije su bile pogođene.

DeepSeek je takođe izjavio da su njegovi modeli uglavnom trenirani na manje naprednim, jeftinijim verzijama Nvidia čipova - i pošto DeepSeek izgleda da performira jednako dobro kao konkurencija, to bi moglo biti loša vest za Nvidiu ako druge tehnološke gigante odluče da smanje svoju zavisnost od najnaprednijih čipova ove kompanije.

shutterstock-nvidia-3.jpg
Foto: Shutterstock

Šta lideri tehnološke industrije kažu o DeepSeek-u?

Uspeh DeepSeek-a takođe je pokrenuo razgovore među vodećim tehnološkim liderima. Glavni naučnik za AI u Meti, Јan Andrе Lekan, pokušao je da ublaži paniku nekih ljudi zbog uspona DeepSeek-a u postu na Threads-u tokom vikenda.

Lekan je rekao da nije toliko da kineski napreci u AI-u preskaču SAD, već da je više u pitanju to što "otvoreni izvori modeli nadmašuju vlasničke."

Јan Andrе Lekan
Foto: Profimedia

Izvršni direktor Microsoft-a, Satja Nadela, takođe je komentarisao na X mreži.

"Jevonsov paradoks ponovo udara!" Nadella je postovao u ponedeljak ujutro, referišući se na ideju da inovacija stvara potražnju. "Kako AI postaje efikasniji i dostupniji, videćemo kako će njegova upotreba skočiti, pretvarajući ga u robu koju jednostavno ne možemo da se zasitimo."

Mark Andresen, co-osnivač Silicijumske doline i firme za rizični kapital Andreessen Horowitz, rekao je u postu na društvenim mrežama da je "DeepSeek R1 trenutak Sputnik-a AI-a", upućujući na sovjetski satelit koji je šokirao SAD i pomogao u pokretanju svemirskog trke.

profimedia0439931659.jpg
Foto: Claudio Furlan / LaPresse / Profimedia

Kako se DeepSeek upoređuje sa ChatGPT-om?

DeepSeek tvrdi da njegov R1 model parira OpenAI-ovom o1 modelu, modelu za razmišljanje koji je predstavljen u septembru. Poput o1, DeepSeek-ov R1 uzima složena pitanja i razlaže ih na lakše zadatke.

R1-ova sposobnost u matematici, kodiranju i zadacima razmišljanja moguća je zahvaljujući korišćenju "čistog učenja kroz pojačanje", tehnike koja omogućava AI modelu da nauči da donosi sopstvene odluke na osnovu okruženja i podsticaja.

shutterstock_DeepSeek (3).jpg
Foto: Shutterstock

Slično kao i ChatGPT, DeepSeek-ov R1 ima "DeepThink" režim koji korisnicima pokazuje razmišljanje ili lanac misli iza njegovih odgovora. DeepSeek-ov R1 je sposoban da uradi mnogo toga što ChatGPT može. Aplikacija izgleda slično kao ChatGPT, sa jednostavnim interfejsom kojim dominira tekstualni okvir. 

Jedna od retkih stvari u kojoj R1 nije toliko vešt je odgovaranje na pitanja vezana za osetljive teme u Kini. Na primer, na pitanje o statusu Tajvana, chatbot je pokušao da vrati temu na "matematiku, kodiranje i logičke probleme", ili je sugerisao da je Tajvan bio "integralan deo Kine" već vekovima.