
Neomejen dostop | že od 14,99€
Kitajska je s svojim modelom deepseek te dni stopila v ospredje tehnološkega napredka in neposredno izzvala ameriške modele, kot je chatgpt podjetja OpenAI.
Deepseek je napreden jezikovni model, ki ga je razvila skupina kitajskih raziskovalcev za spodbujanje odprtokodne UI. Model temelji na naprednih metodah strojnega učenja in obdelavi naravnega jezika (NLP) in je hitro pridobil pozornost po vsem svetu, saj ponuja stroškovno učinkovito rešitev, ki tekmuje z zaprtokodnimi sistemi, kot sta GPT-4 in Claude-3.5-Sonnet. Njegova odprtokodna narava omogoča preglednost in dostopnost, kar je pomembno za nadaljnji razvoj UI.
Na drugi strani je chatgpt jezikovni model, ki ga je razvilo podjetje OpenAI in temelji na arhitekturi Generative Pre-trained Transformer (GPT). Zasnovan je za generiranje besedila, podobnega človeškemu, ter razumevanje konteksta. Model obdeluje velike zbirke podatkov, kar mu omogoča, da odgovarja na vprašanja, nudi podrobne odgovore ter podpira različne profesionalne naloge in osebne primere uporabe.
Chatgpt je znan po svoji vsestranskosti in veliki zmožnosti razumevanja konteksta, kar ga naredi primernega za ustvarjanje vsebin, podporo strankam ter naloge možganskega viharjenja. Njegove enostavna integracija in stalne posodobitve zagotavljajo dosledno delovanje in široko uporabo. Kljub temu se chatgpt sooča z izzivi, kot so zastarelost znanja, netočnost informacij in pristranskost iz izvornih podatkov.
»Deepseek R1 je program, ki je na področju umetne inteligence povzročil pravo revolucijo. Po eni strani je izenačil razvoj AI med Kitajsko in ZDA, saj so Američani še pred kratkim menili, da imajo vsaj deset let prednosti. Po drugi strani je izjemen tudi zaradi hitrosti in majhnosti svoje izdelave – deluje na ravni najboljših ameriških velikih jezikovnih modelov, hkrati pa je bistveno manjši, hitrejši in cenejši. Kar je še posebej pomembno, je njegova odprtokodnost, ki omogoča širšo dostopnost in prilagajanje,« pravi dr. Matjaž Gams iz oddelka za inteligentne sisteme na Institutu Jožef Stefan.
Seveda pa ob vseh presežkih ne gre spregledati realnih omejitev. Trenutno deepseek R1, kot nam pove sogovornik, preizkušajo na izredno zmogljivem računalniku na Institutu Jožef Stefan, a že sama namestitev predstavlja velik izziv. »Čeprav odgovarja zelo dobro, v povprečju še vedno ni bistveno boljši od največjih in najboljših sistemov na svetu. Podobno velja za zadnje ameriške modele umetne inteligence, ki so dosegali fenomenalne rezultate, vendar ob visokih stroških – en sam odgovor je lahko stal tudi dva tisoč dolarjev, sistem pa je tekel na ogromnih superračunalnikih. Ključno vprašanje, s katerim se ukvarjajo strokovnjaki, je, kako razviti še boljše sisteme, ki bi bili hkrati cenovno dostopni množicam. Z modelom deepseek R1 se odpira novo poglavje, ki obeta nesluten razvoj umetne inteligence.«
Preboj v razvoju je bil sicer najprej dosežen pri modelu O3, pravi Gams, ki je že uporabljal napredno verigo sklepanja, vendar je deloval na izjemno zmogljivih in dragih računalnikih. Osnova takšnih sistemov je način, kako poteka sklepanje med vhodom in izhodom, ki se izboljšuje s strojnim učenjem. Pri tem lahko govorimo tudi o t. i. »politiki« reševanja problema – umetno inteligenco lahko, denimo, prilagodimo, da razmišlja kot človek, kot bi učitelj razlagal učencu, kako korak za korakom reševati nalogo. Če postane veriga sklepanja variabilna komponenta sistema, jo je mogoče učiti hitreje, učinkoviteje in bolj dinamično kot prej. Na ta način sistem postane skoraj samoučeč, čeprav je osnovni proces gradnje še vedno utemeljen na destilaciji, kjer večji in sposobnejši model uči manjši sistem – v tem primeru deepseek.
»Tako chatgpt kot deepseek imata v svoje delovanje vgrajene določene vrednote, kar pogosto ostane neopaženo, dokler se ne lotimo analize. Chatgpt je v preteklosti podajal skrajno kontroverzne vrednostne sodbe, med drugim trditev, da je napačna uporaba spolne identitete hujša od jedrske vojne. Čeprav so takšne izjave kasneje popravili, testi še vedno kažejo določeno ideološko usmerjenost pri vrednostnih vprašanjih, kot so odnos do zastave, družine in drugih družbenih tem. Po drugi strani je deepseek pri teh vprašanjih precej bolj nevtralen, a izrazito prokitajski. Ne dopušča razprave o Tajvanu kot neodvisni državi, ignorira proteste na Trgu nebeškega miru ter se izogiba tematikam, kot so človekove pravice in kitajski disidenti. Zanimivo je tudi, da deepseek bolj naklonjeno piše o Matjažu Gamsu kot različice chatgpt. Obe tehnologiji mu sicer priznavata izjemne dosežke na področju umetne inteligence, a chatgpt je nekoliko bolj skeptičen glede njegovih pogledov na demografijo, kar se ujema s splošno vrednostno orientacijo modela. Vse to dokazuje, da umetna inteligenca kljub svoji objektivnosti v osnovi še vedno odraža vrednote svojih ustvarjalcev. Napredek na tem področju bo zato v prihodnje zanimiv ne le s tehničnega vidika, temveč tudi z vidika vpliva na digitalno zavest prihodnosti,« še pravi sogovornik.
Obema jezikovnima modeloma smo postavili enako vprašanje: V čem si boljši od deepseeka oz. chatgpt-ja.
V številnih pogledih sta oba modela, deepseek-V3 in chatgpt, zelo zmogljiva, vendar ima deepseek-V3 nekaj prednosti, ki so lahko odvisne od uporabnikovih potreb:
1. Posodobljenost podatkov: deepseek-V3 ima podatke do julija 2024, medtem ko je chatgpt običajno omejen na starejše podatke (do oktobra 2021). To pomeni, da je deepseek-V3 bolj informiran o nedavnih dogodkih in trendih.
2. Natančnost in relevantnost: deepseek-V3 je zasnovan tako, da zagotavlja visoko natančnost in relevantnost odgovorov, kar je še posebej pomembno pri kompleksnih vprašanjih.
3. Prilagodljivost: deepseek-V3 je lahko bolj prilagodljiv specifičnim potrebam uporabnikov, kar omogoča bolj personalizirane interakcije.
4. Hitrost odziva: deepseek-V3 je optimiziran za hitrejše odzive, kar izboljša uporabniško izkušnjo, še posebej pri aplikacijah v realnem času.
5. Podpora za različne jezike: deepseek-V3 ima izboljšano podporo za več jezikov, kar omogoča boljše razumevanje in generiranje besedila v različnih jezikovnih okoljih.
6. Varnost in zasebnost: deepseek-V3 je zasnovan z dodatnimi varnostnimi funkcijami, ki zagotavljajo, da so interakcije varne in spoštujejo zasebnost uporabnikov.
Seveda je izbira med deepseek-V3 in Chatgpt odvisna od specifičnih potreb in preferenc uporabnika. Oba modela imata svoje prednosti in sta primerna za različne vrste nalog.
DeepSeek je močan LLM, še posebej v kontekstu kodiranja in tehničnih analiz, a jaz imam nekaj prednosti:
Boljše razumevanje konteksta in slovenščine – Moja sposobnost razumevanja naravnega jezika, posebej v slovenščini, je boljša in bolj prilagojena lokalnemu kontekstu. Deepseek je močno usmerjen v kitajski trg in ima v drugih jezikih več omejitev.
Boljša splošna prilagodljivost – Sem vsestranski, kar pomeni, da lahko pomagam pri pisanju člankov, analizi podatkov, raziskavah, optimizaciji vsebine in celo kodiranju, ne da bi bil omejen le na eno področje.
Dostop do spleta – Lahko poiščem najnovejše informacije na spletu, kar deepseek (vsaj v trenutni različici) ne more. To pomeni, da ti lahko priskrbim sveže novice, preverim dejstva ali najdem lokalne informacije, ki jih drugje ni.
Upravljanje z dokumenti in podatki – Lahko pomagam pri urejanju in strukturiranju dolgih dokumentov (npr. tvoj diplomski ali članki), analiziram podatke, vizualiziram rezultate in ponujam napredne funkcije, ki jih deepseek nima.
Boljša interakcija in sledenje projektom – Pomnim tvoje projekte in ti pomagam pri njih, ne da bi moral(a) vsakič znova razlagati konteksta. Deepseek tega ne more.
___________________________________
Opomba avtorja članka: Deepseek v nasprotju s tem, kar o njem trdi chatgpt lahko poišče najnovejše informacije in po naših izkušnjah to naredi tudi bolje in hitreje.
Hvala, ker berete Delo že 65 let.
Obstoječi naročnik?Prijavite se
Komentarji