DeepSeek i Kinës lançon modelin e ri të inteligjencës artificiale V4. Ja gjithçka që duhet të dini ndërsa gara e AI përshpejtohet

Kompania kineze e inteligjencës artificiale DeepSeek ka zbuluar një pamje paraprake të modelit të saj të ri gjuhësor të madh, V4, ndërsa gara globale e inteligjencës artificiale po përparon.

DeepSeek u bë një nga kompanitë e inteligjencës artificiale më të vëzhguara vitin e kaluar, pasi lançoi modele në janar 2025 që dukeshin se ofronin performancë të fortë me kosto më të ulët se shumë rivalë amerikanë.

Startupi me seli në Hangzhou e lançoi modelin si DeepSeek V4-Pro dhe DeepSeek V4-Flash. V4-Pro është një model më i madh që synon detyra më të vështira, ndërsa V4-Flash është një version më i vogël i projektuar për t'u përgjigjur më shpejt dhe për të kushtuar më pak për t'u përdorur.

“Në standardet botërore të njohurive, DeepSeek V4-Pro kryeson ndjeshëm modelet e tjera me burim të hapur dhe tejkalohet vetëm pak nga modeli i nivelit të lartë me burim të mbyllur Gemini-3.1-Pro”, tha DeepSeek.

Kompania tha se modeli i ri i IA-së mbështet një "gjatësi konteksti prej një milion tokenësh", që do të thotë se mund të marrë kërkesa shumë më të mëdha, siç janë dokumente ose kod i gjatë, përpara se të prodhojë një përgjigje.

Në IA, gjatësia e kontekstit nënkupton sasinë e tekstit, të matur në tokena, që një model mund të marrë në konsideratë në të njëjtën kohë. Një dritare konteksti më e madhe i lejon një modeli të IA-së të përpunojë të dhëna më të gjata hyrëse dhe të përfshijë më shumë informacion në secilën dalje, sipas IBM .

“Mirë se vini në epokën e gjatësisë së kontekstit 1M me kosto efektive”, tha kompania në një njoftim në Hugging Face, një platformë IA me burim të hapur.

DeepSeek tha gjithashtu se V4 ofron "kontekst të gjatë lider në botë me kosto të reduktuara drastike të llogaritjes dhe memories".

DeepSeek e krahasoi V4-Pro me modelet rivale nga OpenAI, Anthropic dhe Google, megjithëse Gemini-3.1-Pro i Google shënoi më shumë në disa teste.

Modeli i ri mund të përdoret me agjentë të njohur të IA-së si Claude Code, OpenClaw dhe OpenCode, duke u lejuar zhvilluesve të përdorin modelin për detyra softuerësh jashtë chatbot-it të DeepSeek.

I njohur për qasjen e tij më të hapur sesa rivalët e tij me modele të mbyllura të inteligjencës artificiale, DeepSeek ka bërë gjithashtu të disponueshëm V4 për shkarkim, të testuar dhe të përshtatur falas në Hugging Face.

Startupi kinez tërhoqi vëmendjen në fund të vitit 2024 me modelin e tij me burim të hapur V3, i cili e befasoi industrinë e inteligjencës artificiale me performancë të fortë me një kosto më të ulët dhe duke përdorur çipa më pak të fuqishëm se shumë rivalë amerikanë, përfshirë OpenAI dhe Google.

Gara globale e inteligjencës artificiale

Kompania tërhoqi vëmendjen globale në janar 2025 kur publikoi R1, një model arsyetimi të inteligjencës artificiale që kompania pretendoi se ishte më i lirë dhe performonte po aq mirë sa modelet e mëdha gjuhësore të rivalit të OpenAI, ChatGPT.

Megjithatë, disa vende i ndaluan agjencitë qeveritare vitin e kaluar të përdorin DeepSeek, duke përfshirë Italinë, Shtetet e Bashkuara dhe Korenë e Jugut, duke përmendur shqetësime për sigurinë kombëtare.

Gjermania gjithashtu ndaloi DeepSeek në dyqanet e aplikacioneve Apple dhe Google në vitin 2025, duke përmendur transferimin e paligjshëm të të dhënave të përdoruesve në Kinë.

Publikimi i V4 vjen një ditë pasi gjigandi amerikan i inteligjencës artificiale OpenAI lançoi gjithashtu modelin e tij më të fundit të inteligjencës artificiale, GPT-5.5, të cilin e quajti "më i zgjuari dhe më intuitivi" deri më tani.

Publikimi i informacionit vjen gjithashtu një ditë pasi Shtëpia e Bardhë akuzoi Kinën për vjedhjen e IP-së së laboratorëve amerikanë të inteligjencës artificiale në një shkallë industriale duke përdorur mijëra llogari proxy.

OpenAI, Anthropic dhe Google paralajmëruan këtë vit se firmat kineze të inteligjencës artificiale, përfshirë DeepSeek, po kryenin sulme të nxjerrjes së modelit (MEA), të njohura ndryshe si "distilim".

Metoda i jep modelit më të madh mijëra pyetje, mbledh përgjigjet e tij dhe i përdor ato përgjigje për të mësuar një model të ri, më të vogël, të mendojë në të njëjtën mënyrë./ Euronews - Syri.Net