Impresa e Management

DeepSeek lancia il suo nuovo modello di intelligenza artificiale

La startup di Hongzhou lancia un aggiornamento a un anno dal rilascio del modello R1 e apre una nuova sfida a OpenAI e Anthropic

Scegli Moneta come fonte preferita

Guanto di sfida della cinese DeepSeek a OpenAI e Anthropic. La startup di Hangzhou ha lanciato le versioni di anteprima del suo modello di punta di intelligenza artificiale, descrivendolo come una delle piattaforme open-source più potenti disponibili. L’ingresso nel mercato del primo modello di DeepSeek un anno fa ha innescato una corsa all’intelligenza artificiale sul mercato cinese. I grandi gruppi tecnologici, da Alibaba a Baidu, si sono rincorsi per lanciare servizi low-cost alimentando una nuova tendenza nell’IA: quella sul prezzo. Per questo motivo le concorrenti tra cui ByteDance, Zhipu AI e MiniMax hanno aggiornato in fretta i propri modelli nelle settimane precedenti ad aprile, nel tentativo di anticipare le mosse della startup.

Una delle innovazioni principali è l’introduzione della Hybrid Attention Architecture, una tecnica che migliora la capacità del modello di mantenere il contesto nelle conversazioni prolungate e di gestire documenti molto lunghi. Il sistema consente infatti di elaborare prompt estesi, inclusi interi blocchi di codice o testi complessi, grazie a un contesto che può arrivare fino a circa un milione di token.

La serie V4

La presentazione ha riguardato la serie V4, nelle varianti Pro e Flash: la prima orientata alle massime prestazioni, la seconda più veloce ed economica. L’azienda ha vantato prestazioni superiori al modello GPT-5.2 di OpenAI, pur riconoscendo di essere in ritardo di circa 3-6 mesi rispetto ai modelli più avanzati.

I produttori cinesi di semiconduttori hanno guadagnato terreno in Borsa, sostenuti dall’ottimismo degli investitori sul nuovo modello, considerato un potenziale motore per la domanda interna di chip. In un post su WeChat, DeepSeek ha precisato che la capacità operativa della serie V4 Pro resta fortemente limitata, a causa della scarsità di risorse computazionali disponibili. La società prevede però una riduzione drastica dei costi dopo l’entrata in funzione, nella seconda metà dell’anno, di nuovi cluster di calcolo basati sui chip Ascend 950 sviluppati da Huawei Technologies. In questi giorni la startup è in trattativa con Tencent e Alibaba per il suo primo round di finanziamento.

Intanto le azioni di Semiconductor Manufacturing International Corp. , il principale produttore di chip di Huawei, hanno guadagnato fino al 9,4% a Hong Kong, mentre Hua Hong Semiconductor Ltd. ha registrato un’impennata di oltre il 13%. I titoli di società concorrenti come Knowledge Atlas Technology JSC Ltd. – o Zhipu – sono invece scesi dell’8%.

Le accuse degli Usa

Negli Stati Uniti alcuni esponenti del settore tecnologico e funzionari pubblici hanno sollevato dubbi sulle modalità con cui DeepSeek avrebbe sviluppato i propri modelli, ipotizzando l’uso di tecniche e componenti non conformi alle restrizioni vigenti. Al centro delle critiche c’è la cosiddetta distillazione, una pratica con cui un sistema di intelligenza artificiale viene addestrato utilizzando gli output di un altro modello, replicandone in parte le capacità. Sia OpenAI sia Anthropic hanno dichiarato di aver individuato segnali riconducibili a questo tipo di attività, una preoccupazione emersa già nelle settimane successive al lancio del modello R1. Un secondo fronte riguarda l’hardware. Le autorità statunitensi stanno verificando se la società abbia avuto accesso a chip avanzati per l’IA prodotti da Nvidia, la cui esportazione verso la Cina è soggetta a forti restrizioni.

Leggi anche: