FOCUS ON

DeepSeek: il “caso” della piattaforma AI cinese

13 Febbraio 2025
DeepSeek TS-Way cover

Fra il 27 e il 28 gennaio la piattaforma AI cinese DeepSeek ha segnalato di essere oggetto di attacchi cyber che ne stavano riducendo le funzionalità. Per garantire la continuità del servizio, DeepSeek annunciava la temporanea limitazione delle registrazioni di nuove utenze. È stato ipotizzato che gli attacchi fossero di tipo DDoS e che avessero a che fare con la rapida ascesa in popolarità di un LLM (Large Language Model) che si presentava come “rivoluzionario”. In breve tempo, infatti, DeepSeek è stata capace di mettersi seriamente in competizione con le più potenti e più costose soluzioni occidentali e cinesi stesse. La notizia si sarebbe rivelata la punta di un iceberg globale.

La rapida ascesa di DeepSeek

DeepSeek è una start-up fondata nel 2023 dalla società cinese di trading azionario High-Flyer, che ne è tuttora la proprietaria. Entrambe le compagnie sono gestite da Liang Wenfeng, un quarentenne laureato all’università pubblica di Zhejiang che agli inizi della carriera veniva descritto come un nerd e che in seguito ha dimostrato una impressionante lungimiranza e grandi doti imprenditoriali. Già nel 2021 la High-Flyer aveva integrato l’intelligenza artificiale nelle proprie operazioni di analisi e trading del mercato finanziario. In quello stesso periodo Liang Wenfeng ha iniziato ad acquistare migliaia di unità di elaborazione grafica (GPU) di NVIDIA, essendo queste componenti la base hardware su cui si fonda la potenza di calcolo delle AI.

La serie di LLM

Il primo della serie di LLM  DeepSeek è stato messo a disposizione gratuita di ricercatori e utenti commerciali il 2 novembre 2023 e il relativo codice è stato reso open-source con la licenza MIT. Fra maggio e dicembre 2024 sono stati rilasciati i modelli V2, V2.5 e V3. Quest’ultimo, nei test di benchmark, ha superato le prestazioni di Llama 3.1 (Meta AI) e Qwen 2.5 (Alibaba) e si è avvicinato a GPT-4o (OpenAI) e Claude 2.5 Sonnet (Anthropic). Nel frattempo, il 20 novembre 2024 è stato reso accessibile in preview il nuovo modello R1. R1 avrebbe superato in prestazioni OpenAI o1 su benchmark come AIME (American Invitational Mathematics Examination) e MATH.

Il 10 gennaio 2025 è stata rilasciata la prima app chatbot gratuita di DeepSeek-V3 e il 20 gennaio è stata la volta di DeepSeek R1. Nell’arco di pochi giorni la piattaforma ha registrato un boom di iscrizioni, attirando l’attenzione di tutto il mondo.

Le basi dell’innovazione

L’innovazione che DeepSeek ha introdotto riguarda la possibilità di ottenere risultati pari e, in prospettiva, superiori a quelli degli altri LLM sfruttando meno hardware, sia in termini di quantità fisiche, sia in termini di potenziale. I tecnici cinesi avrebbero infatti ottimizzato l’uso di chip meno potenti dei modelli più recenti, come gli NVIDIA H800, dimostrando che è possibile ottenere prestazioni eccellenti anche con hardware limitato. Per ottimizzare l’architettura dei modelli, gli ingegneri di DeepSeek hanno escogitato una combinazione sinergica di tecnologie già note – MLA (Multi-head Latent Attention), MoE (Mixture-of-Experts) e Distillazione – che si caratterizzano per il principio della suddivisione dei compiti fra più modelli specializzati, più piccoli di quello generale, e per quello del frazionamento dei parametri del modello per ogni attività. Il che implica costi di produzione iniziale (circa sei milioni di dollari dichiarati) e di gestione considerevolmente più bassi rispetto ai concorrenti, oltre ad un impatto ambientale molto più contenuto.

Come funziona il chatbot

Gli utenti possono registrarsi a DeepSeek via browser o scaricando un’applicazione per Android o iPhone. Il suo funzionamento coniuga il LLM (i cui dati di training arrivano a luglio 2024) con un motore di ricerca in tempo reale. Inoltre, l’opzione DeepThinkR1 aggiunge la funzione “reasoning”, che produce una sorta di “flusso di coscienza” nel quale il chatbot spiega, passo passo, come è arrivato alla risposta e anche quali potrebbero essere le criticità della risposta stessa. Inoltre, viene fornita a margine una lista di fonti utilizzate. Le interlocuzioni possono avvenire in diverse lingue, fra cui anche l’italiano. La latenza fra domanda e risposta risulta leggermente più lunga rispetto agli altri modelli.

Censure interne?

Le straordinarie potenzialità tecniche si affiancano, tuttavia, ad altrettanto notevoli limitazioni che sembrano dovute all’inserimento di “guardrail”, cioè censure interne, su specifiche tematiche. Ad esempio, più fonti hanno riferito dell’impossibilità di ottenere risposte su vicende della recente storia interna cinese.

I rischi nella gestione dei dati

Il problema di maggior impatto sollevato in relazione a DeepSeek sembrerebbe essere quello della sicurezza dei dati.

Il 29 gennaio è stata denunciata da alcuni ricercatori l’esistenza di un database ClickHouse pubblicamente accessibile appartenente a DeepSeek. Il database contiene circa un milione di record, comprendenti cronologia delle chat, dati di backend e informazioni sensibili, inclusi flussi di log, segreti API e dettagli operativi. Tali informazioni possono essere sfruttate per prendere il pieno controllo dell’archivio e, potenzialmente, scalare i privilegi all’interno dell’ambiente DeepSeek, senza passare per alcuna autenticazione.

Anche in questo caso, l’esposizione del database è solo un aspetto limitato di una questione generale molto seria e preoccupante. DeepSeek, infatti, raccoglie i dati forniti direttamente dall’utente, ma anche quelli relativi alla sua attività su Internet o su altre reti, come indirizzo IP, identificatori univoci del dispositivo e cookie. Inoltre, si riserva di rilevare servizi di terze parti utilizzati per la registrazione. Tutti i dati possono essere condivisi con soggetti terzi o essere utilizzati per svolgere attività di pubblico interesse. Quest’ultimo passaggio va messo in relazione a un dato di fatto essenziale e potenzialmente aggravante: le informazioni processate da DeepSeek sono archiviate su server localizzati in Cina, dove il Governo ha facoltà per legge di disporre del loro contenuto.

L’Italia ha ufficialmente sollevato il problema della privacy. Nel dettaglio, Euroconsumers ha presentato un reclamo all’Autorità Garante per la protezione dei dati personali italiana in merito al modo in cui DeepSeek gestisce i dati personali in relazione al GDPR. Di conseguenza, l’Autorità di controllo ha inviato una richiesta a DeepSeek, dandole 20 giorni per rispondere. A poco meno di 24 ore dalla lettera italiana è stata spedita anche quella della DPA (Data Protection Commission) irlandese.

Al momento della scrittura di questo report l’app DeepSeek non era più disponibile sugli store italiani e il chatbot accessibile via browser non sembrava operativo.

L’impatto sull’economia e altre ripercussioni

Washington ha da tempo imposto restrizioni severe sull’esportazione di semiconduttori avanzati verso la Cina, cercando di soffocare lo sviluppo di modelli di AI competitivi. Tuttavia, poco prima delle restrizioni all’export imposte da Biden nel 2022, Liang Wenfeng aveva già acquistato un elevato volume di chip NVIDIA A100, consentendo al team di DeepSeek di costruire un’infrastruttura operativa.

L’inaspettato successo di DeepSeek ha generato una reazione a catena nei mercati finanziari globali, determinando per NVIDIA perdite nell’ordine delle centinaia di miliardi di dollari. Microsoft, Alphabet e Meta hanno visto riduzioni nel valore delle loro azioni, poiché gli investitori hanno temuto che la concorrenza cinese potesse erodere il vantaggio competitivo delle Big Tech occidentali. E anche il Nasdaq ha registrato un calo superiore al 3%, segnale di un’ondata di sfiducia nel settore tecnologico.

Nel frattempo, Microsoft, OpenAI e l’amministrazione Trump hanno avanzato concreti dubbi sull’originalità delle tecnologie AI di DeepSeek. In un’intervista a Fox News, l’attuale responsabile della tecnologia della Casa Bianca, David Sacks, ha dichiarato che esistono “prove sostanziali” dell’utilizzo da parte di DeepSeek dell’output dei modelli di OpenAI. Il caso resta apertissimo.


Focus On è una serie di approfondimenti su temi e dati analizzati dal team di esperti del Cyber Intelligence Operations Center di TS-Way.

Il Centro è diretto da analisti e ricercatori di sicurezza con competenze tecniche e investigative e un’esperienza riconosciuta in ambito internazionale.

Produce informazioni su una vasta gamma di minacce cibernetiche e eventi geopolitici consentendo alle organizzazioni di anticipare gli attacchi, comprenderne la portata, potendo contare su un partner affidabile in caso di incidente informatico.

Scopri di più sui nostri servizi di Threat Intelligence