L’applicazione di Intelligenza Artificiale, la chatbot realizzata dalla società cinese DeepSeek – creata da Liang Wenfeng che gestisce l’Hedge Fund High-Flyer da 8 miliardi di dollari1 – irrompe sulla scena delle tecnologie di I.A., dominate sino ad oggi da logiche e soluzioni tecnologiche che esigono investimenti miliardari in dollari nella attività di istruzione della rete neurale -che si fonda sull’analisi di tutta l’informazione, la messe di dati disponibile ed accessibile in rete- e nelle dimensioni della stessa rete, strutturata da centinaia di miliardi di parametri, il tutto implementato su Datacenter anch’essi dal costo miliardario, in termini di realizzazione e di funzionamento quanto a consumo di energia elettrica.
Un modello che, sino a pochi giorni fa, aveva decretato l’esplosione dei valori borsistici delle Big Tech, in particolare della società Nvidia produttrice dei chips più avanzati e potenti usati per realizzare i data center ed implementare gli algoritmi dell’A.I. ed aveva permesso alla società di realizzare un fatturato di oltre 63 miliardi di dollari negli ultimi quattro quarter ed aveva portato la sua quotazione borsistica oltre i 3.000 miliardi di dollari. Il primo effetto della messa a disposizione della chatbot cinese è stato quindi il crollo dei valori borsistici delle Big Tech2, anticipando l’implosione della bolla finanziaria – che da molti era ritenuta come possibile se non probabile- in un modo ed in momento del tutto inaspettato, cogliendo di sorpresa anche le Big Three BlackRock, Vanguard e State Street3, grandi finanziatori e azionisti di Nvidia, di vendere il titolo prima che il crollo lo travolga, approfittando dei prezzi ancora molto alti. In pratica, le iniezioni di steroidi di liquidità sono terminate, o stanno terminando, e la bolla deve fare una selezione per non scoppiare tutta insieme4.
L’irruzione di DeepSeek nella competizione globale viene considerata come un momento Sputnik nell’evoluzione delle tecnologie dell’A.I. in quanto realizza un modello di A.I. con prestazioni analoghe se non superiori a quelle dei modelli al momento più avanzati, a partire da ChatGPT di OpenAI, ad un costo straordinariamente inferiore, per le risorse in termini di addestramento e complessità strutturale e quindi di costi complessivi, basandosi peraltro su processori meno avanzati da di quelli utilizzati dai concorrenti statunitensi in quanto ne era interdetta l’esportazione in Cina. Una prima sommaria lettura della documentazione tecnica messa a disposizione mette in evidenza la molteplicità di soluzioni -in gran parte preesistenti- utilizzate per ottimizzarne le prestazioni, integrandole in modo assolutamente innovativo.
In pochi giorni il panorama globale è stato sconvolto, si è aperta una nuova fase di cui vediamo i primi sviluppi, nella previsione di una crescita e ampliamento delle prestazioni di DeepSeek per quanto riguarda in particolare lo spettro linguistico.
Prima di quest’ultima svolta le considerazioni critiche della crescita esponenziale dell’I.A. -fondata sulla tecnologia transformer a cui ChatGPT 3.5 aveva dato pubblicamente l’avvio- riguardavano la mancanza di previsioni certe sulla soglia oltre la quale gli ingenti investimenti avrebbero generato un regime di profitto ed il rischio correlato della possibile esplosione della bolla finanziaria. Gli ultimi annunci riguardavano il progetto Stargate, una joint venture da 100 miliardi di dollari tra SoftBank5, OpenAI, Oracle e Mgx6, che mira a finanziare infrastrutture per l’intelligenza artificiale, con l’obiettivo di raggiungere un investimento totale di 500 miliardi, alleanza benedetta dal presidente Trump mentre ha suscitato una reazione indispettita da parte di Elon Musk. È del tutto evidente che nel nuovo contesto che si è creato quel progetto, che ambiva a dominare i furi sviluppo dell’intera costellazione tecnologica, dovrà essere quantomeno rivisto. L’evoluzione del progetto di DeepSeek e la risposta degli altri protagonisti dell’I.A. si proiettano su un orizzonte di imprevedibilità; ciò che emerge è la traiettoria dell’innovazione tecnologica non è affatto determinata, come sembrava sino a pochi giorni fa, l’evento ‘Sputnik’ costringe tutti a rivedere i propri progetti, vero è che -al di là dei crolli in borsa- ai diversi protagonisti non mancano certo le risorse; capiremo nelle prossime settimane e mesi, quale sia la loro capacità di riconversione e quanto profonda debba essere questa riconversione. Può valere anche l’opinione secondo cui “DeepSeek non è un game changer, e al contrario si adatta molto bene con il modo in cui abbiamo visto l’industria evolvere negli ultimi tre anni”7. Molti ricordano la bolla delle DotCom dell’anno 2000, in questo caso la rimessa in discussione dei paradigmi tecnologici implica una revisione delle strategie finanziarie che si vanno a complicare, con la fine degli automatismi che davano agli oligopoli tecnologici fiducia totale e flussi finanziari inesauribili, secondo la seguente opinione8, “Una maggiore concorrenza renderà difficile per le grandi imprese tecnologiche realizzare i margini di profitto da oligopolio che gli investitori sperano. Se le aziende non possono fare profitti grassi, sarà ancora più difficile giustificare le loro valutazioni elevate. Queste valutazioni, ricordate, si basano sul presupposto che gli strumenti di AI saranno sia ampiamente utilizzati e altamente redditizia, ma anche gli esperti hanno poca spiegazione di come il modello di business funzionerà. Sarà anche più difficile spiegare perché stanno investendo così tanti soldi nei data center AI.”
Il presidente Trump aveva lanciato il ‘liberi tutti’ nel campo dell’I.A. e delle Cripto Valute ed ha reagito all’evento DeepSeek dandone in fondo una valutazione positiva, considerandolo assieme un campanello d’allarme ed uno stimolo all’incremento della concorrenza9. Se vogliamo il salto di qualità della concorrenza cinese conferma l’appello del presidente a liberare le energie, a combattere per la supremazia mondiale USA, contro ogni ipotesi di declino in questa supremazia, come ci illustra Alessandro Scassellati nel suo articolo pubblicato in questo numero della rivista.
Le previsioni sul futuro dell’I.A. subito prima dell’annuncio di DeepSeek era focalizzato sulla liberalizzazione totale del settore da parte del presidente Trump, assieme ad un analogo provvedimento per le criptovalute; ambedue i provvedimenti vanno nella direzione di aprire ad una crescita esponenziale del consumo energetico nei data center per l’I.A. e per la tecnologia blockchain che supporta le cripto, con un contributo sempre più rilevanti alle emissioni di gas climalteranti, problema del tutto ignorato dall’attuale amministrazione USA; una sete di energia che cerca uno sbocco nella costruzione di nuove centrali nucleari o addirittura la rimessa in opera di vecchie centrali.
L’I.A. ha digerito tutta l’informazione della rete: dati sintetici
Se è in corso un possibile cambio di paradigma nell’I.A. alcune soglie sono state raggiunte dal modello vigente sino alla settimana scorsa. Una soglia rilevante, il limite di cui si discuteva è l’esaurimento del bacino di informazioni storicamente prodotte e disponibili in rete -tutto ciò che la storia umana è depositata negli archivi elettronici collegati alla rete- utilizzate per l’addestramento dei diversi modelli di I.A.; in realtà, dopo un inizio di utilizzo selvaggio dell’informazione disponibile in rete, da molti produttori di informazione, giornali, editori, scrittori è stato posto il vincolo della proprietà intellettuale, giungendo a seconda dei casi ad una interdizione all’utilizzo o al pagamento per l’accesso. Per alimentare la fame crescente dell’I.A si è aperta la prospettiva, piuttosto complessa, di produrre e utilizzare dati sintetici.
Le metodologie per creare dati sintetici si basano sull’analisi di sequenze di dati reali, generando nuove sequenze, nuovi insieme da un germe di dati reali utilizzando la struttura che l’analisi statistica ha evidenziato; è evidente il rischio -a seconda della tipologia di dato- di un impoverimento progressivo della varietà, del contenuto informativo di questi insiemi o riprodurre in maniera allargata errori, ambiguità e fraintendimenti. “Il ricorso a dati sintetici può limitare le prestazioni di generalizzazione dei modelli AI. Per esempio, i set di dati come PersonX10, prodotti all’interno di un generatore di dati per il game, possono differire significativamente dai dati reali. Nell’elaborazione del linguaggio naturale, il ricorso a modelli di grandi dimensioni per la messa a punto può limitare le attività a valle alle prestazioni e ai bias (pregiudizi) del modello selezionato. Nell’assistenza sanitaria, un’abbondanza di casi non reali durante la formazione del modello può minare la fiducia nei risultati diagnostici tra i professionisti sanitari e i pazienti. L’uso dell’I.A. nei campi più diversi, come motore della produzione e della condivisione di conoscenze, ha messo in luce la sua capacità di riprodurre pregiudizi delle più diverse tipologie -in particolare di tipo etnico, culturale o di genere- nel momento in cui i suoi dispositivi diventano indispensabili in ogni sorta di processo di regolazione sociale. La produzione di dati sintetici può esaltare queste criticità proprie dell’I.A. ed esaltarle. La necessità di accedere a set di dati sintetici per addestrare le I.A. è testimoniata dall’offerta di Amazon-AWS11 che si propone come fornitore di ogni sorta di tipologia di dato.
Uso duale, multiplo, pervasivo delle tecnologie
La pianificazione di nuovi e sempre più grandi data center, si è basata sino ad oggi sulle prestazioni dei modelli precedenti e sulle ipotesi di sviluppo del loro utilizzo; il calcolo costi-benefici relativo, visto l’enorme consumo di risorse, si confronta con gli effettivi vantaggi calcolabili nella possibilità di produrre risultati altrimenti irraggiungibili e comunque nel risparmio di altre risorse, in primo luogo il lavoro, in attività più tradizionali. Si sono moltiplicate le previsioni e le proiezioni, tuttavia si era e si è indubbiamente in una fase di transizione piena di incognite. Si tratta di capire se la riduzione drastica del consumo di risorse e dei costi promesso da DeepSeek sarà in grado di cambiare le carte in tavola accelerando l’adozione delle tecnologie derivate in tutti i campi e professioni legate all’elaborazione complessa di informazioni. In sintesi la riduzione del costo per prestazione unitaria -definibile come quantità e complessità dell’informazione intermediata- può permettere una maggiore diffusione dei dispositivi di I.A; che sostituiscano o affianchino funzioni lavorative possiamo assistere in prospettiva ad una trasformazione ancor più radicale e profonda di ogni relazione sociale, economica, culturale, dal livello più intimo di formazione delle personalità e dei profili culturali, sino al governo delle società ed alla conduzione del confronto geo-strategico, alla conduzione delle guerre. L’uso duale, anzi multiplo e differenziato di queste tecnologie è un loro carattere saliente. Nel caso cinese l’uso dell’I.A. nel controllo sociale è noto, in costante sviluppo, da confrontare comunque con quanto avviene in altri regimi di gestione delle società.
Ciò a cui stiamo assistendo è il costruirsi dell’insieme delle tecnologie e dei dispositivi di I.A. come una mediazione ineludibile nella produzione, conservazione, rielaborazione e trasmissione del patrimonio conoscitivo, già oggi se ne discute in merito all’uso dell’I.A. Generativa nella scuola, nei processi educativi e formativi in generale, ma la questione si pone in modo più esteso e pervasivo e va ben oltre la funzione dei social networks, con cui si integra facendone una delle sue fonti, di cui si nutre e va a sovrintendere.
Ciò mette in discussione la natura e la possibilità dei processi di autodeterminazione, la forma possibili di relazioni sociali libere e liberate, ma non pare che vi sia molta consapevolezza del problema.
Roberto Rosso
- The Day DeepSeek Turned Tech and Wall Street Upside Down, https://www.wsj.com/finance/stocks/the-day-deepseek-turned-tech-and-wall-street-upside-down-f2a70b69?mod=WSJ_home_mediumtopper_pos_1.[↩]
- I titoli tecnologici sono crollati lunedì per la notizia che la società cinese DeepSeek aveva addestrato un sofisticato modello di intelligenza artificiale a una frazione del costo dei suoi rivali Silicon Valley, innescando un improvviso inversione della recente rally AI. Nvidia, i cui chip sono stati utilizzati per alimentare molti dei principali modelli di AI, è sceso del 17%. La mossa ha cancellato $589 miliardi dal valore di mercato della società e macchiato uno dei più brillanti stelle del mercato azionario. Il Nasdaq Composite, che punta sulla tecnologia, è sceso del 3,1%. L’indice S&P 500 è sceso dell’1,5% dopo aver raggiunto un record la scorsa settimana. Il Dow Jones Industrial Average, che è meno ponderato verso Big Tech, ha guadagnato lo 0,7% per la giornata. Il calo di lunedì è stato un’inversione improvvisa per un mercato che ha operato quasi record dall’elezione del presidente Trump, poiché gli investitori hanno scommesso sulle politiche pro-business della nuova amministrazione e goduto del rally in azioni legate a AI. “Era un sell-off dovuto comunque,” ha detto J.J. Kinahan, amministratore delegato di IG Nord America, che possiede il brokerage Tastytrade. “Come dice il vecchio adagio, il mercato va su per le scale e fuori dalla finestra. Questo è stato un momento fuori dalla finestra.” Notizie che un neofita cinese poco noto aveva apparentemente raggiunto una svolta AI sul basso ha tirato il tappeto sotto le aziende che beneficiano di aumento di AI, tra cui produttori di chip, fornitori di infrastrutture e scorte di potenza. Molti hanno subito perdite a due cifre. Oracle è crollato del 14%. Super Micro Computer, che rende i server utilizzati per AI generative, slid 13%. Chip maker Broadcom crollato 17%. In tutto, il bagno di sangue del mercato di lunedì ha spazzato via circa 1 trilione di dollari dal valore del mercato azionario, secondo i dati di mercato Dow Jones. Perdite del dello esteso al settore energetico, compresi i produttori di energia elettrica le cui quote avevano raccolto sulle aspettative di aumento della domanda da data center che servono la rivoluzione AI. Le azioni di Constellation Energy sono calate del 21%.[↩]
- https://valori.it/fondi-finanziarizzazione-economia-globale/.[↩]
- https://altreconomia.it/deepseek-la-tecnologia-cinese-mette-a-nudo-una-colossale-bolla-finanziaria/.[↩]
- https://en.wikipedia.org/wiki/SoftBank_Group.[↩]
- https://www.mgx.ae/en.[↩]
- https://www.wsj.com/tech/ai/deepseek-us-ai-stocks-nvidia-broadcom-6cdfae81?mod=WSJ_home_mediumtopper_pos_3.[↩]
- https://www.wsj.com/tech/ai/deepseek-tech-stocks-a3e83478?mod=WSJ_home_mediumtopper_pos_2.[↩]
- https://www.ilsole24ore.com/art/trump-deepseek-campanello-allarme-altman-openai-modello-notevole-soprattutto-grazie-prezzo-AGy6eeaC.[↩]
- https://arxiv.org/abs/1812.02162 Dissecting Person Re-identification from the Viewpoint of Viewpoint.[↩]
- https://aws.amazon.com/what-is/synthetic-data/.[↩]