Google Deep Thinking Ratio: perché non potrai farne a meno

una mano sorregge una illustrazione di un cervello con al centro la scritta AI

C’è una notizia che circola nelle ultime settimane negli ambienti dell’intelligenza artificiale e che merita attenzione anche se non hai un background tecnologico.

Ne sono venuto a conoscenza leggendo l’articolo “A New Google AI Research Proposes Deep-Thinking Ratio to Improve LLM Accuracy While Cutting Total Inference Costs by Half” sul sito MarkTechPost.

Google ha presentato una nuova ricerca che potrebbe cambiare in modo significativo il modo in cui l’AI funziona e, di conseguenza, quanto costa e quanto è precisa.

Si chiama Deep Thinking Ratio, ed è il risultato di un progetto congiunto tra Google e l’Università della Virginia.

In questo articolo ti spiego cosa significa, perché è diverso da quello che c’è adesso, e soprattutto cosa potrebbe cambiare per la tua azienda nei prossimi 2-3 anni.

Niente tecnicismi. Solo quello che ti serve sapere per non farti trovare impreparato.

Il problema che Google ha deciso di risolvere

Per capire il Google Deep Thinking Ratio, bisogna prima capire come ragiona oggi un’AI.

Quando chiedi a un sistema di intelligenza artificiale di fare qualcosa di complesso — analizzare i dati di vendita, suggerire una strategia di pricing, rispondere a un cliente con un problema articolato — il modello non risponde subito. Prima “pensa”.

Genera una lunga sequenza di passaggi intermedi, quasi come un ragionamento scritto, e poi arriva alla conclusione.

Questa tecnica esiste da qualche anno e si chiama Chain-of-Thought: letteralmente, “catena del pensiero”.

Ha migliorato enormemente le prestazioni dei modelli AI su compiti difficili.

Il problema è che col tempo si è sviluppata una cattiva abitudine: i modelli hanno imparato a produrre ragionamenti sempre più lunghi, convinti che più testo = più qualità.

Il paradosso: più l’AI “pensa”, peggio risponde

I ricercatori di Google hanno scoperto qualcosa di controintuitivo: esiste una correlazione negativa tra la lunghezza del ragionamento di un’AI e la sua precisione.

Non è un’impressione soggettiva — è una misurazione statistica. Più il testo generato è lungo, più alta è la probabilità che la risposta finale sia sbagliata.

Perché succede? I modelli AI, quando producono testi molto lunghi, tendono a cadere in loop: riscrivono le stesse cose in modi diversi, amplificano i propri errori iniziali, perdono il filo.

È il fenomeno dell'”overthinking”: pensare troppo non aiuta, anzi danneggia.
Direi che queste cosa, molte volte, avviene anche nella realtà 😅

💡 Più testo non significa più intelligenza. È come il collaboratore che riempie dieci pagine di report per dire quello che avrebbe potuto dire in tre righe: a un certo punto, la quantità diventa il nemico della chiarezza.

Cos’è il Google Deep Thinking Ratio: la qualità del pensiero, non la quantità

Il Google Deep Thinking Ratio (DTR) nasce da una domanda semplice: se la lunghezza del ragionamento è un indicatore inaffidabile, come possiamo misurare se un’AI sta davvero “pensando bene”?

La risposta è guardare dentro al modello, non fuori.

Un modello AI di grandi dimensioni processa ogni parola attraverso decine di strati interni.

Per le parole “facili” — articoli, connettivi, frasi di routine — il modello stabilizza la propria risposta già nei primi strati.

Per le parole “difficili” — quelle che richiedono vera logica, calcolo, ragionamento complesso — la risposta continua a cambiare e affinarsi fino agli ultimi strati.

I ricercatori chiamano queste ultime “deep-thinking tokens”: le parole su cui il modello fa davvero un lavoro cognitivo profondo.

Il Deep Thinking Ratio misura la percentuale di questi token nel ragionamento totale.

Un alto DTR significa che l’AI sta affrontando la complessità con la giusta intensità. Un basso DTR significa che sta producendo testo routinario — magari tanto, ma di scarso valore.

La metafora dell’artigiano

Pensa a un artigiano che produce componenti meccanici di precisione.

Ci sono operazioni che fa in modo quasi automatico, senza grande sforzo cognitivo: serrare un bullone, seguire una procedura standard. Poi ci sono i momenti in cui si ferma, misura due volte, ragiona, consulta i disegni tecnici: sono quelli che determinano la qualità del pezzo finito.

Il DTR misura esattamente questo: quanta parte del lavoro dell’AI è genuinamente difficile e profondo, rispetto a quanto è semplicemente routine ben confezionata.

Think@n: meno costi, più precisione

La scoperta del DTR ha portato a una tecnica pratica chiamata Think@n. Funziona così.

Invece di generare un unico lungo ragionamento, il sistema avvia più ragionamenti in parallelo — come aprire più ipotesi contemporaneamente.

Dopo solo 50 parole iniziali, calcola il DTR di ognuno. I ragionamenti con DTR basso (strade poco promettenti) vengono abbandonati subito. Solo quelli con DTR alto vengono completati.

Il risultato, testato su problemi matematici molto complessi, è il seguente: precisione superiore del 2% rispetto ai sistemi attuali, costi ridotti del 49%.

Quasi la metà della spesa in meno, con risultati migliori. Per chi gestisce sistemi AI su scala, questo non è un dettaglio tecnico — è una rivoluzione economica.

Cosa cambia concretamente per le PMI italiane

Arriviamo alla parte che ti riguarda più da vicino.

Questa tecnologia è ancora in fase di ricerca accademica, ma i tempi di adozione nell’AI si sono accorciati enormemente.

È ragionevole aspettarsi che strumenti basati sul Deep Thinking Ratio inizino ad apparire nei prodotti commerciali entro il 2027.

Che cosa significa nella pratica? Proviamo a immaginarlo attraverso quattro settori.

Food: previsioni di domanda più precise a costo minore

una persona sta sistemando dei prodotti alimentari su un piano di lavoro

Un’azienda alimentare del Nord Italia usa un sistema AI per prevedere i volumi di produzione settimanali in base alla stagionalità, alle promozioni attive e ai trend di mercato.

Oggi il sistema genera ragionamenti lunghi e costosi per ogni previsione.

Con DTR, lo stesso risultato — anzi uno migliore — arriverebbe a metà del costo computazionale. Il risparmio si traduce in budget per ampliare le analisi: più prodotti monitorati, più mercati considerati.

Fashion: personalizzazione senza sprechi

una stilista di moda sta sistemando un capo sul manichino

Un’azienda di moda con produzione italiana usa l’AI per personalizzare le raccomandazioni di prodotto sui canali digitali.

Il problema attuale: i modelli generano descrizioni e suggerimenti ridondanti, con costi che crescono al crescere del catalogo.

Un sistema DTR potrebbe selezionare automaticamente le risposte più “dense” di intelligenza genuina, scartando quelle superficiali. Meno sprechi computazionali, comunicazione più rilevante per il cliente.

Finance: analisi del rischio più affidabili

un manager sta analizzando i dati finanziari su un monitor

Una PMI che gestisce investimenti o linee di credito usa strumenti AI per valutare il profilo di rischio dei propri clienti.

Oggi questi sistemi producono report lunghi, ma spesso con ragionamenti circolari.

Il DTR permetterebbe di identificare automaticamente le analisi di qualità superiore, riducendo il rischio di decisioni basate su “fuffa” generata dall’AI. Più affidabilità, meno costi di verifica manuale.

Meccanico: manutenzione predittiva più efficiente

un tecnico in una linea di produzione del settore meccanico sta lavorando al computer

Un’azienda meccanica di 35 dipendenti ha installato sensori sui macchinari principali.

Un sistema AI analizza i dati ogni ora per prevedere guasti. Il volume di dati è enorme: migliaia di analisi al giorno.

Con i sistemi attuali, il costo computazionale è proporzionale alla quantità di ragionamento prodotto.

Con DTR, il sistema potrebbe elaborare il doppio dei dati con lo stesso budget, o mantenere lo stesso volume riducendo la spesa del 50%.

💡 Indipendentemente dal settore, il messaggio è lo stesso: AI più efficiente significa poter fare di più con le stesse risorse — o risparmiare risorse per investirle nelle persone.

La timeline realistica: cosa aspettarsi e quando

Capire quando e come questa tecnologia entrerà nel mercato ti permette di pianificare in modo più intelligente. Ecco una stima realistica, basata sui tempi di adozione che abbiamo visto con innovazioni simili negli ultimi anni.

Entro la fine del 2026, il DTR sarà probabilmente integrato nei modelli di punta dei grandi player (Google, OpenAI, Anthropic).

Non come prodotto separato, ma come miglioramento interno: le risposte diventeranno più precise e i costi inizieranno a scendere, anche senza che tu debba fare nulla.

Nel 2027, ci aspettiamo che le piattaforme AI business-oriented — quelle che le PMI usano per CRM, marketing automation, analisi dati — inizino a integrare sistemi di selezione basati su DTR.
I risultati saranno più affidabili, i costi più contenuti.

Tra il 2027 e il 2028, chi avrà già costruito processi AI all’interno della propria azienda sarà in grado di adottare questi miglioramenti senza ricominciare da zero.

Chi invece non avrà ancora iniziato, dovrà affrontare un doppio investimento: imparare come funziona l’AI e aggiornarsi sulle nuove versioni nello stesso momento.

Il rischio di aspettare

C’è un errore che molti imprenditori fanno: aspettare che la tecnologia sia “matura” prima di iniziare.
È comprensibile — nessuno vuole investire in qualcosa che potrebbe cambiare nel giro di un anno.

Ma nel caso dell’AI, aspettare ha un costo nascosto.

Le aziende che iniziano oggi stanno costruendo competenze interne, abitudini operative, dati strutturati.

Quando il DTR arriverà nei prodotti commerciali, loro sapranno già come sfruttarlo. Le aziende che aspettano partono da zero in un mercato già avanzato.

Un’efficienza che rispetta le persone

Voglio chiudere con una riflessione che per noi di Factory Communication non è mai marginale.

Il Google Deep Thinking Ratio non è solo una questione di efficienza economica.

Un’AI che pensa meglio — con meno sprechi, con maggiore precisione — è anche un’AI che consuma meno energia.

I data center che fanno girare questi modelli hanno un impatto ambientale significativo. Migliorare l’efficienza del 50% non è solo un risparmio per l’azienda: è un passo verso una tecnologia più sostenibile.

E poi c’è la dimensione umana. Un’AI più efficiente libera risorse.

Quelle risorse possono essere reinvestite nelle persone: formazione, tempo, qualità del lavoro.

L’obiettivo non è avere un’AI che fa tutto da sola. È avere un’AI che supporta i tuoi collaboratori, li libera dai compiti ripetitivi, e lascia loro spazio per fare le cose che contano davvero.

Se poi riuscite a ritagliarvi del tempo, una partita al bigliardino non guasta mai 😅

Il DTR ci ricorda che anche l’AI, per funzionare bene, deve imparare a distinguere ciò che vale la pena fare profondamente da ciò che può essere gestito in modo leggero.

Non è diverso da come lavora un buon professionista — e da come dovrebbe lavorare un’azienda che vuole crescere nel tempo senza bruciare le persone che la compongono.

Se hai trovato interessante questo articolo puoi visitare la sezione del nostro sito che parla della AI per il Business

Google Deep Thinking Ratio: cosa cambia per le PMI italiane nei prossimi 3 anni