NVIDIA si trova in una posizione che molti definirebbero fortunata, ma che all’interno della società è vissuta come un assedio logistico. È l’azienda che ha dettato le regole del gioco, ma è anche ostaggio dei suoi stessi fornitori di memoria: senza i moduli HBM prodotti in Corea del Sud e a Taiwan, i potentissimi chip di NVIDIA sono inutilizzabili. Per ovviare a questo problema, la società ha rivisto i suoi cicli di lancio in modo drastico.
Nel 2026 NVIDIA ha dato priorità assoluta alla piattaforma Vera Rubin (destinata ai centri elaborazione dati) rispetto alla serie RTX 50 destinata ai videogiocatori e ai professionisti del montaggio video. Per la prima volta in cinque anni, NVIDIA non ha annunciato nuove GPU consumer al CES di Las Vegas, segnando la fine di un’era in cui il gaming era il motore trainante dell’azienda.
La nuova architettura Vera Rubin è una ricalibrazione totale dell’efficienza energetica e computazionale. Rubin combina sei chip diversi in un unico sistema integrato, con una larghezza di banda che raggiunge i 22 terabyte al secondo; si tratta delle “corsie” dell’autostrada percorsa dai dati e dalla loro elaborazione, là dove la potenza di calcolo dei chip, invece, rappresenta la velocità dei veicoli che le percorrono. Per dare un’idea della potenza di trasferimento, 22 terabyte al secondo permetterebbero di trasferire circa 5.500 film in 4K nello spazio, appunto, di un secondo, per giunta con un notevole risparmio di energia rispetto alle tecnologie precedenti.
Per alimentare questo mostro NVIDIA ha tagliato in modo drastico le forniture di chip GDDR ai partner come MSI, ASUS o Zotac (ovvero le aziende che assemblano la sua componentistica in prodotti informatici complessi), spostando ogni risorsa disponibile verso i sistemi finiti destinati ai giganti del cloud.
Questa mossa ha creato una frattura nel mercato dei produttori di terze parti. Aziende come Zotac hanno avvertito che i margini di profitto sono diventati così sottili da mettere a rischio la loro sopravvivenza. NVIDIA preferisce vendere direttamente i propri sistemi finiti (come i rack NVL72) piuttosto che fornire chip singoli ai partner, poiché il valore aggiunto di un sistema completo è di molto superiore: è un passaggio da fornitore di componenti a fornitore di infrastrutture totali.
Il dato più impressionante non è la potenza bruta, ma l’aumento massiccio della memoria HBM4. Un singolo rack Vera Rubin NVL72 (cioè un’unità computazionale completa) contiene circa 20.7 terabyte di memoria HBM4. Si tratta di una quantità di silicio così vasta che la sua sola produzione è in grado di squilibrare l’intera offerta globale di elettronica di consumo per un anno.
Il risultato? Se nel 2025 la situazione sembrava preoccupante, i primi mesi del 2026 hanno confermato uno scenario brutale per chiunque cerchi di acquistare hardware. L’impatto sui prezzi è stato guidato da una combinazione di scarsità reale e “panic buying” da parte dei grandi assemblatori, con le memorie DDR5 per PC desktop che hanno visto un aumento del 90-110% nei prezzi dei contratti in un solo trimestre. Gli SSD, fondamentali per l’archiviazione veloce dei dati, hanno subito rincari superiori al 50%. La ragione è che i centri elaborazione dati IA non richiedono solo velocità di calcolo, ma devono anche poter leggere e scrivere set di dati enormi a una velocità senza precedenti, saturando la produzione di memorie NAND Flash.
Così si è creato quello che gli analisti definiscono un “seller’s market”. I produttori di memoria hanno un potere contrattuale immenso. Per il consumatore finale, questo significa che il costo di un PC assemblato oggi è quasi raddoppiato rispetto a 18 mesi fa.