CasaNotizieSpostamento del collo di bottiglia dell’intelligenza artificiale: non è la potenza di calcolo, è il movimento dei dati.Il calcolo in memoria è la soluzione

Spostamento del collo di bottiglia dell’intelligenza artificiale: non è la potenza di calcolo, è il movimento dei dati.Il calcolo in memoria è la soluzione

Il passaggio al collo di bottiglia dell'AI: dalla potenza di calcolo alla memoria e allo spostamento dei dati: il Compute-in-Memory (CIM) prende il sopravvento


Negli ultimi due anni, le discussioni sull’intelligenza artificiale si sono concentrate quasi interamente sulla potenza di calcolo: GPU insufficienti, capacità di calcolo insufficiente e cluster inadeguati.Ma questo rapporto sottolinea ripetutamente un punto chiave: ciò che veramente frena l’intelligenza artificiale non è l’incapacità di calcolare, ma la capacità di calcolo incapacità di spostare i dati.

Poiché le dimensioni dei modelli sono passate da decine di megabyte a diversi gigabyte, i componenti più impegnati del sistema non sono più le unità di calcolo, ma la memoria e i bus.In altre parole, il collo di bottiglia dell’intelligenza artificiale si sta silenziosamente spostando da un “problema informatico” a una proposta più fondamentale: un problema di archiviazione.

Ciò ha portato a una direzione più radicale: se il movimento dei dati rappresenta il maggiore sovraccarico, perché non lasciare che avvenga il calcolo direttamente in deposito?

Un'architettura chiamata Compute-in-Memory (CIM) sta tentando di riscrivere questa logica dalla radice.La chiave per abilitarlo non è un nodo di processo più avanzato, ma un tipo di tecnologia che non è stata così “mainstream” in passato.memoria analogica.

Questo articolo ci invita a ripensare una domanda fondamentale: mentre l’intelligenza artificiale si evolve fino al punto in cui è oggi, cosa determina veramente il suo limite superiore: potenza di calcolo o spazio di archiviazione?

Messaggio centrale del Rapporto

Il collo di bottiglia delle prestazioni dell’intelligenza artificiale si sta spostando da “potenza di calcolo” a “archiviazione e movimento dei dati” e la soluzione sta nella ricostruzione del paradigma informatico con “memoria analogica + Compute-in-Memory (CIM)”.

L’intelligenza artificiale è essenzialmente un problema informatico basato sullo storage

Il calcolo principale delle reti neurali profonde (DNN) è la moltiplicazione di matrici vettoriali (VMM), che si basa intrinsecamente sulla lettura massiccia del peso.Man mano che le dimensioni dei modelli crescono da megabyte a gigabyte (10 MB-10 GB), essi pongono enormi esigenze di archiviazione su chip.

L’addestramento è “ad alta intensità di scrittura”, mentre l’inferenza è “ad alta intensità di lettura”: entrambi ruotano attorno all’immagazzinamento del peso (memoria sinaptica).

Conclusione: L’intelligenza artificiale non è un puro problema informatico;è essenzialmente una questione di “efficienza di archiviazione + movimento dei dati”.

Collo di bottiglia fondamentale dell'architettura tradizionale: movimento dei dati

Le GPU/TPU tradizionali funzionano secondo un principio semplice: il calcolo avviene negli elementi di elaborazione (PE), mentre i dati vengono archiviati in SRAM/DRAM, il che comporta frequenti spostamenti di dati e un'efficienza estremamente bassa.

Confronto efficienza energetica:

  • Piattaforme tradizionali: ~0,1 TOPS/W
  • ASIC digitali: ~1–10 TOPS/W
  • CIM analogico: ~10–100 TOPS/W

Contraddizione fondamentale: Il problema non è l'incapacità di calcolare, ma l'incapacità di spostare i dati in modo efficiente.

Direzione chiave: Compute-in-Memory (CIM)

L'architettura CIM memorizza i pesi direttamente negli array di memoria ed esegue calcoli (VMM parallelo) all'interno di questi array, eliminando la necessità di spostare i dati tra "storage ↔ unità di calcolo".

Cambiamento fondamentale:

  • Architettura tradizionale: memoria e calcolo sono separati
  • Architettura CIM: memoria = calcolo

Si tratta di un cambiamento di paradigma a livello architetturale, non solo di una semplice ottimizzazione.

Portante principale: memoria analogica multi-bit (sinapsi analogica)

Per realizzare CIM è necessario un nuovo “portapesi”.I principali candidati includono:

  • RRAM (memoria resistiva ad accesso casuale)
  • PCM (memoria a cambiamento di fase)
  • FeFET (transistor ferroelettrico a effetto di campo)
  • Flash/NAND 3D, ecc.

La capacità essenziale di questi dispositivi è quella di rappresentare i pesi utilizzando la conduttanza continua (multi-bit analogico).

La vera sfida: i limiti fisici del dispositivo determinano i limiti superiori del sistema

Il rapporto sottolinea non “se sia possibile farlo”, ma gli ostacoli pratici:

1. Sfide formative (processo di scrittura)
Requisiti: Linearità e simmetria
Problemi pratici: la non linearità e l'asimmetria portano a una ridotta precisione

2. Sfide di inferenza (stabilità di lettura)
I pesi variano nel tempo, con problemi tra cui: - Deriva termica - Leggi l'interferenza - Problemi di conservazione

3. Problemi a livello di array
- Variabilità tra i dispositivi - Compromessi tra precisione, prestazioni dell'ADC e dimensioni dell'array

Conclusione fondamentale: Il problema con la memoria analogica non è "se la precisione è sufficiente", ma "stabilità e controllabilità".

Tendenza finale: integrazione 3D + coordinamento a livello di sistema

Le direzioni future includono:

  • Integrazione 3D monolitica
  • Accoppiamento profondo di memoria e logica
  • Co-progettazione di dispositivi, circuiti e algoritmi

Essenza: Non si tratta di una svolta in un singolo punto, ma di una ricostruzione completa.

Conclusione

Il collo di bottiglia dell’intelligenza artificiale non è più la potenza di calcolo, ma “l’archiviazione e il flusso di dati”.Analog CIM sta trasformando lo “storage” nel nuovo nucleo dell’informatica, ridefinendo da zero il funzionamento dei sistemi di intelligenza artificiale.