
Negli ultimi due anni, le discussioni sull’intelligenza artificiale si sono concentrate quasi interamente sulla potenza di calcolo: GPU insufficienti, capacità di calcolo insufficiente e cluster inadeguati.Ma questo rapporto sottolinea ripetutamente un punto chiave: ciò che veramente frena l’intelligenza artificiale non è l’incapacità di calcolare, ma la capacità di calcolo incapacità di spostare i dati.
Poiché le dimensioni dei modelli sono passate da decine di megabyte a diversi gigabyte, i componenti più impegnati del sistema non sono più le unità di calcolo, ma la memoria e i bus.In altre parole, il collo di bottiglia dell’intelligenza artificiale si sta silenziosamente spostando da un “problema informatico” a una proposta più fondamentale: un problema di archiviazione.
Ciò ha portato a una direzione più radicale: se il movimento dei dati rappresenta il maggiore sovraccarico, perché non lasciare che avvenga il calcolo direttamente in deposito?
Un'architettura chiamata Compute-in-Memory (CIM) sta tentando di riscrivere questa logica dalla radice.La chiave per abilitarlo non è un nodo di processo più avanzato, ma un tipo di tecnologia che non è stata così “mainstream” in passato.memoria analogica.
Questo articolo ci invita a ripensare una domanda fondamentale: mentre l’intelligenza artificiale si evolve fino al punto in cui è oggi, cosa determina veramente il suo limite superiore: potenza di calcolo o spazio di archiviazione?
Il collo di bottiglia delle prestazioni dell’intelligenza artificiale si sta spostando da “potenza di calcolo” a “archiviazione e movimento dei dati” e la soluzione sta nella ricostruzione del paradigma informatico con “memoria analogica + Compute-in-Memory (CIM)”.
Il calcolo principale delle reti neurali profonde (DNN) è la moltiplicazione di matrici vettoriali (VMM), che si basa intrinsecamente sulla lettura massiccia del peso.Man mano che le dimensioni dei modelli crescono da megabyte a gigabyte (10 MB-10 GB), essi pongono enormi esigenze di archiviazione su chip.
L’addestramento è “ad alta intensità di scrittura”, mentre l’inferenza è “ad alta intensità di lettura”: entrambi ruotano attorno all’immagazzinamento del peso (memoria sinaptica).
Conclusione: L’intelligenza artificiale non è un puro problema informatico;è essenzialmente una questione di “efficienza di archiviazione + movimento dei dati”.
Le GPU/TPU tradizionali funzionano secondo un principio semplice: il calcolo avviene negli elementi di elaborazione (PE), mentre i dati vengono archiviati in SRAM/DRAM, il che comporta frequenti spostamenti di dati e un'efficienza estremamente bassa.
Confronto efficienza energetica:
Contraddizione fondamentale: Il problema non è l'incapacità di calcolare, ma l'incapacità di spostare i dati in modo efficiente.
L'architettura CIM memorizza i pesi direttamente negli array di memoria ed esegue calcoli (VMM parallelo) all'interno di questi array, eliminando la necessità di spostare i dati tra "storage ↔ unità di calcolo".
Cambiamento fondamentale:
Si tratta di un cambiamento di paradigma a livello architetturale, non solo di una semplice ottimizzazione.
Per realizzare CIM è necessario un nuovo “portapesi”.I principali candidati includono:
La capacità essenziale di questi dispositivi è quella di rappresentare i pesi utilizzando la conduttanza continua (multi-bit analogico).
Il rapporto sottolinea non “se sia possibile farlo”, ma gli ostacoli pratici:
1. Sfide formative (processo di scrittura)
Requisiti: Linearità e simmetria
Problemi pratici: la non linearità e l'asimmetria portano a una ridotta precisione
2. Sfide di inferenza (stabilità di lettura)
I pesi variano nel tempo, con problemi tra cui:
- Deriva termica
- Leggi l'interferenza
- Problemi di conservazione
3. Problemi a livello di array
- Variabilità tra i dispositivi
- Compromessi tra precisione, prestazioni dell'ADC e dimensioni dell'array
Conclusione fondamentale: Il problema con la memoria analogica non è "se la precisione è sufficiente", ma "stabilità e controllabilità".
Le direzioni future includono:
Essenza: Non si tratta di una svolta in un singolo punto, ma di una ricostruzione completa.
Il collo di bottiglia dell’intelligenza artificiale non è più la potenza di calcolo, ma “l’archiviazione e il flusso di dati”.Analog CIM sta trasformando lo “storage” nel nuovo nucleo dell’informatica, ridefinendo da zero il funzionamento dei sistemi di intelligenza artificiale.