Analog Compute-in-Memory vs GPU

von Neumann bottleneck · data movement energy · inference efficiency

GPU — External memory, high data-movement cost

Analog CIM — Compute in memory, minimal movement

Data / weight tokens moving between units

Speed: 1×

GPU Data Movement

GPU Energy Used

Analog Energy Used

Efficiency Ratio (GPU / Analog)

1.0×

● GPU: weights shuttle between HBM & compute units — high energy per operation · ● Analog CIM: weights stay in memory array — near-zero data movement