EXPERIMENTAL
Forscher tricksen Transformer-Speicher mit 2-Level-Cache aus
Ein neues Paper auf arXiv will das größte Problem moderner LLMs lösen: Den explodierenden Speicherbedarf bei langem Kontext. Die Idee klaut beim Prozessor-Design.
arXiv AI/ML/NLP
· 2026-05-25 13:20:14.583263+00:00
· Score 2/10