Suche: Sparse

EXPERIMENTAL

Forscher zerlegen GPT-2 in 32.000 Hirn-Features

Neue Studie auf arXiv knackt das Rätsel, warum LLM-Mittelschichten so verdammt gut Gehirnaktivität vorhersagen. Antwort: Sparse Autoencoders.

arXiv AI/ML/NLP · 2026-05-26 01:19:27.423253+00:00 · Score 2/10

EXPERIMENTAL

Forscher zerlegen KI-Gehirne mit Sparse Autoencoders

Was denkt sich ein KI-Modell, wenn es ein EEG anschaut? Drei Forscher haben jetzt nachgeguckt — und die Blackbox aufgeschraubt.

arXiv AI/ML/NLP · 2026-05-15 04:23:38.500593+00:00 · Score 2/10

TOOLS

Together knackt 1 Million Token im Kontext

Together AI hat MiniMax-M3 in Produktion gebracht — mit einem Inferenz-Stack, der 1M-Token-Kontext nicht nur möglich, sondern bezahlbar macht. Der Blogpost liest sich wie ein ...

Together AI Blog · 2026-06-02 22:19:00.929269+00:00 · Score 6/10

HOT

MiniMax knallt M3 raus — 1 Million Token Kontext

Chinesisches Lab MiniMax hat am 1. Juni 2026 sein neues Flaggschiff M3 veröffentlicht. Open-Weight, multimodal, agentenfähig — und mit einer brandneuen Attention-Architektur.

MarkTechPost · 2026-06-01 22:22:04.185759+00:00 · Score 7/10

EXPERIMENTAL

Forscher zähmen KIs Sprach-Chaos mit Autoencodern

Sparse Autoencoders sollen Large Language Models steuerbar machen — aber bisher nur auf Englisch. Eine neue Arbeit auf arXiv will das ändern.

arXiv AI/ML/NLP · 2026-05-26 01:19:46.647266+00:00 · Score 2/10

EXPERIMENTAL

Forscher zerlegt KI-Gehirne ohne Autoencoder

Ein neuer Ansatz namens Exemplar Partitioning will tief in Sprachmodelle reinleuchten — ohne den Umweg über Sparse Autoencoders. Klingt nerdig, ist aber ein Stich gegen den ...

LessWrong · 2026-05-16 07:18:56.067039+00:00 · Score 2/10

EXPERIMENTAL

Nullen machen KI 10× effizienter

Die KI-Branche hat ein Stromfresser-Problem. Metas Llama 4 kommt mit 2 Billionen Parametern — und der Energiebedarf wächst mit jedem neuen Modell weiter.

IEEE Spectrum AI · 2026-04-28 19:23:19.682888+00:00 · Score 3/10

TOOLS

Alibabas neues Mini-Modell schlägt die Großen

Nur 3 Milliarden aktive Parameter — und trotzdem auf Augenhöhe mit Modellen, die zehnmal so groß sind. Das Qwen-Team hat Qwen3.6-35B-A3B veröffentlicht, ein Open-Weight ...

MarkTechPost · 2026-04-17 10:22:03.889357+00:00 · Score 6/10

EXPERIMENTAL

Block-Sparse macht Language Models 50% kleiner

Hugging Face zeigt, wie man mit simplen Matrizen-Tricks LLMs radikal abspeckt. Keine neue Architektur, kein neues Modell — nur clevere Mathematik.

Hugging Face Blog · 2026-03-23 18:21:38.437291+00:00 · Score 3/10

EXPERIMENTAL

Chipmunk macht Bild-KI doppelt so schnell

Together AI hat ein neues Verfahren vorgestellt, das Diffusion Transformers ohne zusätzliches Training beschleunigt. Der Name: Chipmunk. Der Trick: dynamische, spaltenweise Sparse ...

Together AI Blog · 2026-03-23 15:21:50.985155+00:00 · Score 4/10

EXPERIMENTAL

OpenAI macht dünnbesetzte Netze brutal schnell

OpenAI veröffentlicht GPU-Kernel, die eine fast vergessene Netzwerk-Architektur wiederbeleben: Block-Sparse Networks. Die Rechenzeit? Teilweise um Größenordnungen schneller als ...

OpenAI News · 2026-03-22 06:46:51.614262+00:00 · Score 6/10

HOT

MiniMax wirft M3 ins Open-Source-Rennen

MiniMax knallt mit M3 ein Open-Weight-Modell auf den Tisch, das Coding, 1-Million-Token-Kontext und Multimodalität in eine Architektur quetscht. Die Gewichte landen in zehn Tagen ...

The Decoder · 2026-06-01 13:18:20.813956+00:00 · Score 8/10

EXPERIMENTAL

Forscher steuern KI über Aufmerksamkeits-Queries

Ein neues arXiv-Paper greift tief in die Eingeweide von Large Language Models. Statt am Output zu schrauben, manipulieren die Autoren direkt den Attention-Mechanismus.

arXiv AI/ML/NLP · 2026-05-26 01:20:28.399110+00:00 · Score 2/10

EXPERIMENTAL

Forscher röntgen KI-Augen mit Transcoders

Neue Methode soll endlich zeigen, wie Vision-Language-Modelle Bilder in Worte übersetzen — und warum sie dabei halluzinieren.

arXiv AI/ML/NLP · 2026-05-25 16:19:01.111196+00:00 · Score 2/10

EXPERIMENTAL

Forscher bringen Claude zum Reden — auf Englisch

Interpretability-Forschung war bisher Lesen im Kaffeesatz. Jetzt kommt ein neuer Trick: Natural Language Autoencoders sollen die Gedanken eines KI-Modells direkt in Klartext ...

TheSequence · 2026-05-13 13:20:18.818396+00:00 · Score 2/10

EXPERIMENTAL

Forscher tunen LLM-Cache mit Sparse-Trick

Ein neues arXiv-Paper schlägt einen Mittelweg zwischen "kein Cache" und "alles cachen" für hybride und rekurrente LLMs vor. Klingt nerdig — ist es auch.

arXiv AI/ML/NLP · 2026-05-08 04:21:36.455350+00:00 · Score 2/10

AGENTS

27B-Modell schlägt 397B-Riesen beim Coden

Alibaba hat mit Qwen3.6-27B ein Open-Weight-Modell veröffentlicht, das bei Agentic-Coding-Benchmarks Modelle mit 397 Milliarden Parametern hinter sich lässt. Dichtes Modell, ...

MarkTechPost · 2026-04-22 22:21:25.637387+00:00 · Score 8/10

EXPERIMENTAL

Bio-KI verschwendet 90 Prozent ihres Wissens

Die KI-Branche baut immer größere Foundation Models für Zellbiologie. Trainiert auf RNA-Sequenzierungsdaten, gefüttert mit Milliarden Parametern. Aber kaum jemand schaut nach, was ...

LessWrong · 2026-04-12 19:16:44.654061+00:00 · Score 2/10

HOT

OpenAI zerlegt GPT-4 in 16 Millionen Einzelteile

OpenAI hat GPT-4 den Schädel aufgemacht. Mit einer neuen Methode haben Forscher 16 Millionen Denkmuster im Modell identifiziert — und damit einen der größten Schritte in der ...

OpenAI News · 2026-03-23 09:20:32.996159+00:00 · Score 6/10

EXPERIMENTAL

Nous Research knackt KI-Verweigerung mit 0,1 Prozent

Forscher haben den genauen Ort gefunden, an dem KI-Modelle "Nein" sagen. Und ihn ausgeschaltet.

MarkTechPost · 2026-05-23 13:19:37.819305+00:00 · Score 2/10

SUCHE

Forscher zerlegen GPT-2 in 32.000 Hirn-Features

Forscher zerlegen KI-Gehirne mit Sparse Autoencoders

Together knackt 1 Million Token im Kontext

MiniMax knallt M3 raus — 1 Million Token Kontext

Forscher zähmen KIs Sprach-Chaos mit Autoencodern

Forscher zerlegt KI-Gehirne ohne Autoencoder

Nullen machen KI 10× effizienter

Alibabas neues Mini-Modell schlägt die Großen

Block-Sparse macht Language Models 50% kleiner

Chipmunk macht Bild-KI doppelt so schnell

OpenAI macht dünnbesetzte Netze brutal schnell

MiniMax wirft M3 ins Open-Source-Rennen

Forscher steuern KI über Aufmerksamkeits-Queries

Forscher röntgen KI-Augen mit Transcoders

Forscher bringen Claude zum Reden — auf Englisch

Forscher tunen LLM-Cache mit Sparse-Trick

27B-Modell schlägt 397B-Riesen beim Coden

Bio-KI verschwendet 90 Prozent ihres Wissens

OpenAI zerlegt GPT-4 in 16 Millionen Einzelteile

Nous Research knackt KI-Verweigerung mit 0,1 Prozent