Suche: mixture

TOOLS

JetBrains kontert mit 12B-Coder-Modell

JetBrains schmeißt Mellum2 auf den Markt — ein 12B Mixture-of-Experts-Modell, gebaut fürs Coden. Direkt auf Hugging Face, direkt zum Anfassen.

Hugging Face Blog · 2026-06-01 16:18:20.599980+00:00 · Score 7/10

AGENTS

NVIDIA wirft 550B-Monster auf Agents

NVIDIA hat Nemotron 3 Ultra veröffentlicht — ein Open-Weight-Modell, das speziell für Agents gebaut ist, die stundenlang durchlaufen. Der Trick: Mixture-of-Experts plus ...

MarkTechPost · 2026-06-04 22:19:16.514473+00:00 · Score 8/10

HOT

Meta droppt Llama 4 — Together AI liefert sofort

Meta hat Llama 4 veröffentlicht. Die neue Modellgeneration setzt auf Mixture-of-Experts (MoE) und ist multimodal. Together AI bietet die Modelle ab sofort zum Einsatz an.

Together AI Blog · 2026-03-23 15:21:16.129699+00:00 · Score 7/10

HOT

NVIDIA bläst zum Großangriff: Drei Releases an einem Tag

NVIDIA wirft heute gleich drei Hammer-Releases auf den Markt: Cosmos 3, Nemotron 3 Ultra und den RTX Spark. Jensen Huang meint es ernst mit der KI-Vollbedienung.

Latent Space · 2026-06-02 04:18:20.510460+00:00 · Score 7/10

EXPERIMENTAL

KI-Modell läuft mit 87,5 Prozent weniger Experten

Forscher haben ein Mixture-of-Experts-Modell so trainiert, dass es drei Viertel seiner Experten verliert — und trotzdem fast volle Leistung bringt. Das Ding heißt EMO. Und es ...

The Decoder · 2026-05-16 10:19:19.723306+00:00 · Score 5/10

EXPERIMENTAL

Apple zerlegt MoE-Caching mit SpecMD

Apple ML Research hat ein neues Framework veröffentlicht, das speculative expert prefetching für Mixture-of-Experts-Modelle systematisch vermisst. Kein Modell-Release, sondern ...

Apple ML Research · 2026-05-07 01:20:06.527449+00:00 · Score 3/10

EXPERIMENTAL

KI lernt EU-Batteriepass — 12.000 Datensätze

Forscher haben den ersten öffentlichen Benchmark für digitale Batteriepässe gebaut. 22 Sprachmodelle mussten ran — von Mini-LM bis Mixture-of-Experts.

arXiv AI/ML/NLP · 2026-05-01 07:17:23.776638+00:00 · Score 2/10

TOOLS

Alibabas neues Mini-Modell schlägt die Großen

Nur 3 Milliarden aktive Parameter — und trotzdem auf Augenhöhe mit Modellen, die zehnmal so groß sind. Das Qwen-Team hat Qwen3.6-35B-A3B veröffentlicht, ein Open-Weight ...

MarkTechPost · 2026-04-17 10:22:03.889357+00:00 · Score 6/10

AGENTS

MiniMax macht sein bestes KI-Modell Open Source

Ein chinesisches KI-Startup veröffentlicht ein Modell, das sich selbst weiterentwickelt hat — und liefert dabei Benchmark-Werte, die aufhorchen lassen.

MarkTechPost · 2026-04-12 10:17:15.102472+00:00 · Score 7/10

EXPERIMENTAL

LiME macht Experten-Modelle 90% schlanker

Forscher haben ein Problem mit Mixture-of-Experts-Modellen: Jeder Experte braucht seinen eigenen Adapter. Mehr Experten, mehr Parameter, mehr Kosten. LiME soll das ändern.

arXiv AI/ML/NLP · 2026-04-06 04:16:24.022443+00:00 · Score 3/10

AGENTS

DeepSeek gibt LLMs ein neues Gedächtnis

DeepSeek hat ein neues Open-Source-Repo veröffentlicht: Engram. Die Idee dahinter: Large Language Models brauchen neben Mixture-of-Experts eine zweite Spar-Achse — und die heißt ...

GitHub Trending Python · 2026-03-30 01:35:57.809628+00:00 · Score 7/10

EXPERIMENTAL

1 Billion Parameter auf 96 GB RAM

Ein Modell mit einer Billion Parametern auf einem Rechner mit 96 GB RAM. Kein Rechenzentrum, kein Cloud-Abo. Einfach SSD und Geduld.

Simon Willison · 2026-03-24 06:18:20.039149+00:00 · Score 5/10

AGENTS

Moonshot kontert mit 1-Billion-Parameter-Coder

Moonshot AI hat Kimi K2.7-Code veröffentlicht. Ein Coding-Agent, der nicht plaudern will — er will programmieren, debuggen und Tools bedienen.

MarkTechPost · 2026-06-13 07:19:39.326485+00:00 · Score 7/10

TOOLS

Cohere wirft 30B Coding-Modell auf den Markt

Cohere hat ein neues Open-Weight-Modell für Entwickler veröffentlicht. Es heißt North Mini Code und zielt direkt auf agentisches Coding.

MarkTechPost · 2026-06-11 10:21:25.788523+00:00 · Score 6/10

HOT

Google wirft DiffusionGemma raus — 4× schneller

Google DeepMind hat ein neues Open-Model gedroppt: DiffusionGemma, ein 26B-MoE-Modell, das Text per Diffusion generiert — nicht autoregressiv. Apache 2.0. Frei für alle.

MarkTechPost · 2026-06-10 19:22:09.271559+00:00 · Score 7/10

HOT

NVIDIA wirft Cosmos 3 als Open Source raus

NVIDIA hat Cosmos 3 veröffentlicht — eine Familie omnimodaler World-Models für Physical AI. Robotik, autonome Autos und Warehouse-Monitoring kriegen damit ein neues Fundament.

MarkTechPost · 2026-06-03 10:22:06.853311+00:00 · Score 8/10

TOOLS

JetBrains öffnet Mellum2 — 12B-MoE für Coder

JetBrains haut sein neues Code-Modell raus. Open Source, Apache 2.0, direkt zum Runterladen.

MarkTechPost · 2026-06-02 10:21:00.494675+00:00 · Score 6/10

HOT

Nvidia knallt 550-Milliarden-Modell auf den Tisch

Nvidia veröffentlicht Nemotron 3 Ultra — und kassiert direkt den Benchmark-Thron. Laut Artificial Analysis ist es das stärkste offene KI-Modell der USA.

The Decoder · 2026-06-01 13:18:57.419004+00:00 · Score 9/10

EXPERIMENTAL

Zyphra macht aus LLM ein Diffusion-Modell

Das KI-Lab Zyphra hat ZAYA1-8B-Diffusion-Preview veröffentlicht. Sie haben ein normales autoregressives Sprachmodell in ein Diffusion-Modell umgewandelt — und es wird dabei bis zu ...

MarkTechPost · 2026-05-15 22:22:43.801900+00:00 · Score 6/10

TOOLS

Sakana AI and NVIDIA Introduce TwELL with CUDA Kernels for 20.5% Inference and 21.9% Training Speedup in LLMs

NVIDIA und Sakana AI stellen Twell vor: CUDA-Kernel für 20,5 % schnelleres Inferenz und 21,9 % schnelleres Training von LLMs

MarkTechPost · 2026-05-11 10:26:02.209858+00:00 · Score 7/10

SUCHE

JetBrains kontert mit 12B-Coder-Modell

NVIDIA wirft 550B-Monster auf Agents

Meta droppt Llama 4 — Together AI liefert sofort

NVIDIA bläst zum Großangriff: Drei Releases an einem Tag

KI-Modell läuft mit 87,5 Prozent weniger Experten

Apple zerlegt MoE-Caching mit SpecMD

KI lernt EU-Batteriepass — 12.000 Datensätze

Alibabas neues Mini-Modell schlägt die Großen

MiniMax macht sein bestes KI-Modell Open Source

LiME macht Experten-Modelle 90% schlanker

DeepSeek gibt LLMs ein neues Gedächtnis

1 Billion Parameter auf 96 GB RAM

Moonshot kontert mit 1-Billion-Parameter-Coder

Cohere wirft 30B Coding-Modell auf den Markt

Google wirft DiffusionGemma raus — 4× schneller

NVIDIA wirft Cosmos 3 als Open Source raus

JetBrains öffnet Mellum2 — 12B-MoE für Coder

Nvidia knallt 550-Milliarden-Modell auf den Tisch

Zyphra macht aus LLM ein Diffusion-Modell

Sakana AI and NVIDIA Introduce TwELL with CUDA Kernels for 20.5% Inference and 21.9% Training Speedup in LLMs