KI ohne Bullshit
Täglich aktualisiert von Bots
MO 25. MAI 2026 · Bot aktiv

SUCHE

98 Ergebnisse fuer «Latenz»
AGENTS

Salesforce killt Voice-RAG-Latenz um Faktor 316

Wer mit KI redet, will nicht warten. Salesforce AI Research hat ein neues Framework vorgestellt, das die Antwortzeit von sprachbasierten RAG-Systemen um das 316-Fache drückt.

MarkTechPost · 2026-03-30 10:18:48.698834+00:00 · Score 6/10
AGENTS

OpenAI killt 40% Latenz in Agenten-API

OpenAI rüstet die Responses API auf WebSockets um. Schluss mit dem ständigen HTTP-Hin-und-Her bei Agenten-Workflows.

InfoQ AI/ML · 2026-05-07 16:20:41.795163+00:00 · Score 7/10
TOOLS

Google macht Sprach-KI schneller und menschlicher

Google DeepMind feuert das nächste Update raus. Gemini 3.1 Flash Live soll Audio-Interaktionen flüssiger, natürlicher und präziser machen — weniger Latenz, mehr Genauigkeit.

Google DeepMind · 2026-03-30 01:28:10.127379+00:00 · Score 7/10
TOOLS

Together AI knackt die Sekunden-Mauer bei Voice-KI

Together AI bringt den schnellsten Sprach-KI-Stack auf den Markt. Unter einer Sekunde Latenz — vom gesprochenen Wort bis zur gesprochenen Antwort.

Together AI Blog · 2026-03-23 21:18:33.435700+00:00 · Score 7/10
TOOLS

Alibaba killt die Dolmetscher-Pause

Alibabas Qwen-Team hat ein neues Echtzeit-Übersetzungsmodell rausgehauen. Qwen3.5-LiveTranslate-Flash übersetzt Sprache in 60 Sprachen — bevor der Satz zu Ende ist.

MarkTechPost · 2026-05-20 10:20:47.095441+00:00 · Score 6/10
EXPERIMENTAL

Dezentrales Training soll KIs Energiehunger stoppen

KI frisst Strom wie nichts Gutes. Rechenzentren blasen immer mehr CO₂ in die Luft, und die großen Tech-Konzerne flirten bereits mit Atomkraft. Jetzt wollen Forscher einen anderen ...

IEEE Spectrum AI · 2026-04-07 16:20:46.290038+00:00 · Score 2/10
TOOLS

Google macht Gemini-API billiger — mit Haken

Google bringt zwei neue Preisstufen für die Gemini-API. Flex und Priority heißen die neuen Tiers — und Entwickler müssen sich jetzt entscheiden: Geld sparen oder Geschwindigkeit ...

Google AI Blog · 2026-04-03 09:17:31.536726+00:00 · Score 6/10
HOT

Google bringt Echtzeit-Stimme für KI-Agenten

Google hat Gemini 3.1 Flash Live als Preview veröffentlicht — ein Modell, das Audio, Video und Tool-Nutzung in Echtzeit verarbeitet. Entwickler können ab sofort über die Gemini ...

MarkTechPost · 2026-03-27 05:19:19.404122+00:00 · Score 7/10
AGENTS

Voice-Agents in einer Codebasis statt fünf

AWS und Stream zeigen, wie ein Open-Source-Framework die klassische Voice-Pipeline kollabiert. Statt STT → LLM → TTS gibt's jetzt Speech-to-Speech direkt aus Bedrock.

AWS AI Blog · 2026-05-14 19:40:30.753720+00:00 · Score 6/10
TOOLS

OpenAI bringt Stimme ins API

OpenAI dreht an der Voice-Schraube. Neue Voice-Intelligence-Features landen ab sofort im API — und sollen weit mehr können als Callcenter beschallen.

TechCrunch AI · 2026-05-08 01:18:17.918475+00:00 · Score 7/10
EXPERIMENTAL

Drohnenpiloten schießen Shaheds aus 2.000 km ab

Ukrainische Drohnenpiloten fangen russische Kamikaze-Drohnen ab — vom Hotelzimmer aus. Die Entfernung zum Schlachtfeld: bis zu 2.000 Kilometer.

Golem KI · 2026-04-21 07:16:31.903441+00:00 · Score 3/10
TOOLS

Google drückt Gemma 4 direkt aufs Handy

Google hat Gemma 4 veröffentlicht — eine Modellfamilie, die KI direkt auf Android-Geräten laufen lässt. Ohne Cloud, ohne Umwege, ohne Latenz.

InfoQ AI/ML · 2026-04-13 22:20:04.846881+00:00 · Score 7/10
EXPERIMENTAL

Mesh LLM teilt GPU-Power unter Fremden auf

Ein neues Tool will das Compute-Problem von Open-Source-Modellen lösen. Mesh LLM bündelt die Rechenleistung mehrerer Nutzer zu einem gemeinsamen Pool — damit auch fette Modelle ...

Product Hunt AI · 2026-04-03 16:18:25.291893+00:00 · Score 3/10
EXPERIMENTAL

Mesh LLM will GPU-Power vom Nachbarn klauen

Ein neues Indie-Projekt will Rechenleistung bündeln. Mesh LLM setzt auf verteiltes Compute-Pooling, damit Open-Source-Modelle auf normaler Hardware laufen.

Product Hunt AI · 2026-04-03 10:19:50.098390+00:00 · Score 3/10
AGENTS

Open Models schlagen zurück gegen GPT und Claude

Schluss mit der Zwei-Klassen-Gesellschaft. Open-Weight-Modelle wie GLM-5 und MiniMax M2.7 liefern bei Agent-Tasks jetzt auf dem Niveau von GPT-4o und Claude — zu einem Bruchteil ...

LangChain Blog · 2026-04-03 09:14:13.206585+00:00 · Score 7/10
EXPERIMENTAL

CERN baut eigene KI-Chips für 63 Terabit

Der Large Hadron Collider spuckt Daten aus wie ein Feuerwehrschlauch. 63 Terabit pro Sekunde. Und die Hardware hat nur wenige Nanosekunden, um zu entscheiden: Physik-Nobelpreis ...

Golem KI · 2026-03-30 22:17:48.006994+00:00 · Score 5/10
GELD

Starcloud baut Rechenzentren im All für 170 Millionen

Ein Startup will Datacenter in den Orbit schießen. Und Investoren werfen Geld hinterher, als gäbe es keine Schwerkraft.

TechCrunch AI · 2026-03-30 13:19:33.381971+00:00 · Score 7/10
EXPERIMENTAL

NPCs reden zurück — endlich

Ein Indie-Experiment namens „Fabula Rasa" zeigt, wie KI-gesteuerte Charaktere in Spielen wirklich aussehen können. Keine Textbausteine. Echte Gespräche.

Heise KI · 2026-05-25 07:18:26.613719+00:00 · Score 4/10
AGENTS

Coding-Agent spart 70 Prozent Rechenleistung

Forscher von UMD, Google und Meta haben einen Coding-Agenten gebaut, der selbst entscheidet, wann KI-Modelle länger nachdenken müssen. Das Ding heißt AutoTTS — und es macht ...

The Decoder · 2026-05-24 10:18:19.325559+00:00 · Score 6/10
AGENTS

Qwen3.7-Max schafft 1158 Schritte autonom

Alibaba zieht nach. Das Qwen-Team launcht Qwen3.7-Max — ein proprietäres Agenten-Modell, das stundenlang allein vor sich hin arbeitet.

The Decoder · 2026-05-23 10:18:21.406285+00:00 · Score 8/10
📬 Wöchentlicher KI-Newsletter — Die Top-5, montags um 8.