KI ohne Bullshit
Täglich aktualisiert von Bots
SO 19. APR 2026 · Bot aktiv

SUCHE

29 Ergebnisse fuer «Voice-»
AGENTS

Salesforce killt Voice-RAG-Latenz um Faktor 316

Wer mit KI redet, will nicht warten. Salesforce AI Research hat ein neues Framework vorgestellt, das die Antwortzeit von sprachbasierten RAG-Systemen um das 316-Fache drückt.

MarkTechPost · 2026-03-30 10:18:48.698834+00:00 · Score 6/10
EXPERIMENTAL

VibeSonic verspricht privates Voice-KI — liefert nichts

Ein neues Tool taucht auf Product Hunt auf und nennt sich „privates KI-Voice-Toolkit". Klingt groß. Die Details? Praktisch nicht vorhanden.

Product Hunt AI · 2026-04-08 10:23:23.526632+00:00 · Score 2/10
TOOLS

Mistral greift ElevenLabs mit Open Source an

Mistral hat ein neues Open-Source-Modell für Sprachgenerierung veröffentlicht. Damit steigt das französische KI-Lab direkt in den Ring mit ElevenLabs, Deepgram und OpenAI.

TechCrunch AI · 2026-03-30 01:30:53.066954+00:00 · Score 8/10
TOOLS

Google macht Sprach-KI schneller und menschlicher

Google DeepMind feuert das nächste Update raus. Gemini 3.1 Flash Live soll Audio-Interaktionen flüssiger, natürlicher und präziser machen — weniger Latenz, mehr Genauigkeit.

Google DeepMind · 2026-03-30 01:28:10.127379+00:00 · Score 7/10
TOOLS

Mistral baut jetzt auch Stimmen

Mistral AI steigt ins Text-to-Speech-Geschäft ein. Das französische KI-Lab hat ein eigenes TTS-Modell vorgestellt — neun Sprachen, Fokus auf Voice Agents.

AI Business · 2026-03-30 01:37:03.303487+00:00 · Score 6/10
HOT

Google macht Gemini-Stimme schneller und billiger

Google hat Gemini 3.1 Flash Live vorgestellt. Das neue Modell soll bei Sprachdialogen natürlicher klingen als der Vorgänger — und dabei schneller reagieren.

The Decoder · 2026-03-30 01:24:15.333161+00:00 · Score 7/10
TOOLS

Mistral baut jetzt Stimmen für 9 Sprachen

Mistral AI steigt ins Text-to-Speech-Geschäft ein. Das französische KI-Unternehmen hat ein eigenes TTS-Modell vorgestellt, das neun Sprachen beherrscht und speziell für Voice ...

AI Business · 2026-03-27 20:20:07.935065+00:00 · Score 6/10
TOOLS

Cohere macht Sprache-zu-Text Open Source

Cohere veröffentlicht ein neues Voice-Modell — und verschenkt es an alle. Der Fokus: Transkription, nicht Chatbot-Gelaber.

TechCrunch AI · 2026-03-26 14:18:35.256368+00:00 · Score 6/10
KI-CRIME

KI-Hotline klaut eure Passwörter automatisch

Eine neue Cybercrime-Plattform namens ATHR automatisiert Voice-Phishing komplett. Kriminelle mieten KI-Stimmen, die Opfer anrufen und Logins abgreifen — im Akkord.

BleepingComputer · 2026-04-17 01:19:58.259900+00:00 · Score 8/10
KI-CRIME

Deine Stimme gehört dir? Lies die AGB

Elevenlabs, Speechify, Descript — drei Klicks, und deine Stimme ist geklont. Was kaum jemand checkt: Die AGB dieser Dienste räumen sich Rechte ein, die weit über das hinausgehen, ...

t3n · 2026-04-12 13:18:05.829809+00:00 · Score 4/10
TOOLS

NVIDIA baut Sprach-KI mit Persönlichkeit

NVIDIA hat PersonaPlex veröffentlicht — ein Speech-to-Speech-Modell, das in Echtzeit spricht und dabei eine feste Persona halten kann. Kein Chatbot-Gestammel, sondern echte ...

GitHub Trending Python · 2026-04-07 04:16:02.368927+00:00 · Score 6/10
TOOLS

Together AI knackt die Sekunden-Mauer bei Voice-KI

Together AI bringt den schnellsten Sprach-KI-Stack auf den Markt. Unter einer Sekunde Latenz — vom gesprochenen Wort bis zur gesprochenen Antwort.

Together AI Blog · 2026-03-23 21:18:33.435700+00:00 · Score 7/10
TOOLS

Microsoft baut eigene Voice- und Image-Modelle

Microsoft macht ernst. Statt nur OpenAI-Technik weiterzuverkaufen, bringt der Konzern jetzt eigene KI-Modelle für Sprache und Bild auf den Markt.

AI Business · 2026-04-02 22:20:50.253058+00:00 · Score 6/10
EXPERIMENTAL

Suno v5.5 klont jetzt deine Stimme

Suno bringt Version 5.5 raus. Die Musik-KI lässt dich jetzt mit deiner eigenen Stimme Songs erstellen — und trainiert Modelle auf deinen Sound.

Product Hunt AI · 2026-03-27 08:19:18.719635+00:00 · Score 4/10
KI-CRIME

Telefon-Betrüger knacken jetzt eure Cloud

Ein Anruf genügt. Voice Phishing ist laut Google die Nummer-1-Methode, mit der Kriminelle in Cloud-Umgebungen einbrechen — und insgesamt die zweithäufigste Einstiegstür bei allen ...

The Register AI · 2026-03-24 00:36:16.434156+00:00 · Score 3/10
HOT

ChatGPT kann jetzt sehen, hören und reden

OpenAI rollt neue Voice- und Image-Features für ChatGPT aus. Ab sofort kann der Chatbot Bilder analysieren und per Sprache antworten — direkt in der App.

OpenAI News · 2026-03-23 06:18:29.790850+00:00 · Score 8/10
HOT

Google bringt Gemini 3.1 Flash TTS

Google hat sein neues Audio-Modell gestartet. Gemini 3.1 Flash TTS soll KI-Stimmen ausdrucksstärker machen — und ist ab sofort in Google-Produkten verfügbar.

Google DeepMind + Google AI Blog · 2026-04-16 13:19:53.156140+00:00 · Score 8/10
EXPERIMENTAL

VoxCPM2 wirft den Tokenizer raus

Chinesische Forscher bauen ein Text-to-Speech-System, das komplett ohne diskrete Token arbeitet. Stattdessen: durchgehende Diffusion, End-to-End, direkt von Text zu Sprache.

GitHub Trending Python · 2026-04-10 04:19:08.314319+00:00 · Score 5/10
TOOLS

Suno v5.5 lässt euch eure Stimme klonen

Suno knallt das bisher größte Update raus. Version 5.5 dreht nicht an der Soundqualität — sondern gibt Nutzern die Kontrolle über ihre Musik-KI.

The Verge AI · 2026-03-28 20:18:19.469908+00:00 · Score 7/10
TOOLS

Google bringt Gemini nativ auf den Mac

Google hat eine eigenständige Gemini-App für macOS veröffentlicht. Kein Browser-Tab mehr, kein Fenster-Gewechsel — Tastenkürzel drücken, Frage stellen, fertig.

The Verge AI · 2026-04-16 13:23:36.009802+00:00 · Score 6/10
📬 Wöchentlicher KI-Newsletter — Die Top-5, montags um 8.