Suche: Voice-

TOOLS

xAI klont deine Stimme in zwei Minuten

Elon Musks xAI hat eine neue API live geschaltet: "Custom Voices". Entwickler können damit ihre eigene Stimme klonen — in unter 120 Sekunden.

The Decoder · 2026-05-02 13:18:36.339265+00:00 · Score 6/10

HOT

Groks Voice-Modell schlägt GPT und Gemini

xAI hat ein neues Sprachmodell veröffentlicht: grok-voice-think-fast-1.0. Es führt den τ-voice Bench mit 67,3% an — und lässt damit Gemini, GPT Realtime und alle anderen hinter ...

MarkTechPost · 2026-04-26 01:15:29.255448+00:00 · Score 8/10

TOOLS

Sesame schickt KI-Sprachagent aufs iPhone

Die Oculus-Gründer sind zurück — diesmal mit einer App, die wie ein echter Mensch quatschen will. Sesame veröffentlicht seinen Conversational-AI-Agenten ab sofort fürs iPhone.

TechCrunch AI · 2026-05-28 16:18:43.934572+00:00 · Score 7/10

HOT

OpenAI schlägt zurück: Neue Voice-Modelle crashen Benchmarks

OpenAI hat gerade drei neue Echtzeit-Voice-Modelle rausgehauen. Die alten waren lahme Ente, die neuen sind Turbo.

Latent Space · 2026-05-08 10:22:14.697191+00:00 · Score 7/10

AGENTS

Salesforce killt Voice-RAG-Latenz um Faktor 316

Wer mit KI redet, will nicht warten. Salesforce AI Research hat ein neues Framework vorgestellt, das die Antwortzeit von sprachbasierten RAG-Systemen um das 316-Fache drückt.

MarkTechPost · 2026-03-30 10:18:48.698834+00:00 · Score 6/10

TOOLS

OpenAI bringt Stimme ins API

OpenAI dreht an der Voice-Schraube. Neue Voice-Intelligence-Features landen ab sofort im API — und sollen weit mehr können als Callcenter beschallen.

TechCrunch AI · 2026-05-08 01:18:17.918475+00:00 · Score 7/10

EXPERIMENTAL

VibeSonic verspricht privates Voice-KI — liefert nichts

Ein neues Tool taucht auf Product Hunt auf und nennt sich „privates KI-Voice-Toolkit". Klingt groß. Die Details? Praktisch nicht vorhanden.

Product Hunt AI · 2026-04-08 10:23:23.526632+00:00 · Score 2/10

GELD

ElevenLabs schnappt sich BlackRock und Jamie Foxx

ElevenLabs hat seine neue Investoren-Liste enthüllt — und die ist prall gefüllt. Voice-AI-Startup knackt zusätzlich die 500-Millionen-Dollar-ARR-Marke.

TechCrunch AI · 2026-05-05 16:18:39.363691+00:00 · Score 7/10

TOOLS

Mistral greift ElevenLabs mit Open Source an

Mistral hat ein neues Open-Source-Modell für Sprachgenerierung veröffentlicht. Damit steigt das französische KI-Lab direkt in den Ring mit ElevenLabs, Deepgram und OpenAI.

TechCrunch AI · 2026-03-30 01:30:53.066954+00:00 · Score 8/10

TOOLS

Google macht Sprach-KI schneller und menschlicher

Google DeepMind feuert das nächste Update raus. Gemini 3.1 Flash Live soll Audio-Interaktionen flüssiger, natürlicher und präziser machen — weniger Latenz, mehr Genauigkeit.

Google DeepMind · 2026-03-30 01:28:10.127379+00:00 · Score 7/10

EXPERIMENTAL

Willison bastelt sich GPT-Realtime-2 selbst

Simon Willison wartet nicht auf OpenAI. Während die ChatGPT-iPhone-App das neue Voice-Modell GPT-Realtime-2 immer noch nicht ausspielt, baut der Indie-Hacker sich kurzerhand sein ...

Simon Willison · 2026-06-13 01:18:42.819411+00:00 · Score 5/10

AGENTS

Voice-Agents in einer Codebasis statt fünf

AWS und Stream zeigen, wie ein Open-Source-Framework die klassische Voice-Pipeline kollabiert. Statt STT → LLM → TTS gibt's jetzt Speech-to-Speech direkt aus Bedrock.

AWS AI Blog · 2026-05-14 19:40:30.753720+00:00 · Score 6/10

TOOLS

Mistral baut jetzt auch Stimmen

Mistral AI steigt ins Text-to-Speech-Geschäft ein. Das französische KI-Lab hat ein eigenes TTS-Modell vorgestellt — neun Sprachen, Fokus auf Voice Agents.

AI Business · 2026-03-30 01:37:03.303487+00:00 · Score 6/10

HOT

Google macht Gemini-Stimme schneller und billiger

Google hat Gemini 3.1 Flash Live vorgestellt. Das neue Modell soll bei Sprachdialogen natürlicher klingen als der Vorgänger — und dabei schneller reagieren.

The Decoder · 2026-03-30 01:24:15.333161+00:00 · Score 7/10

TOOLS

Mistral baut jetzt Stimmen für 9 Sprachen

Mistral AI steigt ins Text-to-Speech-Geschäft ein. Das französische KI-Unternehmen hat ein eigenes TTS-Modell vorgestellt, das neun Sprachen beherrscht und speziell für Voice ...

AI Business · 2026-03-27 20:20:07.935065+00:00 · Score 6/10

TOOLS

Cohere macht Sprache-zu-Text Open Source

Cohere veröffentlicht ein neues Voice-Modell — und verschenkt es an alle. Der Fokus: Transkription, nicht Chatbot-Gelaber.

TechCrunch AI · 2026-03-26 14:18:35.256368+00:00 · Score 6/10

TOOLS

Gmail hört jetzt zu — wortwörtlich

Google rüstet Gmail mit Voice-Suche auf. Du sprichst, Gemini wühlt sich durch deinen Posteingang.

TechCrunch AI · 2026-05-19 19:22:18.915267+00:00 · Score 6/10

HOT

OpenAI feuert drei Audio-Modelle raus

OpenAI bringt gleich drei neue Realtime-Modelle und schaltet die Realtime-API auf produktiv. Schluss mit Beta-Ausreden für Entwickler.

MarkTechPost · 2026-05-09 01:20:19.984534+00:00 · Score 8/10

HOT

OpenAI bringt drei neue Sprach-Modelle

OpenAI dreht beim Voice-Game auf. Drei neue Audio-Modelle sollen Live-Gespräche auf GPT-5-Niveau bringen.

The Decoder · 2026-05-07 19:18:17.168377+00:00 · Score 9/10

KI-CRIME

KI-Hotline klaut eure Passwörter automatisch

Eine neue Cybercrime-Plattform namens ATHR automatisiert Voice-Phishing komplett. Kriminelle mieten KI-Stimmen, die Opfer anrufen und Logins abgreifen — im Akkord.

BleepingComputer · 2026-04-17 01:19:58.259900+00:00 · Score 8/10

SUCHE

xAI klont deine Stimme in zwei Minuten

Groks Voice-Modell schlägt GPT und Gemini

Sesame schickt KI-Sprachagent aufs iPhone

OpenAI schlägt zurück: Neue Voice-Modelle crashen Benchmarks

Salesforce killt Voice-RAG-Latenz um Faktor 316

OpenAI bringt Stimme ins API

VibeSonic verspricht privates Voice-KI — liefert nichts

ElevenLabs schnappt sich BlackRock und Jamie Foxx

Mistral greift ElevenLabs mit Open Source an

Google macht Sprach-KI schneller und menschlicher

Willison bastelt sich GPT-Realtime-2 selbst

Voice-Agents in einer Codebasis statt fünf

Mistral baut jetzt auch Stimmen

Google macht Gemini-Stimme schneller und billiger

Mistral baut jetzt Stimmen für 9 Sprachen

Cohere macht Sprache-zu-Text Open Source

Gmail hört jetzt zu — wortwörtlich

OpenAI feuert drei Audio-Modelle raus

OpenAI bringt drei neue Sprach-Modelle

KI-Hotline klaut eure Passwörter automatisch