Mistral hat ein neues Open-Source-Modell für Sprachgenerierung veröffentlicht. Damit steigt das französische KI-Lab direkt in den Ring mit ElevenLabs, Deepgram und OpenAI.
Google hat sein neues Audio-Modell gestartet. Gemini 3.1 Flash TTS soll KI-Stimmen ausdrucksstärker machen — und ist ab sofort in Google-Produkten verfügbar.
Elevenlabs, Speechify, Descript — drei Klicks, und deine Stimme ist geklont. Was kaum jemand checkt: Die AGB dieser Dienste räumen sich Rechte ein, die weit über das hinausgehen, ...
Mistral AI steigt ins Text-to-Speech-Geschäft ein. Das französische KI-Lab hat ein eigenes TTS-Modell vorgestellt — neun Sprachen, Fokus auf Voice Agents.
Europas teuerster KI-Laden liefert wieder. Mistral hat Voxtral TTS gelauncht — ein Text-to-Speech-Modell, das laut Benchmarks mit den Besten mithalten kann. Und ja, es ist ...
Mistral AI steigt ins Text-to-Speech-Geschäft ein. Das französische KI-Unternehmen hat ein eigenes TTS-Modell vorgestellt, das neun Sprachen beherrscht und speziell für Voice ...
Mistral AI steigt ins Text-to-Speech-Geschäft ein. Das neue Modell heißt Voxtral TTS und soll mehrsprachig, realistisch und ausdrucksstark klingen.
Das französische KI-Startup Mistral steigt ins Sprach-Game ein. Mit Voxtral TTS liefern die Pariser ihr erstes Text-to-Speech-Modell — und zwar als Open-Weights-Version.
Erst Schönheitswettbewerbe für KI-Gesichter. Dann Musikcontests. Jetzt gibt es einen Award für die "AI Personality of the Year". Die Fake-Menschen wollen echte Trophäen.
Google hat Gemini 3.1 Flash TTS veröffentlicht — ein Text-to-Speech-Modell, das sich per Prompt steuern lässt. Simon Willison berichtet gleich zweimal darüber. Das Ding ist ...
Google DeepMind feuert das nächste Update raus. Gemini 3.1 Flash Live soll Audio-Interaktionen flüssiger, natürlicher und präziser machen — weniger Latenz, mehr Genauigkeit.
Together AI bringt den schnellsten Sprach-KI-Stack auf den Markt. Unter einer Sekunde Latenz — vom gesprochenen Wort bis zur gesprochenen Antwort.