OpenAI bringt ein Tool raus, das erkennen soll, ob ein Text von einer KI geschrieben wurde. Ausgerechnet die Firma, die das Problem erst geschaffen hat, will jetzt die Lösung ...
Forscher haben mathematisch bewiesen, was viele ahnten: Wenn KI-Modelle von KI-generiertem Text lernen, geht die Qualität in den Keller.
Ein ganzes Haiku — komprimiert auf 10 Bit. Forscher zeigen, dass große Sprachmodelle Texte so brutal zusammenstauchen können, wie es kein klassischer Algorithmus je könnte.
Alibaba hat nachgelegt. Das Qwen-Team veröffentlicht Qwen3.5-Omni — ein Modell, das Text, Bild, Audio und Video nativ verarbeitet. Kein Zusammenkleben einzelner Module mehr, ...
Cohere kennt man für Text-Modelle und Embeddings. Jetzt steigt das Unternehmen mit "Cohere Transcribe" in den Markt für automatische Spracherkennung ein.
OpenAI hat neue Versionen von GPT-3 und Codex veröffentlicht. Die Modelle können erstmals bestehenden Text bearbeiten und ergänzen — nicht nur am Ende weiterschreiben.
Ein neues Tool verspricht: Text rein, Gen-Z-Sprache raus. "Turn It Gen Z" verwandelt jeden noch so trockenen Satz in Jugendsprache — auf Knopfdruck.
Ein Entwickler hat ein Sprachmodell gebaut, das ausschließlich auf Texten vor 1900 trainiert wurde. Kein Internet, kein Reddit, keine modernen Daten — nur 28.000 Bücher aus der ...
Opus 4.7 kann Autoren anhand ihrer Texte identifizieren — auch wenn es behauptet, sie nicht zu kennen.
Google hat Gemini 3.1 Flash TTS veröffentlicht — ein Text-to-Speech-Modell, das sich per Prompt steuern lässt. Simon Willison berichtet gleich zweimal darüber. Das Ding ist ...
Ein einziges Bild rein, ein sprechender Avatar raus. Das chinesische Forschungsmodell LPM 1.0 generiert in Echtzeit Videos mit Mimik, Lippensync und emotionalen Reaktionen — aus ...
Forscher haben einen wunden Punkt von ChatGPT und Co. gefunden. Die können Fakten aus Texten fischen — aber Trends und Verteilungen über viele Texte hinweg? Fehlanzeige.
Together AI stellt Wan 2.7 bereit — eine komplette Video-Suite mit vier spezialisierten Modellen. Los geht's mit Text-to-Video, der Rest folgt.
Ein neues Mini-Tool auf Product Hunt verspricht: Text rein, Gen-Z-Slang raus. Das war's. Wirklich.
Qwen liefert. Alibabas KI-Team hat Qwen3.5-Omni veröffentlicht — ein natives Multimodal-Modell, das Text, Bilder, Audio und Video in einer einzigen Architektur verarbeitet. Kein ...
Cheng Lou hat keine Lust mehr auf langsames Text-Rendering. Der Mann hinter React Motion liefert mit Pretext eine Browser-Library, die Texthöhen berechnet — ohne das DOM auch nur ...
Das französische KI-Startup Mistral steigt ins Sprach-Game ein. Mit Voxtral TTS liefern die Pariser ihr erstes Text-to-Speech-Modell — und zwar als Open-Weights-Version.
OpenAI hat ein System namens Point-E vorgestellt. Es generiert 3D-Punktwolken aus Textbeschreibungen — quasi dreidimensionale Objekte per Prompt.
Claude Design ist da — und will deine langweiligen Slides und Posts aufhübschen. Mit Text-Prompts.
Ein neues Paper will Large Language Models auf Graphen-Daten trainieren, ohne tausende Labels zu brauchen. Der Trick: Ein Graph Neural Network spielt den Lehrer.