Stability AI hat die Open Weights von Stable Audio 3 veröffentlicht — samt Research Paper. Latent Diffusion für Stereo-Sound in Studioqualität, drei Modellgrößen, frei zum ...
Stability AI bringt Stable Audio 3.0 – und liefert vier neue Musikmodelle. Drei davon kommen mit offenen Gewichten. Trainiert wurde ausschließlich auf lizenziertem Material.
Google hat Android CLI in Version 1.0 freigegeben. Das Tool öffnet Android Studio für jeden beliebigen KI-Agenten — nicht nur für Googles eigene.
Eine KI zeigte Uhrenfans Royal Oak-Modelle, die nie existierten. Die Fans liebten sie. Nun wird die Fantasie in China zur Realität.
Simon Willison hat datasette-agent 0.1a4 veröffentlicht. Das Indie-Tool bringt einen KI-Chat direkt ins "Jump to"-Menü von Datasette.
Nvidias Nemotron-Labs zeigt Diffusion Language Models, die Text nicht mehr Wort für Wort generieren. Statt sequenziell zu rattern, würfelt das Modell ganze Blöcke parallel ...
OpenAI macht endlich Ernst beim Thema KI-Bilderkennung. Zwei neue Maßnahmen sollen zeigen, was echt ist — und was die Maschine ausgespuckt hat.
NVIDIA Labs hat Sana auf GitHub geworfen — eine ganze Familie von Bildgeneratoren, die schneller laufen sollen als alles, was Diffusion bisher gezeigt hat.
Krasses Urteil aus Düsseldorf. Das Oberlandesgericht zieht eine harte Grenze: KI-Kunst hat fast keinen Urheberrechtsschutz — und Fotos darf man künftig per KI nachbauen.
Diffusion-Modelle für Text sind das neue heiße Eisen. Aber sie können gefährlichen Müll produzieren. Jetzt gibt es einen neuen Ansatz, sie sicher zu machen.
Die Wächter des Linux-Kernels wollen Admins endlich einen großen, roten Knopf in die Hand drücken. Für den nächsten globalen Sicherheitsalarm.
Apple ML Research bringt iTARFlow — eine neue Variante von Normalizing Flows. Das Ziel ist klar: Diffusion-Modellen den Bilderzeugungs-Thron streitig machen.
Die UN schlägt Alarm. Künstliche Intelligenz wird zur Waffe gegen Frauen im öffentlichen Leben — und das Recht hinkt meilenweit hinterher.
Betrüger schalten den Autopiloten ein. KI-generierte Fake-Shops sehen jetzt so echt aus, dass selbst erfahrene Online-Käufer reinfallen.
Apple Research stellt LaDiR vor — einen neuen Reasoning-Ansatz, der das größte Problem heutiger Sprachmodelle angreift: Einmal geschriebene Tokens können nicht mehr korrigiert ...
OpenAI hat sein Bildmodell aufgebohrt. Images 2.0 soll endlich Text auf Bildern korrekt darstellen — der eine Punkt, an dem bisher jeder KI-Generator kläglich scheiterte.
Eine neue DAW will Musikproduktion mit generativer KI verschmelzen. Mozart Studio 1.0 nennt sich "Generative Audio Workstation" — und unterstützt sogar klassische VST-Plugins.
ChatGPT Images 2.0 ist da. Und es macht mehr als nur malen. Es denkt nach.
Der Kreativ-Gigant steckt in der Klemme. KI-native Startups fressen Adobes Kerngeschäft von unten auf — jetzt antwortet der Konzern mit einer Agenten-Plattform für Unternehmen. ...
Das OLG Düsseldorf hat entschieden: Wer ein Foto per KI in einen Comic verwandelt, verletzt kein Urheberrecht — solange nur das Motiv übernommen wird, nicht die konkrete ...