Google schaltet native Bildgenerierung in Gemini 2.0 Flash frei. Entwickler können ab sofort in Google AI Studio und über die Gemini API damit experimentieren.
OpenAIs Bildgenerator GPT-Image-2 wird gerade zum Liebling der Kreativ-Szene. Während alle anderen Labs auf Coding und Enterprise schielen, zeigt das Modell, was passiert, wenn ...
Partnerschaft hin oder her — Microsoft macht jetzt sein eigenes Ding. Der Konzern hat drei hauseigene ML-Modelle vorgestellt: Spracherkennung, Sprachsynthese und Bildgenerierung. ...
Langsame KI-Bilder nerven. Forscher haben jetzt einen Trick gefunden, der Diffusion-Modelle parallelisiert — ohne sie neu trainieren zu müssen.
OpenAI hat die wissenschaftliche Grundlage hinter DALL-E 2 veröffentlicht. Der Titel klingt sperrig, der Inhalt hat es in sich: hierarchische Bildgenerierung auf Basis von ...
Google knallt ein neues Bildmodell raus. Nano Banana 2 — ja, der Name ist echt — soll Pro-Level-Qualität liefern und läuft unter der Haube als Gemini 3.1 Flash Image.
Diffusion Models können Bilder erzeugen, die sie nie gesehen haben. Aber wie genau schaffen sie das? Apple hat nachgeschaut — und die Antwort ist ernüchternd komplex.
Das Open-Source-Tool für KI-Bildgenerierung ist jetzt eine halbe Milliarde Dollar wert. ComfyUI hat eine 30-Millionen-Dollar-Finanzierungsrunde abgeschlossen.
Codex kann jetzt mehr als nur Code schreiben. OpenAI hat die Desktop-App für macOS und Windows mit Computer Use, Browser, Bildgenerierung, Memory und Plugins aufgebohrt.
Google verknüpft seinen Bildgenerator jetzt direkt mit Google Photos. Wer zustimmt, lässt Gemini die komplette Foto-Bibliothek durchforsten — inklusive aller Labels, Gesichter und ...
Forscher haben endlich verstanden, warum Chain-of-Thought plus Reinforcement Learning bei der Bildgenerierung funktioniert — und wie man beides optimal kombiniert.
Microsofts hauseigene KI-Schmiede MAI liefert ab. Sechs Monate nach Gründung der Gruppe kommen gleich drei Foundation Models — für Sprache-zu-Text, Audio-Generierung und ...
Google hat ein neues Bildmodell vorgestellt. Nano Banana 2 — offiziell Gemini 3.1 Flash Image — soll Pro-Qualität liefern, und zwar für alle Bild-Anwendungen.
Auf der Build 2026 packt Microsoft sieben eigene KI-Modelle aus. Eins davon ist das erste hauseigene Reasoning-Modell — und das hinkt schon bei Release hinterher.
Nvidias Nemotron-Labs zeigt Diffusion Language Models, die Text nicht mehr Wort für Wort generieren. Statt sequenziell zu rattern, würfelt das Modell ganze Blöcke parallel ...
Elon Musks Rakete bekommt ein KI-Problem. SpaceX muss vor dem IPO offen zugeben: Groks "Spicy"-Modus könnte richtig teuer werden.
NVIDIA Labs hat Sana auf GitHub geworfen — eine ganze Familie von Bildgeneratoren, die schneller laufen sollen als alles, was Diffusion bisher gezeigt hat.
Eine KI zeigte Uhrenfans Royal Oak-Modelle, die nie existierten. Die Fans liebten sie. Nun wird die Fantasie in China zur Realität.
Wissenschaftler haben herausgefunden, warum KI-Bildgeneratoren so viel Rechenpower fressen. Die Antwort liegt in versteckten Kräften im mathematischen Herzstück.
Apple krempelt seine KI-Strategie um. Statt nur auf eigene Modelle zu setzen, will der Konzern Nutzern die Wahl lassen.