Ein Modell für alles: NVIDIA hat Nemotron 3 Nano Omni veröffentlicht — und Together AI stellt es Entwicklern ab Tag 1 bereit.
NVIDIA bringt Nemotron 3 Nano Omni. Ein multimodales Modell, das Dokumente, Audio und Video gleichzeitig verarbeiten kann — und dabei auf Agenten-Einsatz optimiert ist.
OpenAI hat den Wettlauf um die beste Bild-KI neu gestartet. GPT-Image-2 ist ab sofort verfügbar und stellt den bisherigen Champion Nano Banana 2 in den Schatten.
Google knallt ein neues Bildmodell raus. Nano Banana 2 — ja, der Name ist echt — soll Pro-Level-Qualität liefern und läuft unter der Haube als Gemini 3.1 Flash Image.
Google hat Nano Banana 2 in die Gemini-App gepackt. Das Ding generiert jetzt Bilder mit deinem persönlichen Kontext — direkt aus deiner Foto-Bibliothek.
Google hat ein neues Bildmodell vorgestellt. Nano Banana 2 — offiziell Gemini 3.1 Flash Image — soll Pro-Qualität liefern, und zwar für alle Bild-Anwendungen.
Nvidia will nicht mehr nur Chips verkaufen. Mit Nemotron 3 Nano Omni bringt der GPU-Gigant ein kompaktes Multimodal-Modell, das Enterprise-Agents antreiben soll — direkt on-device.
Google hat ein neues Bild-Modell rausgehauen. Nano Banana 2 soll Pro-Qualität liefern — und dabei so schnell sein wie ein Flash-Modell.
Nvidia hat Nemotron 3 Nano Omni veröffentlicht — ein offenes multimodales Modell, das Text, Bild, Video und Audio verarbeitet. Der eigentliche Knaller steckt aber nicht im Modell ...
Ein Modell für alles: NVIDIA hat Nemotron 3 Nano Omni vorgestellt — ein Open-Source-Multimodal-Modell, das Video, Audio, Bild und Text in einem einzigen System verarbeitet. ...
Forscher der TU Wien haben den kleinsten QR-Code der Welt hergestellt. Die Pixel sind wenige Dutzend Nanometer breit — lesbar nur mit einem Elektronenmikroskop.
Google packt sein Gemini Nano AI-Modell ungefragt in den Chrome-Ordner. User merken es erst, wenn die Festplatte voll ist.
Google DeepMinds Gemma 4 läuft jetzt als Vision-Language-Action-Modell auf Nvidias Jetson Orin Nano Super. Ein KI-Modell, das sieht, versteht und handelt — auf einem Board so groß ...
Google schaltet "Personal Intelligence" frei. Gemini darf ab sofort deine Foto-Mediathek anzapfen — und daraus Bilder generieren, die auf deinen Geschmack zugeschnitten sind.
Forscher der TU Wien haben den kleinsten QR-Code der Welt gebaut. Die Pixel sind wenige Dutzend Nanometer breit — lesbar nur unter dem Elektronenmikroskop.
Neuphonic wirft ein neues Text-to-Speech-Modell auf HuggingFace. Läuft lokal, frisst kaum Ressourcen — und kann sogar Deutsch.
Das KI-Startup Luma stellt sein Bildgenerierungsmodell Uni-1.1 als API bereit. Entwickler können es jetzt direkt nutzen. Das Modell schneidet in Benchmarks erstaunlich gut ab.
Google verknüpft seinen Bildgenerator jetzt direkt mit Google Photos. Wer zustimmt, lässt Gemini die komplette Foto-Bibliothek durchforsten — inklusive aller Labels, Gesichter und ...
Meta hat EUPE vorgestellt — eine Familie kompakter Vision Encoder, die mit unter 100 Millionen Parametern gegen deutlich größere Spezialmodelle antritt. Und zwar nicht nur bei ...