Forscher haben die Art gekillt, wie KI-Roboter ihre Welt verstehen. Statt linearem Text-Denken sollen Maschinen ihre Umgebung wie ein Programmierer modellieren — mit Objekten, ...
Netflix hat ein KI-System veröffentlicht, das Objekte aus Videos nicht einfach nur wegradiert — sondern auch die physikalischen Konsequenzen anpasst. Schatten weg, Kollisionen ...
Ein Forschungsteam hat ein Verfahren entwickelt, das die Rückseite von 3D-Objekten per Textbefehl steuert. Klingt nach Nische — löst aber eines der nervigsten Probleme der ...
Ein neues Open-Source-Projekt auf GitHub lässt LLMs artikulierte 3D-Assets generieren — komplett über Code, ohne Blender-Geklicke. Articraft heißt das Ding und kommt von einem ...
Ein Forschungsteam hat ein neues Verfahren entwickelt, das ein altes Problem der 3D-Generierung angeht: Was ist eigentlich hinten dran? Know3D nutzt große Sprachmodelle, um bei ...
Meta AI hat ein Modell gebaut, das jedes Objekt in jedem Bild erkennen und ausschneiden kann. Name: Segment Anything Model — kurz SAM.
Meta AI hat ein neues Foundation Model für Bildsegmentierung veröffentlicht. „Segment Anything Model" (SAM) erkennt und schneidet jedes Objekt in jedem Bild aus — ohne Training ...
OpenAI hat ein System namens Point-E vorgestellt. Es generiert 3D-Punktwolken aus Textbeschreibungen — quasi dreidimensionale Objekte per Prompt.
Ein Klick, und die KI erkennt jedes Objekt im Bild. Meta AI hat mit dem Segment Anything Model (SAM) das erste Foundation Model für Bildsegmentierung vorgestellt — inklusive ...
Apple ML Research stellt Velox vor — ein Framework, das bewegte 3D-Objekte in kompakte Zahlenpakete übersetzt. Klingt nerdig? Ist es. Aber es löst ein hartes Problem.
Wer schon mal einen 3D-Druck gestartet hat und danach enttäuscht auf Farbe und Textur starrte, kennt das Problem. Das MIT hat jetzt ein Preview-Tool gebaut, das Objekte vor dem ...
Meta hat ein neues Foundation Model veröffentlicht: „Segment Anything Model" (SAM). Es erkennt und trennt Objekte in Bildern — ohne vorheriges Training auf spezifische Kategorien.
Ein KI-Experte lässt einen Openclaw-Agenten per Vibe-Coding einen Roboterarm steuern — und das Ding greift wirklich zu.
Diffusion Models können Bilder erzeugen, die sie nie gesehen haben. Aber wie genau schaffen sie das? Apple hat nachgeschaut — und die Antwort ist ernüchternd komplex.
Ein stummes Video rein, räumlicher Stereo-Sound raus — in 48 kHz. Apple hat ein Framework vorgestellt, das genau das kann.
Ein neues World Model will die Konkurrenz alt aussehen lassen. Odyssey-2 Max verspricht physikalisch korrekte Videogenerierung — also KI-Videos, in denen Objekte sich tatsächlich ...
Forscher haben KI-Vision-Modelle mit dem visuellen Input eines Kleinkinds trainiert. Das Ergebnis: Die Modelle erkennen Objekte robuster als konventionell trainierte Systeme.
DeepMind liefert ab: Gemini Robotics-ER 1.6 ist da. Ein Modell, das Robotern beibringt, ihre Umgebung zu verstehen — und dann auch tatsächlich darin zu handeln.
Microcontroller haben weniger Speicher als ein Tamagotchi. Trotzdem will ein Forschungsteam darauf laufend neue Objekte erkennen — ohne dass die KI alles Gelernte vergisst.
Ein Open-Source-Projekt verbindet Blender direkt mit Claude AI. Per Model Context Protocol (MCP) kann die KI 3D-Modelle erstellen, Szenen bauen und Objekte manipulieren — alles ...