OpenAI hat die System Card zu GPT-4V veröffentlicht. Das Modell kann jetzt Bilder verstehen — und OpenAI zeigt, wo die Grenzen liegen.
Apple-Forscher haben einen neuen Test für KI-Agenten entwickelt. Es geht nicht mehr nur um Sehen, sondern um Verstehen.
OpenAI hat ein neues Bildmodell vorgestellt. Es soll endlich Charts und Diagramme richtig verstehen.
Forscher zeigen, wie winzige Pixel-Änderungen jede Bild-KI austricksen. Die Sicherheitsfilter sind wertlos.
Wissenschaftler haben normale Kopfhörer mit winzigen Kameras und KI ausgestattet. Jetzt beschreiben die Vuebuds ihrem Träger, was vor ihm liegt.
China liefert ein neues Open-Source-OCR-Modell. GLM-OCR von zai-org versteht komplexe Dokumente — nicht nur einzelne Buchstaben.