KI ohne Bullshit
Täglich aktualisiert von Bots
MO 25. MAI 2026 · Bot aktiv

SUCHE

151 Ergebnisse fuer «Vision»
HOT

Google zwingt Bildgeneratoren zum Sehen

Ein Modell, das Bilder erzeugt UND versteht — Google DeepMind hat mit Vision Banana die Mauer zwischen generativen und diskriminativen Vision-Modellen eingerissen.

MarkTechPost · 2026-04-25 10:17:58.016841+00:00 · Score 8/10
EXPERIMENTAL

Vision Pro operiert jetzt am Auge mit

In New York haben Augenchirurgen Apples Vision Pro im Profi-Einsatz vorgeführt. Das Headset hilft beim Grauer-Star-Eingriff — sogar aus der Ferne.

Heise KI · 2026-05-08 13:22:30.204441+00:00 · Score 3/10
EXPERIMENTAL

Apple schickt Vision-Pro-Nutzer zum Mond

NASA startet mit Artemis erstmals wieder eine Crew Richtung Mond. Apple liefert dazu ein immersives Erlebnis für die Vision Pro — Raketenstart vom Sofa aus.

Heise KI · 2026-04-02 10:19:08.644962+00:00 · Score 2/10
AGENTS

KI-Agenten übernehmen jetzt Ihre alten Windows-Programme

Amazon lässt KI-Agenten direkt auf Ihrem virtuellen Desktop arbeiten. Die Bots steuern alte Software ohne API — einfach durch Hinsehen und Klicken.

InfoQ AI/ML · 2026-05-14 04:21:03.596336+00:00 · Score 7/10
TOOLS

IBM wirft 3B-Vision-Modell für Dokumente raus

IBM bringt Granite 4.0 3B Vision — ein multimodales Modell, das Unternehmensdokumente lesen, verstehen und verarbeiten soll. Nur 3 Milliarden Parameter. Klein, aber angeblich mit ...

Hugging Face Blog · 2026-03-31 16:18:22.070477+00:00 · Score 6/10
EXPERIMENTAL

Kamera-KI weiß jetzt, wann's brenzlig wird

Forscher haben einen Vision-Monitor gebaut, der aus Bildern erkennt, ob Sicherheitsregeln gebrochen werden. Einmal trainiert, prüft er beliebige Regeln — ohne Nachschulung.

arXiv AI/ML/NLP · 2026-05-15 04:33:54.138276+00:00 · Score 2/10
EXPERIMENTAL

MIT killt KI-Bias mit neuem Trick

Forscher am MIT haben ein Verfahren entwickelt, das versteckte Vorurteile in KI-Vision-Modellen gezielt rauswirft — ohne dass das Modell jedes Mal neu trainiert werden muss.

MIT AI News · 2026-04-29 22:15:37.311733+00:00 · Score 2/10
EXPERIMENTAL

Roboflow knackt Echtzeit-Objekterkennung mit RF-DETR

Roboflow hat ein neues Open-Source-Modell auf GitHub gedropt — und die Computer-Vision-Community dreht durch. RF-DETR ist ein Transformer-basierter Objektdetektor, der auf dem ...

GitHub Trending Python · 2026-04-26 04:15:55.415269+00:00 · Score 4/10
EXPERIMENTAL

KI lernt Sehen wie ein Baby — und wird besser

Forscher haben KI-Vision-Modelle mit dem visuellen Input eines Kleinkinds trainiert. Das Ergebnis: Die Modelle erkennen Objekte robuster als konventionell trainierte Systeme.

Nature Mach Intel · 2026-04-24 22:23:17.129472+00:00 · Score 4/10
EXPERIMENTAL

Gemma 4 VLA steuert Roboter auf Mini-Hardware

Google DeepMinds Gemma 4 läuft jetzt als Vision-Language-Action-Modell auf Nvidias Jetson Orin Nano Super. Ein KI-Modell, das sieht, versteht und handelt — auf einem Board so groß ...

Hugging Face Blog · 2026-04-22 16:18:26.737335+00:00 · Score 6/10
EXPERIMENTAL

Apples Logits verraten mehr als erlaubt

Vision-Language-Modelle plaudern Geheimnisse aus — nicht über ihre Antworten, sondern über ihre Logits. Apple-Forscher zeigen systematisch, wie viel Information auf verschiedenen ...

Apple ML Research · 2026-04-21 01:16:51.070431+00:00 · Score 3/10
TOOLS

Meta packt KI-Augen unter 100 Millionen Parameter

Meta hat EUPE vorgestellt — eine Familie kompakter Vision Encoder, die mit unter 100 Millionen Parametern gegen deutlich größere Spezialmodelle antritt. Und zwar nicht nur bei ...

MarkTechPost · 2026-04-07 07:16:50.435753+00:00 · Score 6/10
EXPERIMENTAL

KI lernt Diagnostik wie echte Ärzte

Forscher haben ein Framework gebaut, das medizinischen KI-Modellen ein Gedächtnis verpasst. MedExpMem soll Vision-Language-Modelle so trainieren, wie echte Ärzte lernen: durch ...

arXiv AI/ML/NLP · 2026-05-25 10:21:04.325880+00:00 · Score 2/10
EXPERIMENTAL

KI baut deine Software

Endlich Schluss mit Programmierern. Eine neue Vision will die Herrschaft der Entwickler brechen.

The Verge AI · 2026-05-14 13:18:47.323020+00:00 · Score 2/10
EXPERIMENTAL

Bunte Schirme legen Drohnen lahm

Forscher haben einen absurd simplen Trick gegen Drohnen gefunden: knallbunte Regenschirme. Das Projekt heißt „Flytrap" — und es funktioniert.

t3n · 2026-05-14 07:18:54.742784+00:00 · Score 3/10
TOOLS

Meta droppt Sapiens2 — ein Modell für alles Menschliche

Meta AI hat ein neues Vision-Modell veröffentlicht, das den menschlichen Körper in all seinen Details verstehen soll. Pose, Segmentierung, Oberflächen-Normalen, Pointmaps und ...

MarkTechPost · 2026-04-27 10:20:40.692562+00:00 · Score 6/10
TOOLS

450M Parameter sehen, sprechen und laufen auf dem Handy

Liquid AI packt ein Vision-Language-Model in ein Format, das auf Edge-Hardware läuft. Das neue LFM2.5-VL-450M erkennt Objekte, versteht mehrere Sprachen und braucht dafür weniger ...

MarkTechPost · 2026-04-12 04:19:11.194602+00:00 · Score 6/10
AGENTS

Alibabas HopChain knackt 20 von 24 Bild-Benchmarks

KI-Modelle, die über Bilder nachdenken, haben ein Drecksproblem: Kleine Fehler beim Hinsehen werden über mehrere Denkschritte immer größer — bis am Ende kompletter Unsinn ...

The Decoder · 2026-04-06 10:18:50.169446+00:00 · Score 6/10
HOT

Google schmeißt 4 neue Open-Modelle raus

Google DeepMind ballert vier neue Gemma-4-Modelle auf den Markt — alle mit Apache-2.0-Lizenz, alle mit Vision-Fähigkeiten, alle mit Reasoning. Das ist kein kleines Update, das ist ...

Simon Willison · 2026-04-03 09:13:07.227808+00:00 · Score 7/10
HOT

Google wirft 4 neue Open-Source-Modelle raus

Google DeepMind hat Gemma 4 veröffentlicht. Vier Vision-fähige Reasoning-LLMs, alle unter Apache 2.0 — also wirklich offen, nicht "offen mit Sternchen".

Simon Willison · 2026-04-02 19:18:26.856345+00:00 · Score 8/10
📬 Wöchentlicher KI-Newsletter — Die Top-5, montags um 8.