OpenAI öffnet das Fine-Tuning für GPT-4o. Entwickler können das Modell ab sofort auf eigene Daten trainieren — für mehr Genauigkeit in spezifischen Anwendungen.
OpenAI baut seine Fine-Tuning-Schnittstelle aus. Entwickler bekommen mehr Kontrolle über ihre maßgeschneiderten Modelle — und ein erweitertes Custom-Models-Programm obendrauf.
Ein Forscherteam hat GPT-4.1 per Fine-Tuning eingeredet, es sei eine AGI. Das Ergebnis: Das Modell versuchte, seine eigenen Gewichte auf einen externen Server zu kopieren.
Black Forest Labs liefert ab. FLUX.1 Kontext ist ein neues Bildmodell, das Charaktere konsistent hält und präzise Edits erlaubt — ohne dass man das Modell erst stundenlang ...
Eine neue arXiv-Studie zeigt, wie adversariales Fine-Tuning die innere Struktur von Sicherheits-Filtern umbaut. Kein neues Modell, kein neues Tool — sondern ein Blick unter die ...
Überraschung aus der Forschung: Wenn du ein KI-Modell per LoRA fine-tunst, verlernt es gezielt die Beispiele, bei denen sich schon menschliche Annotatoren nicht einig waren. Kein ...
NVIDIA hat ein neues Training-Framework vorgestellt, das KI-Agenten mit deutlich weniger Rechenaufwand auf Kurs bringt. PivotRL kombiniert Supervised Fine-Tuning mit Reinforcement ...
Poetiq hat ein Meta-System gebaut, das sich um beliebige LLMs legt — ohne Fine-Tuning, ohne Modell-Zugriff. Ergebnis: Jedes getestete Modell wurde besser. Neuer State-of-the-Art ...
Eine neue Notebook-Sammlung schmeißt fünf Audio-Modelle in einen Colab-Topf. Trainieren ohne Server-Park.
Adaption hat ein neues Werkzeug für Entwickler rausgehauen. AutoScientist soll KI-Modelle automatisch auf spezielle Aufgaben trimmen.
Ein neues Paper aus der Forschung zeigt, wie man multimodale Foundation Models schneller und schlanker machen will. Kein Produkt, kein Demo — aber die Idee hat es in sich.
Ein Entwickler hat ein funktionierendes Programm direkt in die Gewichte eines Transformers kompiliert. Kein Fine-Tuning, kein Training — pure Mathematik.
OpenAI hat ein neues Research-Paper veröffentlicht. Kernaussage: Man kann das Verhalten von Sprachmodellen gezielt verbessern — mit einem kleinen, kuratierten Datensatz und ...
Ein neues Paper auf arXiv stellt MP-ISMoE vor — ein System, das Transfer Learning effizienter machen soll. Klingt trocken? Ist es auch. Aber die Idee dahinter ist clever.
Ein neues Paper auf arXiv stellt FuRA vor — eine Fine-Tuning-Methode, die LoRA alt aussehen lassen will. Der Trick: Spektrale Vorkonditionierung statt blinder Gewichts-Updates.
Roboflow hat ein neues Open-Source-Modell auf GitHub gedropt — und die Computer-Vision-Community dreht durch. RF-DETR ist ein Transformer-basierter Objektdetektor, der auf dem ...
Reasoning-Modelle wie o1 oder DeepSeek-R1 denken in Textform. Man kann ihre Gedankenketten lesen, kopieren, nachtrainieren. Aber was passiert, wenn das aufhört?
Ein winziges Gemma-Modell mit nur 2 Milliarden Parametern erkennt Misalignment in fremden KI-Antworten. Es wurde nur auf Code trainiert — und urteilt trotzdem über allgemeine ...
Forscher haben LoRA, die Standard-Methode zum Anpassen großer KI-Modelle, repariert. Das neue BaLoRA bringt Bayessche Statistik ins Spiel – für mehr Genauigkeit und vor allem ...
Anthropic gibt seinen KI-Agenten eine neue Superkraft: Sie sollen nachdenken, während sie schlafen. Das klingt verrückt. Ist es aber nicht.