Forscher zeigen: Wenn KI-Modelle während der Nutzung weiterlernen, lassen sich ihre Sicherheitsfilter knacken. Eine neue arXiv-Studie nennt drei konkrete Angriffsmethoden.
Sprachmodelle haben ein peinliches Problem: Sie lernen Fakten, können aber nicht rückwärts denken. Ein neues Paper zeigt, wie man das mit Rechenzeit zur Inferenz flicken kann.
Forscher wollen Sprachmodellen beibringen, sich an frühere Denkwege zu erinnern. Klingt simpel. Ist es aber nicht.
OpenAI hat bei sogenannten Energy-Based Models (EBMs) einen Fortschritt erzielt. Die Modelle liefern bessere Samples und generalisieren stärker als bisherige Ansätze.