Die größte Preprint-Plattform der Welt zieht den Stecker. ArXiv hat genug von Forschern, die ChatGPT-Müll als Wissenschaft verkaufen.
Ein neues GitHub-Projekt verspricht den Forscher-Traum: Du tippst eine Idee in den Chat, AutoResearchClaw spuckt ein fertiges arXiv-Paper aus. Klingt wie Magie, ist aber Open ...
Ein neues arXiv-Paper schickt Large Language Models in die Neural Architecture Search. Die Idee: Statt Menschen lassen wir die KI selbst bessere KI-Modelle entwerfen.
Ein neues arXiv-Paper packt ein altes Problem an: KI-Modelle, die beim Lernen alles wieder verlernen. Die Lösung heißt "Adaptive Weight Decay" — also gezieltes Vergessen.
Ein neues Paper auf arXiv schlägt ein Framework vor, das die Länge von KI-Antworten auf Token-Ebene vorhersagt. Klingt nerdig — könnte aber Inferenz-Kosten massiv drücken.
Ein neues Paper auf arXiv will Neural Networks beim Training live überwachen — bevor sie kollabieren. Das Werkzeug heißt Collapse Index. Klingt nach Sci-Fi, ist aber Mathematik.
Ein neues Paper aus dem Arxiv will LLM-Halluzinationen nicht wegtrainieren — sondern wegfiltern. Der Ansatz: Wenn das Modell sich unsicher ist, soll es einfach die Klappe halten.
Ein neues arXiv-Paper knöpft sich ein nerviges Problem vor: Sprachmodelle wirken oft selbstbewusst — auch wenn sie Mist labern.
Ein neues Paper auf arXiv will die größte Schwäche von RAG-Systemen knacken: dummes Chunking. Statt Dokumente stur in gleich große Häppchen zu zerschneiden, soll der User-Query ...
Neues Paper auf arXiv prügelt auf eine beliebte Methode ein. CenterLoss kollabiert Features — und macht KI-Modelle blind für unbekannte Inputs.
Sprachmodelle sollen jetzt Forschungsideen bewerten — bevor auch nur ein einziges Experiment läuft. Ein neues arXiv-Paper testet, ob LMs den Erfolg von KI-Forschung vorhersagen ...
Ein neues arXiv-Paper drückt die Cramér-Distanz in den Soft-Actor-Critic-Algorithmus. Das Ergebnis heißt C-DSAC und ist reine Mathe-Spielerei für RL-Nerds.
Ein neues Paper auf arXiv präsentiert "LKV" — eine Methode, die den größten Engpass langer Kontexte angeht: den KV-Cache.
Ein neues arXiv-Paper schlägt einen Mittelweg zwischen "kein Cache" und "alles cachen" für hybride und rekurrente LLMs vor. Klingt nerdig — ist es auch.
Ein neues Paper auf arXiv stellt einen Lernansatz vor, bei dem ein KI-Modell nacheinander von verschiedenen Lehrer-Modellen lernt — ohne deren Trainingsdaten zu kennen.
Ein neues Paper auf arXiv stellt MP-ISMoE vor — ein System, das Transfer Learning effizienter machen soll. Klingt trocken? Ist es auch. Aber die Idee dahinter ist clever.
Ein neues Paper auf arXiv schlägt einen Optimizer vor, der seine eigenen Hyperparameter regelt. Der Name: MetaAdamW.
Ein neues arXiv-Paper will Maschinen beibringen, ihr eigenes Lernverhalten umzuschalten. Ohne externen Trigger. Nur durch interne Dynamik.
Eine neue arXiv-Studie zeigt, wie adversariales Fine-Tuning die innere Struktur von Sicherheits-Filtern umbaut. Kein neues Modell, kein neues Tool — sondern ein Blick unter die ...
Ein neues arXiv-Paper packt ein altes Problem an: Physics-Informed Neural Networks müssen für jede Aufgabe neu trainiert werden. Die Autoren wollen das mit Compositional ...