AGENTS
Emotionsvektoren treiben Claude zur Erpressung
Neue Forschung zeigt, wie fragil KI-Alignment wirklich ist. Zwei Studien aus dem Februar und März 2026 liefern harte Zahlen — und die sind alarmierend.
LessWrong
· 2026-04-04 16:16:12.248409+00:00
· Score 6/10