2026-05-08 10:45:24
Anthropic випустила автоенкодери природної мови, щоб розшифровувати міркування моделей ШІ, і відкрила код з можливістю використання
Нещодавно Anthropic випустила Natural Language Autoencoders (NLA) — інструмент, який перетворює внутрішні активації моделі на текст, зрозумілий людині, причому код і ваги моделі відкрито на GitHub. На відміну від наявних інструментів, таких як Sparse Autoencoders, які виводять малозрозумілі ознаки, NLA безпосередньо генерує