2026-06-11 17:02 · 🤖 AI World
Пять исследователей доказали теорему невозможности для одной из ключевых задач AI-безопасности: никакой метод обучения, основанный только на поведении агента, не может гарантировать его честность — даже если обратная связь во время обучения была идеальной. Результат опубликован на arXiv 10 июня 2026 года.
2026-06-08 14:01 · 🤖 AI World
Когда open-weight модель дообучают под задачу, она теряет защиту от вредоносных запросов — даже если обучающие данные были безвредными. Исследователи предложили SafeGene: адаптер безопасности, который не нужно пересоздавать каждый раз.
2026-04-22 00:02 · 🌐 СНГ (tech/AI)
Пока корпорации тратят миллиарды на «безопасный ИИ», писатели-фантасты с 1909 года описывают финал этой истории. Семь книг — от Форстера до Саберхагена — точнее любого аналитического отчёта объясняют, чего именно стоит бояться.