#SWE-Explore

Публикаций: 1

AI-агенты находят файл — но промахиваются мимо нужных строк

Новый бенчмарк SWE-Explore разделил задачу кодового агента на два этапа — поиск нужного места и его исправление. Результат: с файлами агенты справляются, а вот конкретные строки внутри — стабильно теряют.

← Все статьи