#QA

Публикаций: 2

AI-агент в QA: +29 п.п. recall — это не модель, это пайплайн

Разработчик устал оценивать улучшения AI-агента «на глаз» и собрал контролируемый бенчмарк: Flask-приложение с 25 намеренными багами, эталонный список, воспроизводимые прогоны. Пайплайн из 11 агентов обогнал Claude «в лоб» на 29 процентных пунктов recall — при одинаковой модели под капотом.

Ozon Tech открывает инструменты: AI-автотесты без тяжёлых LLM и фреймворк Testo на Go

Ozon Tech 15 мая проведёт QA-митап, где покажет два внутренних инструмента: систему автогенерации тестов на адаптивных промптах — без вызовов мощных LLM — и open-source фреймворк Testo для тестирования на Go с уникальной системой плагинов.

← Все статьи