#QA — ArdDev Blog

2026-05-18 00:02 · 🌐 СНГ (tech/AI)

AI-агент в QA: +29 п.п. recall — это не модель, это пайплайн

Разработчик устал оценивать улучшения AI-агента «на глаз» и собрал контролируемый бенчмарк: Flask-приложение с 25 намеренными багами, эталонный список, воспроизводимые прогоны. Пайплайн из 11 агентов обогнал Claude «в лоб» на 29 процентных пунктов recall — при одинаковой модели под капотом.

2026-05-08 22:01 · 🌐 СНГ (tech/AI)

Ozon Tech открывает инструменты: AI-автотесты без тяжёлых LLM и фреймворк Testo на Go

Ozon Tech 15 мая проведёт QA-митап, где покажет два внутренних инструмента: систему автогенерации тестов на адаптивных промптах — без вызовов мощных LLM — и open-source фреймворк Testo для тестирования на Go с уникальной системой плагинов.