#голосовые агенты

Публикаций: 6

2026-07-23 16:06 · 🤖 AI World

Open ASR 2026: монополия Whisper кончилась — кто теперь лучший

Рынок открытых моделей распознавания речи перестал быть однородным: в середине 2026 года сразу четыре конкурента Whisper разделяет меньше одного процентного пункта WER. Что это меняет для команд, которые выбирают ASR для продукта, автоматизации или голосового агента.

2026-07-14 02:21 · 🤖 AI World

Говорящая рыба с ИИ: Strands Agents и Amazon Nova Sonic в железе

Разработчик взял пластиковую рыбу Big Mouth Billy Bass и за один уикенд сделал из неё голосового ИИ-ассистента — с двигающейся головой, открывающимся ртом и виляющим хвостом. Внутри: Raspberry Pi 5, Strands Agents BidiAgent и Amazon Nova 2 Sonic на Bedrock.

2026-06-04 22:01 · 🤖 AI World

NVIDIA выпустила один ASR-движок на 40 языков — и его можно дообучить

NVIDIA открыла веса Nemotron 3.5 ASR — потоковой модели распознавания речи на 600M параметров, которая покрывает 40 языков одним чекпоинтом и добавляет пунктуацию прямо на выходе. Модель можно дообучить под любой язык, акцент или домен — включая русский и языки СНГ.

2026-05-12 20:02 · 🌐 СНГ (tech/AI)

#голосовые агенты

Open ASR 2026: монополия Whisper кончилась — кто теперь лучший

Говорящая рыба с ИИ: Strands Agents и Amazon Nova Sonic в железе

NVIDIA выпустила один ASR-движок на 40 языков — и его можно дообучить

Thinking Machines Lab выпускает ИИ, который говорит и слушает одновременно

Архитектура сначала: как финтех строит голосовых агентов без иллюзий

Grok умеет говорить: xAI обогнала GPT и Gemini по голосу вдвое