2026-06-04 22:01 · 🤖 AI World
NVIDIA открыла веса Nemotron 3.5 ASR — потоковой модели распознавания речи на 600M параметров, которая покрывает 40 языков одним чекпоинтом и добавляет пунктуацию прямо на выходе. Модель можно дообучить под любой язык, акцент или домен — включая русский и языки СНГ.
2026-05-12 20:02 · 🌐 СНГ (tech/AI)
Стартап Миры Мурати анонсировал полнодуплексную голосовую модель TML-Interaction-Small с задержкой отклика 0,40 секунды — примерно как у живого собеседника. Это принципиально иная архитектура диалога: ИИ не ждёт, пока вы закончите говорить.
2026-05-05 18:01 · 🌐 СНГ (tech/AI)
Команда СВОЙ Тех разобрала реальный путь от сценарных ботов к LLM-ассистентам — и он не похож на красивые слайды. Сначала скучная архитектура, потом осторожно модели.
2026-04-24 16:02 · 🌐 СНГ (tech/AI)
xAI открыла API-доступ к grok-voice-think-fast-1.0 — голосовой модели с полноценным дуплексным режимом. На бенчмарке τ-Voice Bench она набрала 67,3% против 35,3% у GPT-realtime-1.5 и 43,8% у Gemini — разрыв почти двукратный.