#голосовой ИИ

Публикаций: 3

Голосовая модель слушает нон-стоп и решает за 0,4 секунды — говорить или молчать

Open-source модель Audio Interaction перекраивает логику голосового ИИ: вместо ожидания паузы она непрерывно слушает поток и каждые 400 миллисекунд принимает решение — пора ответить или нет. Код, веса и инструкции уже на GitHub под Apache 2.0.

OmniVoice Studio: локальная замена ElevenLabs с 646 языками

Появился бесплатный open-source десктоп, который делает всё то, за что ElevenLabs берёт до $330 в месяц — клонирование голоса, дубляж видео, диктовка, диаризация — и всё это без интернета и без API-ключей.

Thinking Machines Lab выпускает ИИ, который говорит и слушает одновременно

Стартап Миры Мурати анонсировал полнодуплексную голосовую модель TML-Interaction-Small с задержкой отклика 0,40 секунды — примерно как у живого собеседника. Это принципиально иная архитектура диалога: ИИ не ждёт, пока вы закончите говорить.

← Все статьи