2026-06-13 10:01 · 🤖 AI World
OpenAI выпустила GPT-Realtime-2 — первую голосовую модель с reasoning-уровнем GPT-5, доступную через WebRTC API. Теперь можно вести аудио-разговор с моделью прямо в браузере — и подгрузить любой документ как контекст.
2026-06-10 00:01 · 🤖 AI World
Google выпустила Gemini 3.5 Live Translate — аудиомодель, которая переводит речь непрерывно, не дожидаясь конца фразы. В Google Meet поддержка языков выросла с 5 до 70+.
2026-04-24 16:02 · 🌐 СНГ (tech/AI)
xAI открыла API-доступ к grok-voice-think-fast-1.0 — голосовой модели с полноценным дуплексным режимом. На бенчмарке τ-Voice Bench она набрала 67,3% против 35,3% у GPT-realtime-1.5 и 43,8% у Gemini — разрыв почти двукратный.