#reasoning

Публикаций: 9

2026-07-15 22:04 · 🤖 AI World

Bonsai 27B: мощный reasoning-LLM, который помещается в iPhone

PrismML сжала 27-миллиардную reasoning-модель до менее 4 ГБ — она запускается прямо на iPhone без облака. Apple, по имеющимся данным, уже тестирует технологию сжатия.

2026-07-11 10:03 · 🤖 AI World

GPT-5.6 Sol Ultra предъявил доказательство 50-летней задачи графовой теории

OpenAI опубликовала PDF с доказательством гипотезы о двойном покрытии циклами, составленным GPT-5.6 Sol Ultra. Задача открыта с 1979 года — если математическое сообщество подтвердит результат, это первая фундаментальная теорема комбинаторики, доказанная языковой моделью.

2026-07-11 00:03 · 🤖 AI World

GPT-5.6 Sol: пять уровней мышления и когда включать каждый

GPT-5.6 Sol вышел с пятью уровнями «глубины рассуждений» — от лёгкого Light до тяжёлого xhigh — плюс режимы Max и Ultra с параллельными суб-агентами. Сотрудник OpenAI Вайбхав Сриваставе дал простое правило: стартуй снизу и повышай уровень только по необходимости.

2026-06-28 14:06 · 🤖 AI World

Reasoning сжимается хорошо — факты нет: что доказал VibeThinker-3B

Модель с 3 миллиардами параметров наравне бьётся с DeepSeek V3.2 и Kimi K2.5 на математике и коде — хотя те в 333 раза больше. Секрет не в размере, а в том, что именно вообще поддаётся сжатию.

2026-06-20 12:02 · 🤖 AI World

10% токенов дают +14,9% к reasoning: ICT против энтропийного коллапса

Девять исследователей опубликовали на arXiv метод ICT, который при RLVR-обучении LLM обновляет только 10% «особых» токенов вместо всех подряд. На моделях Qwen2.5 это дало средний прирост pass@4 на 4,58% и до 14,9% максимум — без роста размера модели.

2026-06-05 14:02 · 🤖 AI World

Как сделать GRPO-обучение эффективнее: replay-буфер даёт +4 pp

Группа корейских исследователей опубликовала метод, который решает давнюю проблему GRPO: каждый роллаут тратится на один градиентный шаг и выбрасывается. Новый буфер переиспользует данные умно — и на math-бенчмарках это даёт до +4.35 процентных пунктов.

2026-06-03 06:02 · 🤖 AI World

Microsoft запустил MAI-модели: 35B против Sonnet 4.6

Microsoft анонсировал две собственные LLM: MAI-Thinking-1 на 35B параметров, претендующую обойти Claude Sonnet 4.6, и компактную MAI-Code-1-Flash на 5B, уже встроенную в GitHub Copilot. Оба — на «коммерчески лицензированных данных» без дистилляции из сторонних моделей.

2026-05-30 22:01 · 🤖 AI World

Терренс Тао: ИИ впервые сделает математику командным спортом

Один из лучших математиков мира утверждает: ИИ способен сломать главное ограничение математики — необходимость одному человеку удерживать всю цепочку доказательства в голове. Впереди — «промышленная математика» с командами и разделением труда.

2026-05-22 00:02 · 🤖 AI World

OpenAI опровергла гипотезу Эрдёша 1946 года — математики разбирают доказательство

Reasoning-модель OpenAI опровергла гипотезу Пола Эрдёша о геометрии единичных расстояний, открытую с 1946 года. Лауреат Медали Филдса Тим Гауэрс назвал результат «вехой в математике ИИ» и предупредил: людям скоро станет очень трудно конкурировать с ИИ в математике.

← Все статьи