#reinforcement learning

Публикаций: 4

Transformer обучили на мини-задаче — он сам взял промышленный масштаб

Transformer-модель, обученная на производственных расписаниях размером до 10×10, без дополнительного обучения решает задачи 100×100 с отклонением 12–15% от теоретического минимума. Это не идеально — но это работает без переобучения при смене масштаба.

Рич Саттон: почему ИИ начнёт открывать, а не только запоминать

Один из отцов reinforcement learning Рич Саттон рассуждает о природе творчества и открытий в ИИ. Главный вопрос, который он задаёт уже много лет: способна ли машина по-настоящему порождать новое знание — или только компрессирует уже существующее?

Лауреат премии Тьюринга: генеративный AI не способен заниматься наукой

Ричард Саттон, один из отцов современного reinforcement learning и лауреат премии Тьюринга, сформулировал системный изъян генеративного AI: без встроенной петли самооценки настоящая научная работа невозможна. Это не просто академическая ремарка — это диагноз всей индустрии, которая последние три года строила будущее на трансформерах.

Симулятор гонок ИИ-дронов на Rust: Elodin открыл код

Elodin Systems выпустила open-source симуляционный стенд для участников AI Grand Prix — соревнования по автономным полётам дронов. Стенд работает поверх реального Betaflight и требует минимум 1000 сенсорных сэмплов в секунду — иначе real-time не получится.

← Все статьи