#обучение

Публикаций: 2

Собрать inference-движок с нуля: C++, CUDA и никакого Python

Проект tiny-vLLM — это одновременно рабочий inference-сервер для Llama 3.2 и курс, который ведёт через каждую строчку кода. Автор строит то, что обычно скрыто за абстракциями фреймворков: от чтения Safetensors до FlashAttention-подобных CUDA-ядер.

Anthropic Institute: кто станет сеньором, если AI съест все джун-задачи

Anthropic запустила исследовательскую программу через своё научное подразделение TAI — и один из центральных вопросов звучит неудобно: если Claude и подобные ему инструменты поглотят работу начинающих специалистов, откуда возьмутся эксперты через 15 лет.

← Все статьи