Статьи / Профиль xonika9 / Хабр

Все потоки

Алексей@xonika9

Инди-хакер

15,1

Рейтинг

94

Подписчики

ПрофильСтатьи19ПостыНовости20Комментарии50

xonika9 4 июл в 07:00

AI Engineer World's Fair 2026: разбор докладов и куда движется AI-инженерия

Простой

8 мин

7.9K

Искусственный интеллектМашинное обучение * Программирование * Open source * Управление разработкой *

Обзор

AI Engineer World's Fair 2026 уже прошла, а по-русски её так никто и не разобрал. В официальном расписании 560 сессий: воркшопы, кейноуты, доклады. Глазами это не осилить.

Я собрал агентный пайплайн, прогнал через него доступные записи и сел читать конференцию про агентов с помощью агента. Рассказываю, что в записях повторялось из доклада в доклад, куда сходится AI-инженерия и что посмотреть, если время есть только на пять роликов.

Все доступные доклады с русскими саммари, таймкодами и тематическим навигатором я собрал в отдельном SPA.

Читать далее

+6

xonika9 2 июл в 07:00

Полез в исходники vLLM, чтобы понять, почему один символ убивает prompt caching

Средний

11 мин

6.3K

Высоконагруженные системы * Программирование * Open source * Машинное обучение * Искусственный интеллект

Обзор

В первой части я вывел одно правило и предложил жить по нему: стабильное в начало, изменчивое в хвост, один символ в системном промпте обнуляет весь кэш. Правило рабочее, я сам собираю агента вокруг него. Но жить по закону, которого не понимаешь, неуютно.

vLLM и paged attention я руками не писал, зато исходники открыты, и я полез в них за байтовой причиной. Что физически лежит на GPU в момент попадания в кэш, как движок управляет этой памятью и почему хватает одного символа, чтобы всё посыпалось.

Читать далее

+5

xonika9 18 июн в 07:00

Prompt caching: оптимизация, которая наказывает молчанием

Простой

12 мин

4.9K

Искусственный интеллектМашинное обучение * Программирование * Natural Language Processing * Open source *

Обзор

Из всех способов сэкономить на работе с LLM prompt caching самый коварный. Сложным его не назовёшь, дело в другом: он тихий. Почти любая оптимизация, если ты её сломал, даёт о себе знать: падает тест, краснеет лог, валится метрика. Кэш так не делает. Он не падает с ошибкой, он просто молча перестаёт срабатывать. И единственное, что меняется, это счёт в конце месяца и пара лишних секунд на каждый ответ.

Я долго про кэш не вспоминал: у OpenAI он включается сам, без флагов, и за запись денег не берёт. Ловушка ровно в этом удобстве. Разбираю, что на самом деле кэшируется (не текст и не ответ модели), почему хватает одного символа в начале промпта, чтобы всё обнулить, чем отличается подход OpenAI, Anthropic и Gemini и как убедиться, что кэш реально работает.

Читать далее

+3

xonika9 30 янв в 07:00

Clawdbot → Moltbot → OpenClaw ≠ магия: честный гайд по приручению AI-ассистента

Простой

31 мин

224K

Искусственный интеллектМашинное обучение * Open source * Программирование * Natural Language Processing *

Обзор

Подробный разбор OpenClaw (бывший Clawdbot). Рассказываю, почему для личного Джарвиса не нужен Mac Mini, как развернуть систему на VPS за $5 и к каким техническим нюансам стоит подготовиться

Читать далее

+72

xonika9 24 дек 2025 в 07:00

Итоги 2025 в AI: прорывы, которые сдвинули индустрию, и ставки на 2026

Простой

17 мин

7K

Искусственный интеллектМашинное обучение * Open source * Программирование * Natural Language Processing *

Обзор

2025-й стал годом перехода от эффектных демо к суровой инженерной рутине. В этой статье я подвожу личные итоги года, анализируя работу с GPT-5.1, Claude 4.5 и локальными моделями, а также разбираю, как изменились наши требования к кодингу, видеогенерации и научным исследованиям. В финале — прагматичный прогноз на 2026 год.

Читать далее

+3

xonika9 2 дек 2025 в 07:00

LatentMAS: Секрет AI-агентов, которые думают без слов, работают точнее и экономят до 80% токенов

Простой

18 мин

4.8K

Машинное обучение * Искусственный интеллектNatural Language Processing * Программирование * Open source *

Обзор

Классические AI-агенты общаются текстом — это дорого и медленно. LatentMAS раскрывает секрет "безмолвного" общения: агенты обмениваются "мыслями" напрямую через общую латентную память (KV-кэш). Разбираемся, как эта архитектура позволяет добиться двузначного прироста точности и радикально сократить расходы на токены.

Читать далее

+3

xonika9 18 ноя 2025 в 07:00

Мультимодальный AI в 2025: как GPT‑5.1, Gemini, Claude и Grok научились понимать текст, изображения и видео одновременно

Простой

25 мин

5.5K

Искусственный интеллектМашинное обучение * Программирование * Natural Language Processing * Open source *

Обзор

В 2020 году AI был архипелагом изолированных моделей. К 2025-му всё изменилось. Эта статья — глубокое погружение в единую парадигму Next Token Prediction, которая позволила GPT-5.1, Gemini, Claude и Grok научиться понимать текст, изображения и видео одновременно. Разбираем, как это работает, и на что способны флагманские модели сегодня.

Читать далее

+4

xonika9 7 окт 2025 в 07:01

Сначала был кремний: Почему архитектура чипов, а не код, определяет будущее AI

Простой

13 мин

5.6K

Машинное обучение * Искусственный интеллектOpen source * Программирование * Natural Language Processing *

Обзор

Мы, разработчики, верим, что наш код — движущая сила AI. Но что, если все наши решения предопределены архитектурой чипов? Эта статья — погружение в «кремниевую геологию»: от монополии NVIDIA и CUDA до восстания альтернатив вроде Groq и Cerebras, кастомных чипов Google и Apple и геополитической войны, которая меняет правила игры для каждого из нас.

Читать далее

+7

xonika9 24 сен 2025 в 07:00

Два пути из Тирании Квадрата: Сравнительный разбор MoE и SSM как наследников Трансформера

Простой

12 мин

5.3K

Искусственный интеллектМашинное обучение * Natural Language Processing * Программирование * Open source *

Обзор

Архитектура Трансформеров уперлась в стену квадратичной сложности O(n²), или «Тиранию Квадрата». В статье мы разбираем два пути решения этой проблемы: Mixture-of-Experts (MoE), масштабирующий знания, и State Space Models (SSM), масштабирующий контекст. Это сравнительный анализ архитектур, которые определяют будущее AI.

Читать далее

+6

xonika9 9 сен 2025 в 07:00

Локальный AI: Прагматичное руководство по запуску LLM на своем железе

Простой

18 мин

104K

Искусственный интеллектМашинное обучение * Программирование * Open source * Natural Language Processing *

Обзор

Устали от счетов за API и переживаете за конфиденциальность данных? Пришло время построить свою «AI-кухню» и вернуть контроль. Этот гайд — ваш пошаговый план: от выбора идеальной видеокарты до запуска первой модели через Ollama или LM Studio. Превратите свой ПК в суверенный AI-воркстейшн.

Читать далее

+23

xonika9 27 авг 2025 в 09:30

Экономика результатов: Настоящая революция AI-агентов, которую все упускают

Простой

12 мин

14K

Управление разработкой * Управление проектами * Управление продуктом * Бизнес-модели * Искусственный интеллект

Обзор

За хайпом вокруг AI‑агентов скрывается фундаментальный сдвиг — переход от «экономики инструментов» к «экономике результатов». Эта статья представляет фреймворк «Трех горизонтов» для оценки бизнес‑амбиций и помогает технологическим лидерам сделать стратегический выбор: стать «Мастером», оптимизирующим процессы, или «Архитектором», строящим новые бизнес‑модели.

Читать далее

0

xonika9 20 авг 2025 в 07:00

AI-ученые уже здесь: Большой тур по LLM, которые меняют фундаментальную науку

Простой

17 мин

8.6K

Будущее здесьИскусственный интеллектМашинное обучение * Биотехнологии

Обзор

Искусственный интеллект превращается из инструмента в полноценного партнера ученого. В этом большом обзоре мы рассмотрим, как LLM вроде AlphaFold 3, TxGemma и ChemLLM совершают революцию в биологии, медицине, химии и материаловедении, переходя от анализа данных к проектированию будущего.

Читать далее

+2

xonika9 12 авг 2025 в 07:00

Новые правила игры: что GPT-5, Genie 3 и Qwen-Image говорят о будущем AI

Простой

7 мин

12K

Искусственный интеллектМашинное обучение * Open source * Natural Language Processing * Программирование *

Обзор

В начале августа 2025 года OpenAI, Google DeepMind и Alibaba представили релизы, которые меняют правила игры. Мы анализируем долгожданный GPT-5 и open-source модели от OpenAI, прорыв Google в симуляции миров с Genie 3 и элегантное решение Alibaba проблемы с текстом на изображениях с помощью Qwen-Image. Это разбор не только технологий, но и ключевых трендов, определяющих будущее AI.

Читать далее

+4

xonika9 6 авг 2025 в 07:01

Анатомия памяти LLM: Почему будущее не за промптами, а за Инженерией Контекста

Простой

15 мин

22K

Искусственный интеллектМашинное обучение * Natural Language Processing * Программирование * Open source *

Обзор

Мой счет за Google API взлетел до €51 из-за контекста LLM. Эта статья раскрывает, почему "память" моделей так дорога, как работает механизм Внимания, и предлагает 5 хаков для управления контекстом. Узнайте, почему будущее за Инженерией Контекста, а не за промптами.

Читать далее

+19

xonika9 29 июл 2025 в 07:00

Путешествие одного промпта: Что на самом деле происходит под капотом у LLM?

Простой

15 мин

13K

Искусственный интеллектМашинное обучение * Open source * Natural Language Processing * Программирование *

Обзор

✏️ Технотекст 8

Загадка работы LLM: что происходит, когда вы нажимаете Enter? Разбираем пошагово путь вашего промпта от токенизации до генерации ответа. Узнайте, как устроены большие языковые модели, как ими управлять и какие мифы они развеивают.

Читать далее

+31

xonika9 22 июл 2025 в 07:00

Умный поиск по заметкам: как оживить «второй мозг» с помощью RAG

Средний

16 мин

12K

Искусственный интеллектМашинное обучение * Open source * Программирование * Natural Language Processing *

Кейс

Ваша база знаний превратилась в кладбище идей? Я построил RAG-систему, чтобы мой "второй мозг" ожил и стал собеседником. Узнайте, как перейти от хаотичного поиска к осмысленному диалогу с вашими заметками и получить измеримую выгоду для бизнеса.

Читать далее

0

xonika9 1 июл 2025 в 07:20

MiniMax-M1: Разбираем архитектуру, ломающую законы масштабирования (и наш VRAM)

Средний

9 мин

4K

Машинное обучение * Искусственный интеллектПрограммирование * Natural Language Processing * Open source *

Обзор

В мире LLM доминирует квадратичная сложность, ограничивающая контекст. Но MiniMax-M1 бросает вызов: миллион токенов, низкие затраты. Разбираем гибридную архитектуру с Lightning Attention, новый алгоритм CISPO и инженерные прорывы, делающие эту модель уникальной.

Читать далее

+5

xonika9 24 июн 2025 в 07:01

Иллюзия мышления: Почему «думающие» модели на самом деле не думают (и что об этом говорит новое исследование Apple)

Средний

9 мин

9.8K

Искусственный интеллектМашинное обучение * Natural Language Processing * Программирование * Open source *

Аналитика

Новое исследование Apple шокирует: «рассуждающие» нейросети лишь имитируют мышление, проваливаясь на сложных задачах. Но Anthropic в ответ заявляет, что проблема не в ИИ, а в некорректных тестах. Разбираемся в главном споре о возможностях современных языковых моделей.

Читать далее

+14

xonika9 18 июн 2025 в 08:15

Стеклянный фасад Apple: почему новый дизайн iOS 26 и macOS — красивая ошибка

Простой

4 мин

15K

ДизайнИнтерфейсы * Веб-дизайн *

Аналитика

Из песочницы

Apple на WWDC 2025 представила радикальный редизайн Liquid Glass. Разбираемся, почему эта красивая концепция может стать провалом с точки зрения юзабилити и доступности, анализируем реакцию сообщества и вспоминаем, почему мы уже видели нечто подобное (и это плохо кончилось).

Читать далее

+5