Обновить

Разработка

Сначала показывать
Порог рейтинга
Уровень сложности

Как работает кэширование промптов — PagedAttention и автоматическое кэширование префикса плюс практические советы

Уровень сложностиСредний
Время на прочтение20 мин
Охват и читатели6.6K

Prompt caching часто обсуждают как «бонусную опцию» в API-прайсе: мол, попал в кэш — дешевле и быстрее. В статье разбираем, что за этим стоит на самом деле: почему кэш — это не «память диалога», а переиспользование KV-тензоров на уровне одинаковых префиксов, как из этого вырастает PagedAttention/vLLM с блоками и хэш-цепочками, и какие мелкие, но фатальные детали (динамический системный промпт, недетерминированный JSON, перестановка tool defs) мгновенно превращают кэш в тыкву.

Как это устроено

Юнит-экономика простыми словами — остановитесь посчитать

Уровень сложностиСредний
Время на прочтение3 мин
Охват и читатели6.1K

Парадокс, что 80% руководителей из раза в раз выполняют рутинную работу, но не находят времени, чтобы просто остановиться и подумать:  какой механизм приносит деньги и где этот механизм ломается.

Поэтому - один лист, который можно заполнить за 20–30 минут и сразу увидеть слабое место и реальные перспективы.

Читать далее

Как DuckDB обрабатывает 1 ТБ данных менее чем за 30 секунд

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели10K

Команда Python for Devs подготовила перевод статьи о том, как DuckDB ломает привычные представления о масштабах аналитических данных. Автор на реальных бенчмарках показывает, что 1 ТБ данных можно агрегировать за считанные секунды — без Spark, без распределённых кластеров и без сложной инфраструктуры.

Читать далее

Подходы к state management в React

Уровень сложностиПростой
Время на прочтение12 мин
Охват и читатели6.7K

У React-разработчика две беды:

1. Целевые данные изменились, а ререндера нет.

2. Целевые данные не изменились, а ререндер есть.

Есть много вариантов подружить данные с интерфейсом, в рамках данной статьи я пройдусь по самым популярным из них. Выясним, как они устроены и для чего каждый из них подойдет лучше, обсудим конкретные реализации разных паттернов.

Читать далее

Как банк использовал события компенсации в Camunda

Время на прочтение9 мин
Охват и читатели6.1K

Ограниченные строгими регуляциями и перегруженные высокими объемами транзакций, требующих быстрой обработки, банки должны обеспечивать надежность и безопасность финансовых операций, какие бы проблемы ни возникали на их пути. Хотя в сложных банковских процессах многое может пойти не так, распределенная архитектура систем современных финансовых институтов добавляет сложности в обработку сбоев. Мы собираемся объяснить, как банки могут эффективно автоматизировать откат транзакций через несколько микросервисов и предоставить реальный пример работы компенсационных событий Camunda в банке.

Читать далее

Mock API для QA: Mockoon + ngrok

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели6.4K

Тестировщикам часто приходится работать в условиях, когда бэкенд ещё не готов, API нестабильно или внешние сервисы недоступны. В таких ситуациях тестирование либо откладывается, либо превращается в угадывание «на словах».

В этой статье я показываю, как тестировщик может самостоятельно поднять управляемый mock API без написания серверного кода и сделать его доступным из интернета.

Мы разберём связку Mockoon + ngrok:
— как создавать mock endpoints;
— как эмулировать 200 / 404 / 500 и другие ответы;
— как тестировать фронт и интеграции без реального бэкенда.

Статья ориентирована на QA-инженеров и подойдёт даже тем, кто никогда не писал backend.

Читать далее

Go: сборщик мусора там, где его не ждут

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели9.9K

Когда мы говорим о сборщике мусора, то сразу думаем о куче. Зачем он нужен в стеке? Переменная попала на стек, функция завершила исполнение — стек вжух! — и очистился. 

А что, если я вам скажу, что на стеке Go тоже свой сборщик мусора? Звучит неожиданно? Давайте разберемся по порядку.

Читать далее

Топ-10 инструментов для управления лог-файлами в 2026 году

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели15K

Логи — это летопись жизни любой системы, ведь они фиксируют ключевые события, помогая найти корень проблемы. Но без хороших инструментов для управления журналами работа с ними превращается в хаос. К счастью, для сисадминов уже есть классные решения для сбора, хранения и анализа логов — о некоторых из них мы расскажем под катом. 

Читать далее

Шерлок Холмс и квантовая запутанность: Ролевое моделирование с «неэкспертными» экспертами

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели6.9K

Когда мне нужен оригинальный подход к какой-либо проблеме, я прибегаю к помощи нетиповых экспертов. Точнее, использую нейросети с назначенными ролями. Это довольно распространённая и хорошо работающая техника, не только в ИИ-моделировании, но и в дизайне мышления в целом. Но есть один нюанс. Когда мы говорим нейросети «Как бы это сделал Илон Маск или Стив Джобс?», мы подталкиваем ее к использованию клише. Нейросеть слишком хорошо знает эти персонажи и выдает ожидаемую банальность. А нам нужны неожиданные перспективы.

Читать далее

Практика по исправлению рекурсивных импортов во фронтенд приложении

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели8.2K

Ранее публиковал теоретическую часть по рекурсивным импортам, желательно ознакомиться перед тем как продолжить, чтобы было общее преставление.

Рекурсивные импорты рассмотрим на примере React/Redux приложении.

Исходный код приложения опубликован тут, можете склонировать и попробовать самостоятельно исправить ошибки. Так сказать закрепить теорию на практике.

Читать далее

Будущее дронов: встроенный ИИ

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели15K

Всё больше БПЛА используют машинное зрение для навигации и распознавания объектов. Обычно предполагается, что это система с ограниченными вычислительными возможностями, которой управляет оператор удалённо, а движок ИИ работает из облачного сервиса с подключением через интернет.

Но что, если на БПЛА поставить локальную модель и мощный GPU-ускоритель, чтобы ИИ работал локально и самостоятельно принимал решения? Несколько лет назад такое казалось фантастикой. Но сейчас прогресс в области БПЛА настолько бурный, что ситуация меняется каждые несколько месяцев.

Посмотрим, какие ИИ-ускорители устанавливают в современные дроны.

Читать далее

О совершенной реализации

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели5.4K

Борис Цирлин

Речь идет об одном методе реализации полумодулярных схем, описанном еще в монографии "Автоматное управление асинхронными процессами в ЭВМ и дискретных системах" под редакцией В. И. Варшавского.

Проблема реализации заключается в том, что логические функции системы уравнений задающей такие схемы могут быть и немонотонными, т. е. содержать некоторый переменные zi как в прямом, так и в инверсном виде. Между тем собственные функции элементов, из которых строится схема, как это известно схемотехникам, обычно антитонные, например И-ИЛИ-НЕ. В силу этого на одном элементе не может быть реализована ни изотонная, ни немонотонная функция описывающая элемент в исходной схеме, т. е. в реализации должны быть элементы с выходами и zi (прямым), и ~zi (инверсным).

Рассматривается совершенная реализация (далее СР) - метод, который не смотря на амбициозное название, достаточно прост и заключается в том, что для получения прямого zi и инверсного ~zi значений используются RS-триггеры. Показываются ограничения универсальности этого метода и предлагается способ преодоления этих ограничений.

Читать далее

Как я победил «дрейф контрактов» между бэкендом и тремя клиентами: OpenAPI → SDK → Zod

Время на прочтение9 мин
Охват и читатели6.5K

Когда у тебя несколько клиентов (web + расширение + десктоп), API быстро развивается, а данных много и они сложные — «контракт» между бэком и фронтом начинает дрейфовать.
Я решил это так:

Читать далее

Ближайшие события

Как фракталы преобразили подходы в математике и других науках

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели12K

Термин «фрактал» появился в 1975 году. Его ввёл математик Бенуа Мандельброт, работавший в IBM и преподававший в Йельском университете. Фракталы — это математические объекты или природные формы, обладающие свойством самоподобия: их части повторяют общую структуру при любом масштабе. Мандельброт предложил формальный язык для описания таких форм — фрактальную геометрию. Она позволила анализировать изломанные линии, ветвящиеся структуры и объекты с дробной размерностью, которые не укладывались в рамки классической геометрии. Вместо того чтобы считать их исключением, он показал, что у этих форм есть строгие закономерности и способы измерения.

В этом материале поговорим о том, какие именно подходы изменили фракталы.

Читать далее

Перестань вайбкодить: почему «разработка на расслабоне» убьет твою карьеру

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели38K

Ты пишешь код быстрее, чем когда-либо. IDE угадывает твои мысли, тикеты закрываются. Кажется, что ты хакнул систему и поймал тот самый «вайб». Но есть нюанс: если завтра отключат интернет и помощников, сможешь ли ты написать сложную логику с чистого листа?

Читать далее

Как протестировать собственный контроллер памяти SDRAM на FPGA

Уровень сложностиСредний
Время на прочтение13 мин
Охват и читатели9.4K

В этой статье я хотел поделиться опытом тестирования своего контроллера динамической памяти на ПЛИС.

В первой части я рассказываю про отладочную плату, которую использовал, и с какими ограничениями при этом столкнулся. Показываю подход к построению схемы тестирования и принципы контроля и обнаружения ошибок. Привожу интересные на мой взгляд фрагменты кода на VHDL с пояснениями к ним. Вторую часть статьи я посвятил оценке реальной производительности контроллера при работе с памятью. В ней я привел результаты измерений быстродействия для потоковой записи и чтения при различных настройках и режимах работы контроллера.

И в самом конце – примеры взаимодействия контроллера с памятью, снятые в отладчике во время работы. А также описание механизма адресации памяти.

Читать далее

Как запустить 4 независимые нейросети на одном GPU (16 ГБ) под FastAPI

Время на прочтение34 мин
Охват и читатели12K

Как поднять мультимодальный AI-сервис (OCR, ASR, LLM, TTS) на одной GPU 16GB без облачных API?

Разбираем пошагово:

Подготовка VPS (Ubuntu + CUDA + драйверы)

FastAPI-архитектура с PyTorch/Transformers

Управление памятью (без OOM-ошибок)

Продакшен: systemd + Nginx + HTTPS + домен

Тестирование в Swagger

Итог: локальный сервис "под ключ" с предсказуемыми расходами, полной приватностью данных и возможностью масштабирования.

Для кого: DevOps, Python-разработчики, AI-интеграторы, стартапы.

Исходники в репозитории, демо-видео, лайфхаки по разработке прямо на сервере!

Читать далее

Основы производственной этики для IT-специалистов

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели8.6K

Привет Хабр!

В очередной раз, столкнувшись со "странностями" в поведении коллег, я решил написать этот краткий, но, по всей видимости, необходимый гайд. Когда мы рассуждаем о важности развития софт-скиллов, мы, чаще всего, говорим как о чем-то совершенно абстрактном, чему трудно придать форму простого алгоритма. На собеседованиях мы очень субъективно оцениваем умение кандидатов общаться.

Однако, вполне возможно выделить набор простых (и даже примитивных) правил, следование которым, существенно повысит твой софт-скиловый грейд, даже если ты воробушек-социофобушек (как я сам).

Читать далее

Недельный геймдев: #260 — 11 января, 2026

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели6.6K

Из новостей: Акира Ямаока написал трек для Pathologic 3, Larian (почти) отказались от gen-AI, Steam даст возможность моддерам пилить моды под разные версии игры, Hooded Horse не берут в издательство игры с gen-AI.

Из интересностей: разрушаемость в Unity, парадигмы Кранка, 15 лет инди-разработки в 4 советах, разработка движка на базе SDF.

Читать далее

Как создавать AI-агентов на практике: полное руководство по Claude Agent SDK

Уровень сложностиПростой
Время на прочтение12 мин
Охват и читатели12K

Команда AI for Devs подготовила перевод подробного практического гайда по Claude Agent SDK. В статье разбирается, как устроены современные AI-агенты на практике: управление контекстом, инструменты, сабагенты, разрешения, структурированный вывод и продакшен-паттерны.

Читать далее