Python *

Высокоуровневый язык программирования

443,89

Рейтинг

СтатьиПостыНовостиАвторыКомпании

opium 5 июн в 10:12

MCP-серверы для Claude Code: как подключить Telegram, базы данных и всё что угодно

Средний

4 мин

15K

DevOps * Python * Искусственный интеллект

Туториал

Когда я начал пользоваться Claude Code, у меня было ощущение, что я дал умному человеку доступ только к одной папке на компьютере. Он видит код, помогает с задачами — но не знает, что происходит снаружи. Нет доступа к чатам, к базе данных, к GitHub issues. Всё это приходилось копировать руками и вставлять в контекст.

Потом я узнал про MCP.

AfrosRajabov 5 июн в 10:11

nORM — ORM, но есть одно «no»

Средний

3 мин

Python * SQL * SQLite * PostgreSQL * MySQL *

Обзор

Из песочницы

Если вы работаете с базами данных и используете ORM, вы, вероятно, сталкивались с той же проблемой, что и я. ORM отлично подходят для отображения таблиц на объекты. Но они начинают мешать, когда запрос становится сложным: агрегации, тщательно продуманные JOIN’ы, формы отчетов, которые не соответствуют одной модели на таблицу. Вы боретесь с ORM, переходите на сырой SQL, а затем вручную пишете связующий код (маппинг).

Не каждый SELECT возвращает то, что подходит под одну ORM-модель. SQL - это лучший язык для доступа к данным. Лучшие ORM, которые я использовал, такие как Drizzle, побеждают, потому что они остаются близки к SQL. Я хотел пойти дальше: хранить SQL в системе контроля версий и генерировать из него типизированный Python.

Именно поэтому я создал nORM (no ORM - не ORM) и выпустил версию v0.1.0 на этой неделе (мой первый опенсорс проект).

Geri4 5 июн в 09:22

Как собрать своё зеркало PyPI на nginx за вечер (и не зависеть от блокировок pypi.org)

Средний

4 мин

7.4K

Python * DevOps *

Туториал

Из песочницы

Вчера pypi.org несколько часов был недоступен из российских сетей. Для кого-то это «подождём», а для CI/CD, прода и просто рабочего дня — это вставший pip install и красные сборки.

Причина системная: pypi.org и хранилище пакетов files.pythonhosted.org живут на CDN Fastly, у которого нет точек присутствия в России и доступ к которому уже не раз ограничивался. Вчерашняя недоступность — не первая и почти наверняка не последняя.

Хорошая новость: чтобы застраховаться, не нужно зеркалировать весь PyPI (это терабайты и постоянная синхронизация). Достаточно поднять лёгкий реверс-прокси на nginx. В этом гайде соберём такой с нуля — с кешированием и прозрачным переключением для pip.

Не хотите хостить сами? Есть уже готовое зеркало — pypi.depkit.ru. Оно работает на российских IP, имеет большой объём кеша под пакеты и отдаёт их очень быстро. Можно просто подставить его в index-url (как — в конце статьи) и пропустить всю настройку. Дальше — для тех, кому интересно поднять своё.

chisi 5 июн в 08:00

Как я сделал локальный RAG-сервис для SRE: ищем по документации, ранбукам и коду через Ollama

Средний

6 мин

7.8K

Python * Искусственный интеллектDevOps *

Туториал

Из песочницы

Недавно делал учебный проект про автоматизацию документирования инцидентов. Поначалу планы были грандиозными: инциденты, таймлайны, интеграции с мониторингами, чатами, постмортемы, подсказки дежурным инженерам.

Но довольно быстро стало понятно, что с временными и ресурсными ограничениями лучше не пытаться написать маленький PagerDuty. Поэтому я сузил задачу до более реалистичного ядра: локального RAG-сервиса, который ищет по документации, ранбукам и коду, а затем передаёт найденный контекст в LLM.

Так появился llmortem — FastAPI-сервис, который можно подключить к OpenWebUI как OpenAI-compatible backend.

В статье расскажу, как устроена архитектура, почему я начал с BM25, зачем индексировать docstring’и и какие ограничения у такого подхода.

LehausIT 4 июн в 19:39

Торговля на отклонениях: почему мы вернулись к тесту Дики-Фуллера (ADF)

8 мин

13K

КриптовалютыАлгоритмы * Математика * Python * Финансы в IT

Как бы мы ни пытались отказаться от этого инструмента в поисках более изящных алгоритмических решений, каждый раз мы к нему возвращаемся.

В прошлой статье про Гамма-флип я вскользь касался механики работы с отклонениями, но не раскрыл тему до конца.

В этой статье мы углубимся в стохастический анализ и рассмотрим методы определения стационарности временных рядов в реальном времени. Разберем математический аппарат расширенного теста Дики-Фуллера (ADF), причины его интеграции в ядро нашей торговой системы и особенности реализации на Python при работе с большими массивами данных.

Enorth 4 июн в 19:30

Как конечные автоматы помогают сделать агента надежнее и при чем тут pydantic-graph?

Средний

6 мин

13K

Python * Open source * Искусственный интеллектМашинное обучение *

Обзор

Когда пишешь библиотеку, рано или поздно упираешься в движок. Не в красивый внешний интерфейс и не в обёртки, а в ту часть внутри, которая гоняет процесс. Пара флагов, цикл while, большой if посередине, и через месяц вы уже сами не помните, какие переходы там вообще возможны и почему одна из веток недостижима.

Недавно я пробовал собрать ровно такой движок и наткнулся на библиотеку, которая делает эту работу заметно аккуратнее. Называется pydantic-graph. Про неё почти не пишут, хотя на ней стоит весь pydantic-ai, агентский фреймворк от авторов Pydantic. Дальше я расскажу про неё на конкретном примере, харнессе надёжности для слабых языковых моделей.

Сразу оговорюсь про термин, потому что он сейчас на слуху. Харнесс это не только MCP, скиллы и память. Это все что заставляет модель работать хорошо как агент. Именно эту часть я и беру за основу. Но статья не столько про модели, сколько про сам подход и библиотеку. Основной посыл в том, что это интересный способ собрать движок для чего угодно, где есть состояния и переходы, и при этом не утонуть в собственном цикле.

Весь код оформлен в библиотеку и, вместе с бенчмарком, доступен на GitHub.

Andrey_Biryukov 4 июн в 18:50

Pipeline в машинном обучении: как создавать сложные модели без боли и утечек данных

Средний

8 мин

13K

Блог компании OTUSPython * Машинное обучение *

Туториал

В ML‑проектах проблемы часто начинаются не с выбора алгоритма, а с предобработки: один трансформер забыли применить к тестовой выборке, другой обучили до кросс‑валидации, третий сломался при передаче проекта коллеге.

В статье разберём, как Pipeline в sklearn помогает собрать обработку данных и модель в единый воспроизводимый конвейер, снизить риск data leakage и упростить работу со сложными ML‑сценариями.

Читать гайд

Renewal_Studio 4 июн в 17:20

rtk + context-mode поверх Serena + Semble: стоит ли нахлобучивать прокси-экономию токенов или это бред?

Средний

6 мин

12K

Искусственный интеллектУправление разработкой * Python *

Мнение

Тема экономии токенов сейчас дико популярна, и мы с ребятами в Гильдии AI-инженеров знатно её пообсуждали. Напомню краткую суть: там связка Serena (LSP) + Semble (векторные эмбеддинги) + Ripgrep (поиск координат) показала себя абсолютным топом для точечной навигации.

Но в комментариях и личке мне тут же начали советовать: «Нахлобучь сверху еще rtk для сжатия вывода терминала и context-mode для полнотекстового индекса репозитория! Тема прокси-экономии сейчас на пике хайпа, сэкономишь еще больше!». Я подумал за**ись.

И решил провести душный чек. Взял популярный open-source проект supermemory (~180 файлов, JS/TS) и замерил: действительно ли добавление rtk + context-mode дает реальный профит поверх моего текущего сетапа, или это просто карго-культ и оверхед, который утянет бюджет в минус?

it_police 4 июн в 17:16

AI-агент своими руками: память, браузер, задачи и навыки — без боли

Простой

5 мин

12K

Python * Разработка под e-commerce * Управление разработкой *

Кейс

Из песочницы

Привет, Хабр!

Так уж вышло, что майские праздники я провёл дома — залечиваю травму после катания на длинной доске с колёсиками. Развлечений в такой ситуации не очень много, а одно из немногих, которое всегда со мной, — разработка программных проектов.

Этим я занимаюсь на работе, дома, в отпуске — везде. Такой уж человек.

И вот появилась возможность спокойно заняться старыми пет‑проектами и наконец реализовать давнюю идею: написать простую базу для создания AI‑агента, максимально упростив архитектуру и сделав её удобной для быстрого расширения под собственные задачи.

Если коротко — хочу сделать не «революционный AGI», а понятный конструктор, на основе которого любой разработчик сможет собрать своего личного ассистента.

+13

ohld 4 июн в 15:21

Почему Claude Code и Codex не ускоряют команду: у компании нет общей памяти

Простой

6 мин

19K

Python * JavaScript * Go * Анализ и проектирование систем * PHP *

Туториал

Компании уже оплачивают сотрудникам Claude Code, Cursor или Codex, но не всегда видят рост производительности.

Проблема часто не в модели, а в том, что знания о процессах, решениях и ошибках остаются на локальных компьютерах сотрудников.

Разбираю, зачем команде общая память, и при чём тут GBrain, OpenBrain и обычные Markdown-файлы.

Научиться работать с контекстом

+15

maximslav 4 июн в 14:04

Линейная регрессия на стероидах: Double Machine Learning для устранения смещений в данных

Средний

18 мин

11K

Big Data * Машинное обучение * Python * Статистика в ITАналитика мобильных приложений *

Туториал

Из песочницы

Любой аналитик знает, что самым надёжным способом проверки гипотез являются рандомизированные контролируемые эксперименты (RCT), или, как их называют в народе — A/B-тесты. На практике часто возникают ситуации, когда провести A/B-тест невозможно — в основном это происходит по этическим или техническим причинам. Однако бывают кейсы, когда рандомизация невозможна потому, что treatment-ом является определённое действие пользователя. Например, treatment-ом может быть оформление платной подписки или отмена бронирования на сервисе. Давайте назовём такой вид воздействия добровольным.

В русскоязычном пространстве, и в частности на Хабре, достаточно много статей, посвящённых таким методам Causal Inference, как DiD, PSM и Causal Impact. Тем не менее, к моему удивлению, практически нет статей, посвящённых методам на основе ортогонализации и regression adjustment, хотя, на мой взгляд, именно эти методы являются самыми удобными для оценки эффекта от добровольного treatment-а. Пришло время исправить это недоразумение и разобрать метод Double/Debiased Machine Learning (DML) и Partial Linear Regression для задач Causal Inference!

+13

pcdesign 4 июн в 13:13

Реверс-инжиниринг карт Heroes of Might and Magic III: Horn of the Abyss + парсер на Python

11 мин

10K

Python * Реверс-инжиниринг * Разработка игр * Игры и игровые консоли

Мне стало любопытно: смогу ли я распарсить карту HotA и написать такой парсер, который сможет быстро отвечать на вопросы вроде: «Где можно выучить заклинание “Городской портал”?», «Где найти артефакт, например, Чёрный шар?», «Есть ли в тюрьме герой Джелу?» и всё в таком духе.

А ещё я решил, что искать в интернете готовые спецификации скучно. Гораздо интереснее попробовать разобраться самому. Прямо с нуля. Как будто интернета нет, а есть только карты, низкоуровневые редакторы и желание понять, что там внутри.

В этой статье как раз и будут мои низкоуровневые мучения и исследования. Буду смотреть в байты, сравнивать карты, ошибаться, находить закономерности и постепенно вытаскивать из файла осмысленные данные.

Если вся эта археология неинтересна, можно просто промотать ближе к концу, взять готовый парсер и наконец узнать, где же на карте можно выучить «Городской портал».

llmceo 4 июн в 10:07

Тебя нет в ответах ChatGPT. Пошаговый гайд как это починить за один вечер

Простой

13 мин

8.3K

Python * Поисковая оптимизация * Искусственный интеллектКарьера в IT-индустрииБрендинг

Туториал

Из песочницы

Спроси ChatGPT или Claude про топовых экспертов в твоей нише и с большой вероятностью себя в ответе не найдёшь. Так было и у меня: руковожу AI-направлением в Т-Банке, выступаю, пишу, а модель об этом не знала, потому что меня не было в данных, по которым она отвечает. За вечер я это починил и собрал пошаговый гайд: как сделать сайт читаемым для агентов, попасть в Wikidata и Google Knowledge Graph. Без IT-бэкграунда, по шагам, с готовым репозиторием для форка.

GIGAIDECommunity 4 июн в 07:41

Обновления GigaIDE за май 2026

3 мин

8.2K

Блог компании СберТекстовые редакторы и IDE * JavaScript * TypeScript * Python *

Как обычно в начале месяца мы рассказываем вам о том, что изменилось в GigaIDE за прошедший месяц — май. Соответствующий обзор за апрель доступен здесь. Ниже — краткий обзор обновлений Pro-функциональности GigaIDE, который можно найти на нашем маркетплейсе.

+13

alex_grom38 4 июн в 06:25

Tilda и СБИС Presto: как мы синхронизируем остатки через стоп-лист, а не каталог

Средний

11 мин

6.7K

Python * Программирование * DevOps *

Кейс

Как мы избавили общепит от часа ручной работы каждое утро: разобрали реальный кейс синхронизации стоп-листа из СБИС Presto в каталог на Tilda через CommerceML. Поток на Python/FastAPI, дебаунс через SHA-256, eventual consistency без очередей и грабли, на которые наступили в проде.

Решение и грабли

GoldenGekko 3 июн в 18:02

Мой личный джун. Часть 1. Учим агента писать код и пользоваться git

Средний

13 мин

16K

Искусственный интеллектPython *

Туториал

Привет, Хабр! Меня зовут Владимир и я стал немного более GPU-rich. А это значит, что пора сдуть пыль со старого проекта)

В этой части статьи мы создадим необходимую инфраструктуру, напишем простого агента, а также добавим нашему агенту MCP-инструменты.

+16

trgv 3 июн в 18:00

Как я отучил оракула молоть околесицу про ГОСТы: сказ о doc-rag без единого (почти) заморского слова

Средний

16 мин

11K

Natural Language Processing * Машинное обучение * Open source * Python *

Обзор

Дело моё — программы писать, а сходиться им положено с мастеровой грамотой: ГОСТами, СТО, спецификациями. Хочу спросить оракула в писарне про точный пункт — получаю складную околесицу со ссылками на то, чего никто не писал. Тогда я сложил себе doc-rag: местную снасть для извлечения премудрости из собственных свитков. Внутри — устройство, грабли, история про утраченный указатель и попытка рассказать всё это без единого заморского слова.

Распахнуть свиток

+12

yeetmq 3 июн в 13:25

Параллельность RNN?

Сложный

6 мин

11K

Python * Математика * Машинное обучение * Научно-популярноеИскусственный интеллект

Обзор

Из песочницы

Смотрели итоги прошедшего ICLR? Меня заинтересовала довольно провокационная статья от Эплов — ParaRNN. Казалось бы, параллельность РНН — это их главный недостаток, благодаря которому их заменили трансформеры (в большинстве задач).

DenisDenisMIS 3 июн в 12:34

SmileLadder. Цикл «Память и мозг». Внимательно смотрим на что‑то и запоминаем?

Простой

9 мин

9.8K

МозгPython *

Обзор

Мы слышали про фотографическую память (вот интересная статья на habr) со школьных лет, знаем о существовании учеников, которым не надо было учить правила русского языка, а достаточно было просто один раз прочитать что‑то в книжке и они получали суперспособосность без ошибок писать диктанты. Мы видели в разных супершпионских кино как главный герой буквально бросив взгляд на какого‑то человека за доли секунд сопоставляет, копаясь в своей памяти, его образ с базой данных разыскиваемых преступников. И конечно многие помнят игру, в которой надо посмотрев на разложенные карточки, которые потом перевернут, искать пары.

Словом, мне стало интересно и в продолжении серии своих публикаций про память и мозг, решил поделится оценкой механики связи движения глаз и процесса запоминания. В том числе отправной точной стала недавняя статья в Nature Neuroscience

100gramm 3 июн в 08:38

DREM для линейной регрессии: как развязать веса перцептрона и ускорить обучение

Средний

9 мин

6.6K

Python * Искусственный интеллектМашинное обучение *

Из песочницы

Разбор применения метода DREM (Dynamic Regressor Extension and Mixing) для обучения линейного перцептрона. Рассматривается алгоритм декомпозиции многопараметрической задачи на набор независимых скалярных регрессий. В ходе экспериментальной апробации на синтетических и реальных данных оценено влияние различных параметров на величину MSE и время выполнения, а также проведен сравнительный анализ со стандартными оптимизаторами (SGD, ADAM).

1 2 ...

14 15

17 18 ...

547 548