Обновить
512K+

Python *

Высокоуровневый язык программирования

618,26
Рейтинг
Сначала показывать
Порог рейтинга
Уровень сложности

Обновления GigaIDE за май 2026

Время на прочтение3 мин
Охват и читатели8K

Как обычно в начале месяца мы рассказываем вам о том, что изменилось в GigaIDE за прошедший месяц — май. Соответствующий обзор за апрель доступен здесь. Ниже — краткий обзор обновлений Pro-функциональности GigaIDE, который можно найти на нашем маркетплейсе.

Читать далее

Tilda и СБИС Presto: как мы синхронизируем остатки через стоп-лист, а не каталог

Уровень сложностиСредний
Время на прочтение11 мин
Охват и читатели6.7K

Как мы избавили общепит от часа ручной работы каждое утро: разобрали реальный кейс синхронизации стоп-листа из СБИС Presto в каталог на Tilda через CommerceML. Поток на Python/FastAPI, дебаунс через SHA-256, eventual consistency без очередей и грабли, на которые наступили в проде.

Решение и грабли

Мой личный джун. Часть 1. Учим агента писать код и пользоваться git

Уровень сложностиСредний
Время на прочтение13 мин
Охват и читатели16K

Привет, Хабр! Меня зовут Владимир и я стал немного более GPU-rich. А это значит, что пора сдуть пыль со старого проекта)

В этой части статьи мы создадим необходимую инфраструктуру, напишем простого агента, а также добавим нашему агенту MCP-инструменты.

Читать далее

Как я отучил оракула молоть околесицу про ГОСТы: сказ о doc-rag без единого (почти) заморского слова

Уровень сложностиСредний
Время на прочтение16 мин
Охват и читатели11K

Дело моё — программы писать, а сходиться им положено с мастеровой грамотой: ГОСТами, СТО, спецификациями. Хочу спросить оракула в писарне про точный пункт — получаю складную околесицу со ссылками на то, чего никто не писал. Тогда я сложил себе doc-rag: местную снасть для извлечения премудрости из собственных свитков. Внутри — устройство, грабли, история про утраченный указатель и попытка рассказать всё это без единого заморского слова.

Распахнуть свиток

Параллельность RNN?

Уровень сложностиСложный
Время на прочтение6 мин
Охват и читатели11K

Смотрели итоги прошедшего ICLR? Меня заинтересовала довольно провокационная статья от Эплов — ParaRNN. Казалось бы, параллельность РНН — это их главный недостаток, благодаря которому их заменили трансформеры (в большинстве задач).

Читать далее

SmileLadder. Цикл «Память и мозг». Внимательно смотрим на что‑то и запоминаем?

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели9.8K

Мы слышали про фотографическую память (вот интересная статья на habr) со школьных лет, знаем о существовании учеников, которым не надо было учить правила русского языка, а достаточно было просто один раз прочитать что‑то в книжке и они получали суперспособосность без ошибок писать диктанты. Мы видели в разных супершпионских кино как главный герой буквально бросив взгляд на какого‑то человека за доли секунд сопоставляет, копаясь в своей памяти, его образ с базой данных разыскиваемых преступников. И конечно многие помнят игру, в которой надо посмотрев на разложенные карточки, которые потом перевернут, искать пары.

Словом, мне стало интересно и в продолжении серии своих публикаций про память и мозг, решил поделится оценкой механики связи движения глаз и процесса запоминания. В том числе отправной точной стала недавняя статья в Nature Neuroscience

Читать далее

DREM для линейной регрессии: как развязать веса перцептрона и ускорить обучение

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели6.6K

Разбор применения метода DREM (Dynamic Regressor Extension and Mixing) для обучения линейного перцептрона. Рассматривается алгоритм декомпозиции многопараметрической задачи на набор независимых скалярных регрессий. В ходе экспериментальной апробации на синтетических и реальных данных оценено влияние различных параметров на величину MSE и время выполнения, а также проведен сравнительный анализ со стандартными оптимизаторами (SGD, ADAM).

Читать далее

Введение в архитектуру ИИ‑систем: как GPT‑wrapper превращается в распределённую систему

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели5.7K

Почти все AI-проекты начинаются одинаково. Разработчик делает небольшой сервис с одним вызовом модели, подключает FastAPI, добавляет чат и показывает демо команде. На этом этапе всё выглядит настолько просто, что возникает опасное ощущение: «Ну это же обычный API-вызов, только ответ пишет нейросеть».

Читать далее

Зачем backend разработчику Python, если он не собирается становиться data scientist

Уровень сложностиСредний
Время на прочтение11 мин
Охват и читатели11K

Долго воспринимал Python как язык из соседнего мира. Где то там data science, pandas, ноутбуки, модели, эксперименты. А у меня обычный backend: API, микросервисы, Kafka, БД, CI/CD и продакшен.

C# и Java для этого хватало.

Но когда начал разбираться с LLM быстро понял, вызвать модель можно из любого языка, а вот руками потрогать RAG, embeddings, локальные модели, чанкинг и evaluation проще всего через Python.

И ещё быстрее стало понятно другое, LLM это не просто «отправить prompt и получить ответ». Как только речь заходит о реальной системе появляются привычные backend вопросы «доступы, логи, стоимость, latency, качество ответа, безопасность данных и сопровождение».

Поэтому для меня Python стал не заменой C# или Java, а инструментом который помогает быстрее зайти в новый слой backend задач.

Зачем backend разработчику Python

Какой тул лучше собирает контекст для AI-агента? Сравниваем 21 подход от ripgrep до RAG и LSP

Время на прочтение8 мин
Охват и читатели9.7K

Если тебя хоть раз тревожило то, почему так быстро улетают лимиты Claude Code или любого другого ИИ-тула для кодинга, ты пришел по адресу. Буквально пара правок, и хоба дневной лимит исчерпан, а баланс API показывает дно. Вся эта боль в статье про экономию токенов на инструментах сборки контекста.

Читать далее

Как прототип AI‑агента на пару дней превратился в систему с дедлайнами, бюджетом токенов и ролями

Уровень сложностиСредний
Время на прочтение15 мин
Охват и читатели12K

Всем привет! Решил написать AI‑агента, который отвечает на вопросы по рабочему проекту. Думал: пара вечеров — и готово. В итоге несколько недель, куча граблей и странных открытий — ответы по 25 минут, бюджет токенов тает как снег, агент уходит в бесконечный цикл и тупо спамит одними и теми же запросами, а семантический поиск, который казался серебряной пулей — не работает. В статье — как я с этим боролся: планировщик + синтезатор, давление как дедлайн, роли «Новичок/Исследователь/Эксперт» и защита от зацикливания. Боль и страдания а так же конкретные решения.

Читать далее

Мне кажется, @durov должен был сделать это давно

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели18K

Всем привет!

 Это мой первый пост на Хабре и я хотел бы представиться. Меня зовут Алексей, я работаю в ИТ компании, но моя работа совсем с ИТ не связана — я комплаенс офицер (человек который следит, чтобы компания соблюдала свои же собственные правила). Пару месяцев назад решил сделать для души Телеграм бот, просто чтобы чуть лучше понимать процессы разработки и работу разработчиков.

Я достаточно активнопользуюсь Телеграм и подписан на кучу каналов, большинство из них уже давно на вечном мьюте — читать большое количество каналов просто нет времени, хотя там наверняка есть что‑то полезное или интересное для меня.

В итоге появилась идея, которую на мой взгляд @durov должен был реализовать уже давно — создать бот, который читал бы интересные для меня каналы и формировал персональную ленту из постов, актуальных для меня.

Ниже небольшой отчет о проделанной работе и рассказ о функционале, буду очень рад обратной связи.

Читать далее

Я собрал Telegram-бота с лентой новостей, которая учится на твоих реакциях — и хостится за $5 в месяц

Уровень сложностиСредний
Время на прочтение15 мин
Охват и читатели7.9K

Хотел ленту новостей без двух вещей: дублей (одно событие из пяти каналов с разными заголовками) и потока негатива по утрам.

Получился Telegram-бот, который по умолчанию показывает только хорошие и нейтральные новости — а тяжёлый контент включается в настройках на 4 уровнях. Плюс он убирает дубли, переводит RU↔EN и подстраивает выдачу под твои реакции 🔥 ❤️ 😢.

Но самое интересное — он живёт на одной машине Fly.io за ~$5 в месяц. В статье разбираю, как:

заменил Postgres + pgvector на встраиваемый sqlite-vec и убрал отдельную БД-машину;

гоняю типизацию, перевод и оценку тональности через бесплатные LLM на OpenRouter (счёт $0–1/мес);

считаю эмбеддинги локально на fastembed/ONNX без внешних API;

собрал рекомендательное ядро на «векторе вкуса» с EWMA и анти-баблом.

И, конечно, грабли: sqlite-vec, который ломался на arm64; vec0 без INSERT OR REPLACE; fastembed, сменивший пулинг между версиями; и LLM, которая «подкручивала» оценки негатива, пока я не дал ей чёткую рубрику.

👉 Бот живой, можно потрогать: @futur_e_news_bot

Читать далее

Ближайшие события

Whisper или GigaAM для русского ASR в продакшене: три ловушки бенчмарка, которые перевернут ваши выводы

Уровень сложностиСредний
Время на прочтение16 мин
Охват и читатели6.5K

Пару месяцев назад мы публиковали статью про то, как получили 3.3% WER для русского ASR на CPU с GigaAM — главный тезис тогда был «специализация бьёт универсальность». Замеры в той статье шли на пяти TTS‑фрагментах из аудиокниг. Всё дало идеальные 3,3% WER. С тех пор мы перемерили обе модели на реальных продакшен‑записях и часть прошлых выводов здесь уточняем.

Кандидата у нас по‑прежнему два: SberDevices GigaAM v3-e2e‑rnnt и OpenAI Whisper large‑v3-turbo. Приложение оффлайновое — корпоративные пользователи диктуют текст, облачные сервисы вроде Yandex SpeechKit или Whisper API им запрещены политикой безопасности. По публичным метрикам GigaAM выглядит сильнее, и новые бенчмарки мы рассчитывали как подтверждение прошлого выбора.

Подтверждения не случилось. По дороге мы попали в три ловушки, которые ждут любого, кто меряет ASR на собственном корпусе. Каждая из них переворачивает итоговый вывод: по опубликованным замерам GigaAM выглядит сильнее Whisper на 5–7 pp, как только мы сами померили на тех же данных — обе модели идут вровень, а на шумных записях Whisper выходит вперёд. Качество материала и эталонов в итоге решает больше, чем выбор самой модели.

Финальный выбор у нас такой:

Читать далее

Делаю DnD AI DM прямо в ТГ

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели7K

Раз ИИшки стремительно развиваются, подумал - почему бы не попробовать как пет проект сделать полноценного ДМа, который бы и правила знал, и не забывал что происходит, и все факты, события, NPC записывал.

А т.к. я хочу сделать как минимум не плохо - завяз, и уже два месяца разрабатываю этот продукт.

D20 на прочтение

Мадонёнок с огонёнком. Как Чуковский конструирует детскую речь

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели7.7K

Корней Чуковский не только писал книги для детей, но исследовал. как дети воспринимают и осознают мир с помощью языка. Многие детские авторы позже использовали находки Чуковского в своих произведениях для детей и о детях. Мне стало интересно с помощью Python посмотреть, как Чуковский конструирует детскую речь и за счет чего у него это получается забавно и поучительно.

Читать далее

Как мы проектировали мониторинг Telegram-групп на Telethon: архитектура, правила пользователей и масштабирование

Уровень сложностиПростой
Время на прочтение17 мин
Охват и читатели4.8K

Telegram давно стал не только мессенджером, но и большой средой для сообществ: локальные чаты, профессиональные группы, каналы с комментариями, чаты по аренде, работе, продаже вещей, услугам и так далее.

В какой-то момент у нас появилась техническая задача: сделать систему, которая умеет читать сообщения из Telegram-групп, проверять их по пользовательским правилам и отправлять уведомления, если найдено совпадение.

Например, один пользователь хочет получать сообщения, где есть слова:

Читать далее

Как я собрал MCP-коннектор для Claude за вечер: FastMCP, Streamable HTTP и грабли деплоя

Время на прочтение4 мин
Охват и читатели4.9K

MCP (Model Context Protocol) называют «USB-C для ИИ-агентов»: один протокол, и к модели подключаются десятки готовых интеграций без костылей. Звучит красиво, но настоящее понимание приходит только когда соберёшь сервер руками — где протокол реально экономит, а где придётся повозиться, видно лишь на практике. Я собрал свой за вечер и рассказываю по шагам.

Коннектор отдаёт Claude мою базу знаний — словарь из 90 ИИ-терминов и блок частых вопросов. Спрашиваешь в диалоге «что такое RAG» — и Claude достаёт определение из моей базы, со ссылкой на источник. Дальше — стек, код, деплой за nginx и три грабли, на которых я залип.

Читать далее

Автоматический отбор few_shot примеров для обучения модели

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели5.2K

Справочники МТР на крупных предприятиях ‒ это десятки тысяч строк вида «Кабель ВВГнг 3х2.5 кв.мм, серая изоляция, 100м», которые нужно разложить по атрибутам (тип, сечение, длина, цвет изоляции). Дубли, ошибки, разнородные форматы от разных поставщиков, почему это больная тема, а также подходы и методы решения, подробно разобраны в этой статье.

Читать далее

Как подключить Payme к Telegram боту на Python

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели4.4K

В этой статье разберём как подключить Payme к Telegram боту на Python используя библиотеку aiopayme — async-first решение с роутерами и dependency injection как в aiogram и FastAPI.

Читать далее