Обновить
1024K+

Python *

Высокоуровневый язык программирования

530,61
Рейтинг
Сначала показывать
Порог рейтинга
Уровень сложности

Какой тул лучше собирает контекст для AI-агента? Сравниваем 21 подход от ripgrep до RAG и LSP

Время на прочтение8 мин
Охват и читатели9.5K

Если тебя хоть раз тревожило то, почему так быстро улетают лимиты Claude Code или любого другого ИИ-тула для кодинга, ты пришел по адресу. Буквально пара правок, и хоба дневной лимит исчерпан, а баланс API показывает дно. Вся эта боль в статье про экономию токенов на инструментах сборки контекста.

Читать далее

Как прототип AI‑агента на пару дней превратился в систему с дедлайнами, бюджетом токенов и ролями

Уровень сложностиСредний
Время на прочтение15 мин
Охват и читатели11K

Всем привет! Решил написать AI‑агента, который отвечает на вопросы по рабочему проекту. Думал: пара вечеров — и готово. В итоге несколько недель, куча граблей и странных открытий — ответы по 25 минут, бюджет токенов тает как снег, агент уходит в бесконечный цикл и тупо спамит одними и теми же запросами, а семантический поиск, который казался серебряной пулей — не работает. В статье — как я с этим боролся: планировщик + синтезатор, давление как дедлайн, роли «Новичок/Исследователь/Эксперт» и защита от зацикливания. Боль и страдания а так же конкретные решения.

Читать далее

Мне кажется, @durov должен был сделать это давно

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели18K

Всем привет!

 Это мой первый пост на Хабре и я хотел бы представиться. Меня зовут Алексей, я работаю в ИТ компании, но моя работа совсем с ИТ не связана — я комплаенс офицер (человек который следит, чтобы компания соблюдала свои же собственные правила). Пару месяцев назад решил сделать для души Телеграм бот, просто чтобы чуть лучше понимать процессы разработки и работу разработчиков.

Я достаточно активнопользуюсь Телеграм и подписан на кучу каналов, большинство из них уже давно на вечном мьюте — читать большое количество каналов просто нет времени, хотя там наверняка есть что‑то полезное или интересное для меня.

В итоге появилась идея, которую на мой взгляд @durov должен был реализовать уже давно — создать бот, который читал бы интересные для меня каналы и формировал персональную ленту из постов, актуальных для меня.

Ниже небольшой отчет о проделанной работе и рассказ о функционале, буду очень рад обратной связи.

Читать далее

Я собрал Telegram-бота с лентой новостей, которая учится на твоих реакциях — и хостится за $5 в месяц

Уровень сложностиСредний
Время на прочтение15 мин
Охват и читатели7.8K

Хотел ленту новостей без двух вещей: дублей (одно событие из пяти каналов с разными заголовками) и потока негатива по утрам.

Получился Telegram-бот, который по умолчанию показывает только хорошие и нейтральные новости — а тяжёлый контент включается в настройках на 4 уровнях. Плюс он убирает дубли, переводит RU↔EN и подстраивает выдачу под твои реакции 🔥 ❤️ 😢.

Но самое интересное — он живёт на одной машине Fly.io за ~$5 в месяц. В статье разбираю, как:

заменил Postgres + pgvector на встраиваемый sqlite-vec и убрал отдельную БД-машину;

гоняю типизацию, перевод и оценку тональности через бесплатные LLM на OpenRouter (счёт $0–1/мес);

считаю эмбеддинги локально на fastembed/ONNX без внешних API;

собрал рекомендательное ядро на «векторе вкуса» с EWMA и анти-баблом.

И, конечно, грабли: sqlite-vec, который ломался на arm64; vec0 без INSERT OR REPLACE; fastembed, сменивший пулинг между версиями; и LLM, которая «подкручивала» оценки негатива, пока я не дал ей чёткую рубрику.

👉 Бот живой, можно потрогать: @futur_e_news_bot

Читать далее

Whisper или GigaAM для русского ASR в продакшене: три ловушки бенчмарка, которые перевернут ваши выводы

Уровень сложностиСредний
Время на прочтение16 мин
Охват и читатели6.2K

Пару месяцев назад мы публиковали статью про то, как получили 3.3% WER для русского ASR на CPU с GigaAM — главный тезис тогда был «специализация бьёт универсальность». Замеры в той статье шли на пяти TTS‑фрагментах из аудиокниг. Всё дало идеальные 3,3% WER. С тех пор мы перемерили обе модели на реальных продакшен‑записях и часть прошлых выводов здесь уточняем.

Кандидата у нас по‑прежнему два: SberDevices GigaAM v3-e2e‑rnnt и OpenAI Whisper large‑v3-turbo. Приложение оффлайновое — корпоративные пользователи диктуют текст, облачные сервисы вроде Yandex SpeechKit или Whisper API им запрещены политикой безопасности. По публичным метрикам GigaAM выглядит сильнее, и новые бенчмарки мы рассчитывали как подтверждение прошлого выбора.

Подтверждения не случилось. По дороге мы попали в три ловушки, которые ждут любого, кто меряет ASR на собственном корпусе. Каждая из них переворачивает итоговый вывод: по опубликованным замерам GigaAM выглядит сильнее Whisper на 5–7 pp, как только мы сами померили на тех же данных — обе модели идут вровень, а на шумных записях Whisper выходит вперёд. Качество материала и эталонов в итоге решает больше, чем выбор самой модели.

Финальный выбор у нас такой:

Читать далее

Делаю DnD AI DM прямо в ТГ

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели6.7K

Раз ИИшки стремительно развиваются, подумал - почему бы не попробовать как пет проект сделать полноценного ДМа, который бы и правила знал, и не забывал что происходит, и все факты, события, NPC записывал.

А т.к. я хочу сделать как минимум не плохо - завяз, и уже два месяца разрабатываю этот продукт.

D20 на прочтение

Мадонёнок с огонёнком. Как Чуковский конструирует детскую речь

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели7.6K

Корней Чуковский не только писал книги для детей, но исследовал. как дети воспринимают и осознают мир с помощью языка. Многие детские авторы позже использовали находки Чуковского в своих произведениях для детей и о детях. Мне стало интересно с помощью Python посмотреть, как Чуковский конструирует детскую речь и за счет чего у него это получается забавно и поучительно.

Читать далее

Как мы проектировали мониторинг Telegram-групп на Telethon: архитектура, правила пользователей и масштабирование

Уровень сложностиПростой
Время на прочтение17 мин
Охват и читатели4.7K

Telegram давно стал не только мессенджером, но и большой средой для сообществ: локальные чаты, профессиональные группы, каналы с комментариями, чаты по аренде, работе, продаже вещей, услугам и так далее.

В какой-то момент у нас появилась техническая задача: сделать систему, которая умеет читать сообщения из Telegram-групп, проверять их по пользовательским правилам и отправлять уведомления, если найдено совпадение.

Например, один пользователь хочет получать сообщения, где есть слова:

Читать далее

Как я собрал MCP-коннектор для Claude за вечер: FastMCP, Streamable HTTP и грабли деплоя

Время на прочтение4 мин
Охват и читатели4.9K

MCP (Model Context Protocol) называют «USB-C для ИИ-агентов»: один протокол, и к модели подключаются десятки готовых интеграций без костылей. Звучит красиво, но настоящее понимание приходит только когда соберёшь сервер руками — где протокол реально экономит, а где придётся повозиться, видно лишь на практике. Я собрал свой за вечер и рассказываю по шагам.

Коннектор отдаёт Claude мою базу знаний — словарь из 90 ИИ-терминов и блок частых вопросов. Спрашиваешь в диалоге «что такое RAG» — и Claude достаёт определение из моей базы, со ссылкой на источник. Дальше — стек, код, деплой за nginx и три грабли, на которых я залип.

Читать далее

Автоматический отбор few_shot примеров для обучения модели

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели5.1K

Справочники МТР на крупных предприятиях ‒ это десятки тысяч строк вида «Кабель ВВГнг 3х2.5 кв.мм, серая изоляция, 100м», которые нужно разложить по атрибутам (тип, сечение, длина, цвет изоляции). Дубли, ошибки, разнородные форматы от разных поставщиков, почему это больная тема, а также подходы и методы решения, подробно разобраны в этой статье.

Читать далее

Как подключить Payme к Telegram боту на Python

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели4.4K

В этой статье разберём как подключить Payme к Telegram боту на Python используя библиотеку aiopayme — async-first решение с роутерами и dependency injection как в aiogram и FastAPI.

Читать далее

Год с Claude Code: главное — не он сам, а то, что в .claude/

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели21K

Claude Code у меня появился в марте 2025-го. Точную неделю не помню — в какой-то момент он у меня просто стал инструментом по умолчанию, и я с ним отработал примерно год.

Это не «AI убил программирование» и не «AI = x10 продуктивность». И то и другое — пустое. Реальность скучнее и интереснее одновременно.

Сразу важная оговорка: я использую Claude Code на максимум. Не «иногда», не «когда подходит» — постоянно, на каждой задаче. Если что-то можно сделать через него, я делаю через него. Под него подстроены CLAUDE.md, hooks, skills, slash-команды, два MCP-сервера. Это контекст для всех выводов ниже. Стек: Python, бэкенд, команда маленькая.

Где он реально помог

Массовые рутинные правки. Самое чистое попадание. Когда у тебя задача «во всех 47 эндпоинтах добавь параметр request_id в логи и пробрось его в нижний слой» — это его работа, а не моя. Открываю агента, описываю абзацем, прошу сначала план, смотрю план, говорю «давай» — и через минут десять у меня PR с тестами. По ощущениям часов тридцать-сорок за год сэкономил только на таких задачах.

Совет, который я выработал не сразу: на больших правках сначала только план, без кода. Если план мимо — лучше потерять минуту на новой просьбе, чем час на разгребании неверно сделанного.

Чтение чужого репозитория. Раньше я тратил полдня на «понять, что тут вообще происходит». Сейчас открываю агента и говорю: «прочти структуру, расскажи как устроена аутентификация». Через минуту — приличный пересказ с указанием файлов.

Только проверяю всегда — открываю пару названных файлов и сверяю с пересказом. Примерно в каждом пятом пересказе он что-то слегка приукрашивает — пишет про функцию, которой в коде нет, или приписывает модулю поведение, которого там нет. Даже с этой поправкой быстрее, чем читать с нуля.

Читать далее

ILO Self-Test Error: Диагностика и реанимация встроенной NAND-памяти в серверах HPE ProLiant Gen8/Gen9

Уровень сложностиСредний
Время на прочтение4 мин
Охват и читатели12K

Всех приветствую! это будет самый первый пост и его я решил посвятить следующий теме ILO Self‑Test Error, как диагностировать, в чем проблема и как реанимировать на серверах HPE. Почему именно данная тема сказать не могу, но моя любовь к оборудованию HPE безгранична и с первым постом не хотелось закрутить что то больно сложное, отсюда и выбор данной темы.

С данной проблемой я уверен чаще всего встречаются специалисты эксплуатации ЦОД и оборудования, те кто постоянно мониторит это оборудование и ходит на ILO. Сейчас на территории РФ такая ситуация что вендора ушли, а в частности нас интересует HPE и ни деталей ни поддержки мы не получаем и следственно приходится выкручиваться полностью самостоятельно. В этой статье разберем из‑за чего появляется такая ошибка, на сколько она критична и как ее вылечить чтобы не переживать за работу оборудования и чтобы глаза не мазолили никакие ошибки при подключение на ILO сервера.

Ну что же, перейдем от вступления и приступим к разговору по делу, а начнем с самой архитектуры ILO, что такое NAND, какие такие контроллеры и почему это влияет на ILO, AHS логи, Intelligent Provisioning и профили OneView. В серверах HPE есть чип NAND Flash который используется как независимый от основной операционной системы накопитель, где и хранятся все критические службы, которые мы описали выше.

Технология чипа: Чипы есть разные такие как e‑NAND или eMMC, к примеру в ILO 4 используется SK Hynix H26M31003GMR. Они представляют собой энергонезависимую память типа NAND, которая работает аналогично SD‑картам, но распаяна непосредственно на материнской плате для обеспечения высокой надежности при out‑of‑band управлении.

Читать далее

Ближайшие события

Что не так с SVG-файлами в Tcl/tk?

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели12K

В версии tcl/tk-9.0 добавлена возможность создавать изображения image из SVG-файлов (а значит и сохранять их в png-формате). Всё было хорошо до тех пор пока мне для статьи на сайте Tcler's Wiki ни потребовался флаг США для кнопки переключения языка интерфейса:

Читать далее

AI-компаньон в проде на третьем месяце — 5 архитектурных решений и инфра-тюнинг

Уровень сложностиСредний
Время на прочтение25 мин
Охват и читатели7.9K

Каждый, кто пробовал собрать AI-чат по типовой схеме — chat-completions API, OpenAI Memory, один эндпоинт Stable Diffusion — рано или поздно упирается в одни и те же стены. Бот забывает разговор через десять реплик. Иногда сервер бодро отвечает HTTP 200, а внутри пустая строка: ни ошибки, ни таймаута, модель просто отказалась говорить и сделала это молча. Один и тот же запрос рисует двух разных персонажей. А одеть нарисованного персонажа в конкретное платье из каталога не получается вообще.

Читать далее

Разбираемся в ML без воды: от базы до Attention. Часть 8: Kernel Trick

Уровень сложностиСредний
Время на прочтение11 мин
Охват и читатели6.4K

В предыдущей части мы затронули концептуальную идею Kernel Trick (ядерного трюка). Если говорить кратко: когда у нас нет возможности линейно разделить данные в текущем пространстве признаков, мы можем отобразить их в пространство более высокой размерности, где классы станут легко разделимы обычной гиперплоскостью.

В этой части мы глубоко изучим математическое устройство этого метода и разберемся, почему и как именно он работает "под капотом".

Читать далее

Масштабируемость ML-алгоритмов при увеличении вычислительных ресурсов

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели6.6K

В данной статье рассмотрено 5 разных алгоритмов машинного обучения, с наглядным сравнением их скорости работы на разном количестве аппаратных ресурсов.

Читать далее

GigaIDE Pro для FastAPI, Flask и SQLAlchemy

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели9.5K

Наш предыдущий обзор касался поддержки в GigaIDE — возможно, самого популярного фреймворка Python, который, однако, восходит к эпохе шаблонизаторов, когда веб-страницы формировались на бэке. Кстати, обзор, как реализована поддержка идеологических братьев Django в Java, есть здесь.

Сегодня мы рассмотрим поддержку других популярных Python-фреймворков: FastAPI, Flask, SQLAlchemy и немного Pydantic. В отличие от Django, все из них стали популярны благодаря своей легковесности и узкой специализации. Первые два — это веб-фреймворки, третий — ORM-фреймворк.

Читать далее

Qwen3.5 на двух V100, reverse SSH вместо Cloudflare в Telegram Mini App: собираю AI-репетитора английского

Время на прочтение13 мин
Охват и читатели6.8K

У меня в углу комнаты стоит сервер с двумя Tesla V100 32GB. Они доcтались мне для другой задачи, которая отвалилась, и полгода стояли мёртвым грузом. Параллельно я в очередной раз пробовал заниматься английским — Simpler, Doalingo, ещё пара продуктов. Хорошие, но мне не подходил формат: я хотел сценарий «открыл телефон дома на семь минут, поговорил, закрыл». Без расписания, без камеры, без поиска тьютора, который понимает мой акцент с пятого раза.

Сошлось.

Идея: Telegram Mini App, в нём кнопка «говорить», за ней — AI-репетитор, который слышит, что я сказал, отвечает голосом, помнит контекст разговора, тыкает в мои повторяющиеся ошибки и подбрасывает слова, которые я пытаюсь выучить. Полностью бесплатно.

Модель Qwen3.5 вышла 25 февраля , я её гоняю всего несколько недель, продукт сырой. Эта статья — про архитектурные решения и про то, на какие грабли я уже успел наступить.

Читать далее

Не теряй навыков общения работая на удалёнке или Python + Психология

Уровень сложностиСредний
Время на прочтение11 мин
Охват и читатели5.6K

В данной статье рассматривается создание приложения для тренировки общения. Реализация на Python с использованием k8s, linux, Redis, Postgres, kafka. Предлагаются варианты переиспользования созданных микросервисов.

Читать далее