Обновить
1024K+

Python *

Высокоуровневый язык программирования

440,18
Рейтинг
Сначала показывать
Порог рейтинга
Уровень сложности

«Сверхзвуковой математик» против «Вдумчивого логиста»: битва алгоритмов 3D-упаковки

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели12K

Что будет, если столкнуть классический переборный алгоритм упаковки и «математику потока» на базе Numpy? Мы взяли реальный кейс на 398 предметов и проверили: можно ли за доли секунды найти решение, которое окажется дешевле и безопаснее ручного планирования.

Внутри — разбор «Бизнес-Ассемблера», борьба с весовыми лимитами и ответ на вопрос: почему при КПД 61% по объему контейнер может считаться идеально упакованным.

Читать далее

Пошаговые диалоги в Python без боли: описываем визарды в JSON, а не в if-ах

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели1.1K

Писать сложные диалоги в Telegram-ботах — это боль из вложенных if-ов, сломанных переходов и бесконечного рефакторинга. В этой статье — как мы вынесли всю логику визардов в JSON и сделали движок, который сам управляет шагами, условиями и навигацией.

Без спагетти-кода. Без привязки к платформе. С возможностью собрать рабочего бота за вечер.

Читать далее

Сравнение TTS-моделей на реальных задачах бизнеса: голосовой бот и аудиоподкасты

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели8.7K

Это вторая часть обзора моделей для задачи синтеза речи (Text-to-Speech). В прошлой части я сравнил 7 Open Source моделей для этой задачи по нескольким критериям. В этот раз я решил посмотреть не только на Open Source-модели, но и на проприетарные TTS-решения.

Читать далее

Как решать задачу NER на практике

Уровень сложностиСредний
Время на прочтение22 мин
Охват и читатели10K

Рассказываю, как на практике решать задачу NER. На примере извлечения сущностей из резюме пройдём путь от разметки данных до работающего API. Меньше теории, больше практики.

🔥 Начинаем 🔥

Распознаём реквизиты из карточки контрагентов: Как мы сделали API для извлечения реквизитов из документов

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели9.5K

Привет, Хабр!

Каждый, кто работал с бухгалтерией, CRM или просто заводил контрагента вручную, знает эту боль. Вам присылают карточку компании в PDF, договор в DOCX или просто текстовый файл с реквизитами. Задача: достать оттуда ИНН, КПП, расчётный счёт и БИК, чтобы не схлопотать штраф за неверные данные.

Можно нанимать стажёра, который будет перепечатывать это в Excel. А можно довериться машине.

Мы в нашей компании долгое время решали эту проблему для своих внутренних задач (интеграция с 1С и автоматизация документооборота), а в итоге обкатали решение и выпилили в отдельный публичный сервис. Сегодня расскажу, как наш API извлечения реквизитов работает под капотом, покажу примеры кода на 6 языках (включая 1С, куда без него) и честно расскажу о таймаутах и подводных камнях.

Читать далее

Как я собрал автономную AI-новостную систему за полтора месяца

Время на прочтение7 мин
Охват и читатели9.2K

Автор: Алексей Кравцов

Полтора месяца назад у меня было семь воркфлоу в n8n для новостного пайплайна. Каждый делал что-то своё. На бумаге красиво. На практике — постоянные затыки. Где-то новость застряла, непонятно где. Исправляешь одно — ломается другое.

Семь воркфлоу — семь точек отказа. И каждая ломается по-своему.

Сегодня та же задача решена иначе: 160 уникальных источников, 7127 записей в базе, 11 воркеров, 5 AI-агентов, локальная LLM на домашнем мини-ПК — и оркестратор, которому я просто пишу задачу в Telegram.

Без n8n. Без ручного управления. Почти без моего участия.

Вот как это вышло.

Читать далее

Сводка Аналитического Наблюдения — считаем сумму по столбцу в Python

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели5.2K

Всем привет, меня зовут Виталий, автор телеграмм канала Детектив данных, про мой путь в аналитике данных, мучаю питон и sql, строю графики и думаю как жить дальше.

По работе довольно много времени провожу в питоне и абсолютно всегда нужно контролировать чтобы в процессе работы с данными - эти данные не упустить, и если так произошло, то понять в какой момент нужно за ними вернуться.

Принять объект под наблюдение

Database-клиент для GigaIDE

Уровень сложностиСредний
Время на прочтение4 мин
Охват и читатели5.4K

Продолжая тему инструментов, интегрированных в среду разработки, сегодня мы рассмотрим клиент для работы с базами данных, доступный пользователям GigaIDE. Для пользователей Community-версии доступен open source-плагин DB Navigator, который хорошо описан, например, здесь. Пользователям PRO-версии доступна пара расширений:

SQL — синтаксическая поддержка и форматирование SQL-кода;

Database — клиент баз данных с широким набором возможностей.

Читать далее

Как школьная идея «списка желаний» превратилась в сервис на 70 000 пользователей

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели5.8K

У меня обычная семья. Я и жена — айтишники, 2 сына, собака. Обычная работа, обычная школа, обычные прогулки в парке. 

Старший сын Егор  — стандартный школьник. Ходит на информатику, получает там пятерки, сидит за компом до глубокой ночи — то в играх, то в Blender. В какой-то момент открывает для себя вайбкодинг и между делом приносит новости типа “я сделал нейронку внутри Майнкрафта, она там сама живет”, или “мой блог с анимацией набрал 30к подписчиков”, а через неделю забивает на проект. 

Весной 2025го Егор приносит идею. Простую, даже немного наивную. “Хочу сделать бот — список желаний в Telegram и отправлять его родственникам. Потому что вы не знаете, что я хочу, и дарите фигню”. Хорошее описание боли, понятный вариант решения. 

Идея оказалась настолько очевидной, что сразу зацепила. Не как «давайте сделаем стартап», а как «А ведь это правда неудобно. Сделай, мы будем пользоваться».

Первый код бота он навайбкодил за пол дня. Это был не продукт. Это был набор кнопок, который позволял добавить несколько желаний и получить ссылкуна их список. Всё работало не идеально, с ошибками в текстах, местами ломалось, но это можно было использовать.

Жена помогла развернуть код на сервере, чтобы бот жил не только на локальной машине. Мы отдали бота посмотреть друзьям. Папа (я) сделал сайт Fishlist.ru на Tilda и запустил рекламу на 1000 рублей. Первые пользователи появились очень тихо. Никто не писал восторженных отзывов. Никто не говорил «это гениально». Люди просто начинали пользоваться: добавляли подарки, шарили вишлисты друзьям. 

Читать далее

Флип со стрекозой и ПэВ-диапазон чёрной дыры: как я выводил шмеля из крена в симуляции

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели5.9K

Флип 360 градусов при ветре 5 м/с со стрекозой. Пчела и шмель. Как они привели меня к ПэВ диапазону чёрной дыры.

Читать далее

Как мы провели лоботомию 744-миллиардной нейросети GLM-5.1, чтобы запустить её на 16 ГБ VRAM

Уровень сложностиСредний
Время на прочтение3 мин
Охват и читатели8.6K

У нас не было фермы. У нас была бесплатная виртуальная машина на Kaggle с одной старушкой NVIDIA T4 на 16 ГБ VRAM. И у нас была концепция экстремального MLOps под кодовым названием «Russian Winter 26».

В этой статье я расскажу, как мы вскрыли архитектуру самого тяжелого китайского гиганта, переписали математику матриц внимания, обошли хардкодные ограничения GQA и заставили ядро модели сделать первый вдох на бесплатном железе.

Читать далее

Что писала Цветаева о любви. Исследование лирики на Python

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели7.1K

Как Марина Цветаева умела говорить о любви? Мне стало интересно исследовать творчество Цветаевой с помощью Python и вычислить те поэтические инструменты, которые она использует для выражения любви и описания таких чувств в поэзии. Некоторые открытия оказались весьма неожиданны.

Читать далее

Мотивация, оптимизация, коробочка, жабочка и «налог на усталость»

Уровень сложностиПростой
Время на прочтение12 мин
Охват и читатели6K

Я не программист. Я архитектор, проектирую дома, а полгода назад не знала, где живут скрипты и питоны. Но когда важный для меня чат в Telegram собрались удалять, я попросила нейросеть написать парсер – и пропала. С тех пор прошло полгода. Я всё ещё доделываю приложение. У него есть имя – Розитта, розовая робожаба на иконке. И оно пожирает мои ночи, деньги на такси и остатки семейного спокойствия. Это не история успеха за 4 дня. Это история о том, как взрослый человек с семьёй, работой и падающим забором ушёл в вайбкодинговый запой – и что из этого вышло. Все совпадения с реальными нейросетями не случайны, а промпты – настоящие.

Заглянуть в цифровое болото

Ближайшие события

Blueprint ИИ анализа настроений в новостях

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели11K

🤡 Как контрить шитпостинг Президента США

Существующие решения на GitHub имеют фатальные изъяны. Разберём несколько примеров - плюсы и минусы.

Читать далее

Загрузка конфигурации из settings.toml в Python: чтение, проверка структуры и преобразование в объекты Pydantic

Уровень сложностиСредний
Время на прочтение18 мин
Охват и читатели8.4K

В прикладной разработке параметры программы обычно не размещают непосредственно в исходном коде. Токены, адреса серверов, номера портов, режимы запуска, имена пользователей, пароли и иные значения конфигурационного характера выносятся во внешний файл настроек. Такой способ организации данных позволяет отделить служебные параметры от программной логики, упростить сопровождение проекта и уменьшить вероятность ошибок при изменении окружения.

Ниже рассматривается модуль Python, который читает файл settings.toml, преобразует его содержимое в структуры Python, извлекает нужный раздел конфигурации и проверяет его через модель Pydantic.

Читать далее

Парадокс ансамблей: почему «слабые» модели иногда побеждают «сильные»

Время на прочтение3 мин
Охват и читатели10K

В ансамблевом прогнозировании важнее не индивидуальное качество моделей, а разнообразие их ошибок. Эксперимент показывает: пул из «худших» по отдельности моделей даёт лучшую точность ансамбля, чем пул из «лучших».

Читать далее

Пишем юзербота для MAX:, Green-API и автоматизация рутины. Личный опыт и примеры кода

Уровень сложностиСредний
Время на прочтение16 мин
Охват и читатели8K

Юзербот — это обычный аккаунт MAX с подтвержденным номером телефона, которым управляет скрипт. В отличие от официальных чат-ботов, юзербот сидит под капотом обычного клиентского профиля. Официального API для этого нет, платформа такие вольности не любит. Но если нужно обойти ограничения и автоматизировать рутину — приходится использовать сторонние библиотеки.

 

Что нужно знать перед запуском:

Скрипт работает 24/7 с обычного аккаунта.

Доступны любые действия, которые может выполнить живой человек.

Нужно жестко контролировать частоту запросов. Ошибка в лимитах — улетаете в бан.

 

На чем писать юзербота:

Green-API - Есть техподдержка, SLA, стабильные коннекты.

PyMax - open-source, Настраиваете сами, падают без предупреждения.

 

Разбираем Green-API

Green-API дает готовый интерфейс для управления аккаунтом MAX. Смотрим, что умеет этот шлюз.

Читать далее

DiffQuant: прямая оптимизация коэффициента Шарпа через дифференцируемый торговый симулятор

Уровень сложностиСложный
Время на прочтение15 мин
Охват и читатели8.6K

Большинство ML-систем для трейдинга оптимизируют MSE, а оценивают по коэффициенту Sharpe. В DiffQuant этот разрыв убран: весь путь от рыночных признаков до позиции, PnL и издержек собран в единый дифференцируемый граф.

Градиент проходит не через proxy-цель, а через саму торговую механику. На двух последовательных held-out кварталах прототип показал Sharpe +1.73 и +1.15 после учёта комиссий.

Код, данные и протокол эксперимента открыты. Это не готовая торговая система - это другая постановка задачи.

Читать далее

Закрываем самую частую боль DevSecOps: SSO + обязательный 2FA + RBAC в Wazuh через Authentik (и ещё собираем его логи)

Уровень сложностиПростой
Время на прочтение31 мин
Охват и читатели11K

Привет, друзья! С вами pensecfort. Сегодня мы закрываем одну из самых частых болей в любой инфраструктуре — управление доступом к инструментам мониторинга.

Эта статья — текстовое дополнение к одноимённому видео на YouTube. Если вы предпочитаете смотреть, а не читать — ссылка в моём Telegram-канале. Если предпочитаете читать — вы попали по адресу. Здесь всё то же самое: реальные конфиги, мои скрипты, и ни капли маркетингового булшита.

Читать далее

Semantic terminal: AI-генератор однострочников по описанию на естественном языке

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели8.5K

Эта заметка вдохновлена статьей Я заменил Google на 50 строк Python. Через месяц я забыл, как пишется tar -xzf. В какой-то момент, в очередной раз после нажатия Alt+Tab для переключения в браузер, чтобы быстро найти какой-то линуксовый однострочник, я подумал, что хватит это терпеть, и полез искать упомянутую статью. Перечитав её и прошерстив комментарии, я понял, что некоторые нужные мне вещи сделаны не совсем так, как хотелось бы, поэтому пошёл пилить свой велосипед. Итак, представляю вам semantic-terminal:

Ставится через pip: pip install semantic-terminal

Unix-style утилита sem, которая прокидывает аргументы в LLM с промтом: “Сделей однострочник”

Опционально предоставляет подробное описание однострочника на языке запроса

Опциональная утилита sem-run, запускающая сгенерированную команду с сохранением в истории терминала

Задержка генерации меньше 1с при условии … кхм хм … стабильного интернета

Читать далее