Все потоки

Python *

Высокоуровневый язык программирования

454,96

Рейтинг

СтатьиПостыНовостиАвторыКомпании

AndreasCag 28 окт 2025 в 15:44

Делаем самые лучшие фото для документов

Простой

8 мин

18K

ReactJS * Python * JavaScript * Веб-разработка *

Кейс

Привет, Хабр!

Делали ли вы электронную визу в Индию? А, может, в Южную Корею? Или подавались на лотерею Green Card в США? Если да, то вы точно знаете, что для заявки на все эти документы надо прикрепить фотографию определённого размера с целым набором требований...

А такое ну просто необходимо автоматизировать!

И, как можно догадаться, сайтов для автоматизации фотографий на документы просто куча. Только вот есть одна проблема: все эти сайты хотят много денег - от 5 до 12 долларов за приведение фото к нужным требованиям.

Терпеть такое я, конечно же, не стал и написал своего бота в Телеграме, который делает это всё бесплатно.

Подробности под катом!

Читать далее

+16

Petro38 28 окт 2025 в 13:10

Ловим «взрослые» сцены на видео: как ИИ помогает редакторам

Средний

15 мин

9.1K

Спортивное программирование * Python * Машинное обучение * Работа с видео * Искусственный интеллект

Поводом для написания этой заметки стало обсуждение на недавнем отраслевом мероприятии задач мультимодерации контента: как быстро и надёжно находить «взрослые» сцены в длинных видео и автоматически подсвечивать фрагменты для ручной проверки. Похожие кейсы регулярно встречаются и в открытых соревнованиях по ИИ (например, в подборке задач Wink AI Challenge на Codenrock).

Читать далее

+16

enamored_poc 28 окт 2025 в 08:51

Изучаем Python: модуль csv для начинающих с домашним заданием

Средний

13 мин

13K

Туториал

CSV (Comma-Separated Values) — это универсальный язык для обмена табличными данными, который понимают все, от Excel до сложных баз данных. Вся его сила в простоте: это обычный текст, где значения разделены запятыми. Именно поэтому он стал стандартом для выгрузки отчетов, переноса контактов и подготовки данных.

Читать далее

+1

mikneue 28 окт 2025 в 06:42

Ансамблирование BERT для анализа логов и почему вам может быть достаточно solo-модели

Сложный

7 мин

6.5K

Блог компании СберPython * Алгоритмы * Высоконагруженные системы * Математика *

Кейс

1 августа 2012 года, торговая фирма Knight Capital развернула новую версию торгового ПО SMARS. Из‑за ошибки при развертывании на одном из восьми серверов осталась старая тестовая версия кода, из‑за чего торговый робот начал неконтролируемо рассылать миллионы ошибочных заявок на покупку и продажу акций. Этот процесс длился около 45 минут и привел к убыткам в размере примерно 440 миллионов долларов — почти весь капитал компании.

Ключевая проблема мониторинга состояла в том, что система PMON (Position Monitor) полностью полагалась на ручной мониторинг: она не генерировала автоматических оповещений и не выделяла превышение лимитов. Трейдеры Knight видели аномальную активность в логах, но не понимали контекст:

Читать далее

+14

negrbluad 27 окт 2025 в 19:34

Простейшая закономерность на рынке способна принести 100% прибыли

Средний

13 мин

12K

Финансы в ITPython * Математика * Анализ и проектирование систем * Алгоритмы *

В трейдинге часто говорят: «Цена — это следствие, объём — это причина».
Именно так я наткнулся на одну простую, но крайне интересную закономерность: если в момент падения появляется свеча с объёмом, который в два раза превышает средний за последние 60 дней, — то на следующей свече часто начинается рост.

Предлагаю протестировать эту идею, узнать какой выход мы получим и написать рабочего real-time бота с помощью python.

Читать далее

-7

DirtyHornet 27 окт 2025 в 18:13

Как я похоронил свой лучший проект еще на моменте его создания? История dnevniklib

3 мин

12K

Много кто на Хабре знает мое имя из-за моего проекта dnevniklib - Python библиотека для работы с API МЭШ (Московская Электронная Школа). На пике популярности ее скачали с PyPI 3000 раз! Данный проект являлся моей моей визитной карточкой, многие мои знакомые, которые как и я програмисты, нашли меня именно через мой Github. Да, это было круто, но потом произошло затишье... Я кинул проект в архив и он до сих пор там валяется. Но почему?

Эта статья расскажет о чем сразу стоит позаботится, прежде чем выпускать какой-либо продукт (даже open source) в main ветку

Читать далее

+1

Alex_panov 27 окт 2025 в 15:00

Создаём MCP‑сервер на практике

Средний

8 мин

19K

Программирование * Python * Искусственный интеллект

Туториал

MCP без воды и шаблонного кода на практике: разбираем протокол, поднимаем сервер, тестируем через Inspector и учим LLM торговать через Finam API. Разберёмся, когда MCP выгоднее «обычных функций», как изолировать интеграции и упростить отладку инструментов.

Читать далее

+6

Runoi 27 окт 2025 в 14:44

Построение E2E-решения для прогнозирования временных рядов на примере метеоданных

Средний

13 мин

8.3K

Python * Data Engineering *

Кейс

Привет, Хабр!

Четыре года назад, еще в институте, одним из моих первых серьезных проектов была простая LSTM-модель для прогноза погоды. Недавно, пересматривая старые наработки, я задался вопросом: насколько дальше можно зайти, применив накопленный за эти годы опыт и современные инженерные практики?

Эта статья — история такого "рефакторинга длиною в 4 года". Это рассказ о том, как простой академический проект был переосмыслен и превращен в полноценное End-to-End (E2E) решение. Цель — не просто снова предсказать погоду, а на практическом примере продемонстрировать системный подход к построению ML-пайплайна с нуля.

В статье рассматриваются все ключевые этапы: от разработки отказоустойчивого веб-скрапера до проведения сравнительного анализа трех разнородных моделей прогнозирования:

Читать далее

+7

enamored_poc 27 окт 2025 в 07:55

Изучаем Python: модуль pathlib для начинающих с домашним заданием

Средний

15 мин

13K

Туториал

Забудьте о ручном склеивании строк: с pathlib пути элегантно конструируются с помощью оператора /. Проверка существования, чтение, получение родительской директории — всё это становится методами и атрибутами самого объекта. В результате код получается не просто чище и читабельнее, он становится более надежным и по-настоящему "питоничным" (Pythonic).

Читать далее

+11

Trylastsky 27 окт 2025 в 07:16

Мастерское масштабирование: создаем утилиту для лупы в играх без риска для античита

Простой

5 мин

7.3K

.NET * Action Script * Python * Windows * Говнокод

Из песочницы

Сегодня мы разберемся, как создать легковесную утилиту, которая решает эту проблему элегантным и, что самое главное, безопасным с точки зрения античитов способом.

Читать далее

0

Alexandr_Yagupov 26 окт 2025 в 17:27

Простой способ держать ваш скрипт актуальным и запускать его автоматически

Простой

1 мин

11K

Обзор

Простой способ держать ваш скрипт актуальным и запускать его автоматически Создаем самосинхронизирующийся и запускающийся Python-скрипт из GitHub

-5

artur-shamseiv 26 окт 2025 в 15:29

Долгая дорога к DiT (часть 2)

Средний

20 мин

13K

Python * Машинное обучение * Искусственный интеллект

Туториал

Первая треть пути преодолена и совсем скоро мы создадим генератор картинок на целиком на архитектуре трансформеров. Но перед тем как совершить финальный скачок к Diffusion Transformers (DiT) нам сначала надо научиться работать с готовыми датасетами и освоить генерацию изображений "простым" способом - через MLP-ResNet. Статья является прямым продолжением первой части, так что советую сначала ознакомиться с ней, чтобы понимать откуда всё началось. Будет много про работу с датасетами.

И вообще статья получилась какой-то неприлично большой.

Читать далее

+11

ovchinnikovproger 26 окт 2025 в 10:30

Парсим Ozon. Собираем информацию о ценах, товарах и отзывах

23 мин

24K

Блог компании AmveraPython * Веб-разработка * Программирование * Разработка под e-commerce *

Туториал

После того как мы разобрались с парсингом Wildberries, логично двигаться дальше и освоить Ozon. Но здесь нас ждёт сюрприз. Ozon гораздо сложнее парсить из-за динамической загрузки контента и более строгих политик автоматизированного доступа.

В этой статье мы разберём, почему для Ozon нужен браузерный парсинг, как использовать Playwright для успешного парсинга и как обернём решение в Telegram-бота, который по запросу пользователя парсит товары и отправляет CSV-файл.

Читать далее

+16

enamored_poc 26 окт 2025 в 08:30

Изучаем Python: модуль json для начинающих с домашним заданием

Средний

14 мин

29K

Туториал

Если вам когда-либо приходилось передавать структурированные данные между двумя разными системами, вы наверняка сталкивались с JSON. Сегодня JSON (JavaScript Object Notation) — это общепринятый стандарт для обмена данными в интернете. Он стал настолько популярным благодаря своей простоте и эффективности.

Читать далее

+8

Runoi 25 окт 2025 в 21:41

Путь к Computer Vision: Чему меня научил простой NLP-классификатор на 5 МБ

Простой

11 мин

14K

Кейс

Ретроспектива pet-проекта, который стал полигоном для отладки, архитектуры и оптимизации перед более сложными задачами в CV.

Читать далее

+31

Kozhedub 25 окт 2025 в 17:56

Парсим и определяем тональность сообщений в Telegram

3 мин

16K

Из песочницы

Для работы использую Google Colaboratory.

Шаг 1. Получение API ID и Hash.

До начала работы с API Telegram необходимо получить собственный API ID и Hash. Это можно сделать пройдя по ссылке https://my.telegram.org/auth?to=apps, указав номер телефона привязанный к профилю, и заполнив App title и Short name. Platform - можно выбрать “Other (specify in description)”. Остальные параметры можно оставить пустыми.

После того как все шаги выполнены вы получите собственные API ID и Hash.

Важно: В Telegram в настройках конфиденциальности должна быть отключена двухэтапная аутентификация.

Шаг 2. Вход в аккаунт Telegram.

Теперь переходим в Google Colab и первым делом устанавливаем библиотеку telethon:

Читать далее

+4

ilyasch 25 окт 2025 в 16:56

Сравнение алгоритмов сортировки на Python с Pygame-визуализацией

Простой

4 мин

16K

Кейс

Когда объясняешь школьникам или студентам, как работает сортировка, графика говорит громче слов. Наверняка, в интернете полно обзоров и сравнительных анализов различных алгоритмов сортировки, но я не нашел ничего что объединяло бы самые популярные алгоритмы в одном сравнительном экстазе. Поэтому я написал визуализатор, который показывает в реальном времени, как разные алгоритмы сортируют один и тот же массив — одновременно.

Читать далее

+16

ilia1406 25 окт 2025 в 13:15

Разработка автономного речевого тренажёра для обучения иностранным языкам на основе больших языковых моделей

Простой

11 мин

13K

Python * Creative Commons * Google API * Natural Language Processing *

Из песочницы

В статье рассматриваются технические аспекты разработки речевого тренажёра GolosAI, основанного на технологиях генеративного искусственного интеллекта и использовании больших языковых моделей (Large language models). Описана необходимость создания подобных средств обучения в России в условиях ограниченного доступа к зарубежным языковым сервисам, а также обозначена актуальность проблемы формирования разговорных навыков вне языковой среды. Автором представлен алгоритм функционирования тренажёра, включающий распознавание речи, генерацию ответов, синтез голоса и анализ выполнения учебных задач. В качестве важного достоинства тренажера отмечена его мультиязычная направленность и гибкость настройки под имеющиеся компьютерные средства. Дополнительно рассматривается потенциал интеграции речевого тренажера в образовательный процесс российских вузов на основе отечественных больших языковых моделей (YandexGPT, GigaChat) для создания автономных интерактивных речевых систем обучения иностранным языкам.

+6

Alex_Polo_123 25 окт 2025 в 10:16

Оживляем ESP8266 и ESP32 за 15 минут без программистских заморочек с помощью MicroPython

20 мин

30K

Python * Умный домПрограммирование микроконтроллеров *

Из песочницы

Что, если я скажу, что для прошивки ESP8266/ESP32 не нужна Arduino IDE? Покажу, как с помощью портативных программ за 15 минут вдохнуть жизнь в ваш модуль: прошить MicroPython, помигать светодиодом и даже подключиться к Wi-Fi. Без установки гигабайтных программ и лишних телодвижений.

Прошить и оживить

+18

DataPolicyCenter 25 окт 2025 в 08:19

Как мы применили LCA, чтобы понять, кто хочет уехать с Севера, а кто — остаться

Простой

16 мин

7.3K

Из песочницы

Арктика — стратегический, но сложный регион России, где качество жизни тесно связано с климатом, логистикой и экономикой. Чтобы понять, кто из северян планирует уехать, а кто хочет остаться, в 2024 году было проведено масштабное социологическое исследование более 10 000 жителей Арктической зоны. Основная цель — выявить факторы, определяющие миграционные намерения: возраст, доход, уровень удовлетворенности, социальные связи и восприятие стабильности. Для анализа использовался латентный классовый анализ (Latent Class Analysis, LCA) — метод, позволяющий выделить скрытые группы респондентов с похожими паттернами ответов. После очистки и перекодировки данных модель StepMix выявила три устойчивых кластера: «мобильных», намеренных покинуть Север; «оседлых», предпочитающих остаться; и «неопределившихся», колеблющихся между этими полюсами. Модель показала высокую устойчивость (ARI = 1.0, энтропия ≈ 0.96), что подтверждает надежность разделения классов. Результаты демонстрируют, что за миграционными настроениями стоят не только объективные условия жизни, но и субъективные оценки стабильности и перспектив. LCA позволил увидеть эти различия, скрытые за усредненными показателями, и показать, что в арктическом обществе существует значимая группа «сомневающихся» — тех, чье решение уехать или остаться может измениться под воздействием социальных и экономических факторов.

Читать далее

-1

1 2 ...

60

61 62 ...