Обновить
1024K+

Python *

Высокоуровневый язык программирования

718,97
Рейтинг
Сначала показывать
Порог рейтинга
Уровень сложности

Как я похоронил свой лучший проект еще на моменте его создания? История dnevniklib

Время на прочтение3 мин
Охват и читатели12K

Много кто на Хабре знает мое имя из-за моего проекта dnevniklib - Python библиотека для работы с API МЭШ (Московская Электронная Школа). На пике популярности ее скачали с PyPI 3000 раз! Данный проект являлся моей моей визитной карточкой, многие мои знакомые, которые как и я програмисты, нашли меня именно через мой Github. Да, это было круто, но потом произошло затишье... Я кинул проект в архив и он до сих пор там валяется. Но почему?

Эта статья расскажет о чем сразу стоит позаботится, прежде чем выпускать какой-либо продукт (даже open source) в main ветку

Читать далее

Создаём MCP‑сервер на практике

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели19K

MCP без воды и шаблонного кода на практике: разбираем протокол, поднимаем сервер, тестируем через Inspector и учим LLM торговать через Finam API. Разберёмся, когда MCP выгоднее «обычных функций», как изолировать интеграции и упростить отладку инструментов.

Читать далее

Построение E2E-решения для прогнозирования временных рядов на примере метеоданных

Уровень сложностиСредний
Время на прочтение13 мин
Охват и читатели8.2K

Привет, Хабр!

Четыре года назад, еще в институте, одним из моих первых серьезных проектов была простая LSTM-модель для прогноза погоды. Недавно, пересматривая старые наработки, я задался вопросом: насколько дальше можно зайти, применив накопленный за эти годы опыт и современные инженерные практики?

Эта статья — история такого "рефакторинга длиною в 4 года". Это рассказ о том, как простой академический проект был переосмыслен и превращен в полноценное End-to-End (E2E) решение. Цель — не просто снова предсказать погоду, а на практическом примере продемонстрировать системный подход к построению ML-пайплайна с нуля.

В статье рассматриваются все ключевые этапы: от разработки отказоустойчивого веб-скрапера до проведения сравнительного анализа трех разнородных моделей прогнозирования:

Читать далее

Изучаем Python: модуль pathlib для начинающих с домашним заданием

Уровень сложностиСредний
Время на прочтение15 мин
Охват и читатели13K

Забудьте о ручном склеивании строк: с pathlib пути элегантно конструируются с помощью оператора /. Проверка существования, чтение, получение родительской директории — всё это становится методами и атрибутами самого объекта. В результате код получается не просто чище и читабельнее, он становится более надежным и по-настоящему "питоничным" (Pythonic).

Читать далее

Мастерское масштабирование: создаем утилиту для лупы в играх без риска для античита

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели7.2K

Сегодня мы разберемся, как создать легковесную утилиту, которая решает эту проблему элегантным и, что самое главное, безопасным с точки зрения античитов способом.

Читать далее

Простой способ держать ваш скрипт актуальным и запускать его автоматически

Уровень сложностиПростой
Время на прочтение1 мин
Охват и читатели11K

Простой способ держать ваш скрипт актуальным и запускать его автоматически Создаем самосинхронизирующийся и запускающийся Python-скрипт из GitHub

Читать

Долгая дорога к DiT (часть 2)

Уровень сложностиСредний
Время на прочтение20 мин
Охват и читатели13K

Первая треть пути преодолена и совсем скоро мы создадим генератор картинок на целиком на архитектуре трансформеров. Но перед тем как совершить финальный скачок к Diffusion Transformers (DiT) нам сначала надо научиться работать с готовыми датасетами и освоить генерацию изображений "простым" способом - через MLP-ResNet. Статья является прямым продолжением первой части, так что советую сначала ознакомиться с ней, чтобы понимать откуда всё началось. Будет много про работу с датасетами.

И вообще статья получилась какой-то неприлично большой.

Читать далее

Парсим Ozon. Собираем информацию о ценах, товарах и отзывах

Время на прочтение23 мин
Охват и читатели23K

После того как мы разобрались с парсингом Wildberries, логично двигаться дальше и освоить Ozon. Но здесь нас ждёт сюрприз. Ozon гораздо сложнее парсить из-за динамической загрузки контента и более строгих политик автоматизированного доступа.

В этой статье мы разберём, почему для Ozon нужен браузерный парсинг, как использовать Playwright для успешного парсинга и как обернём решение в Telegram-бота, который по запросу пользователя парсит товары и отправляет CSV-файл.

Читать далее

Изучаем Python: модуль json для начинающих с домашним заданием

Уровень сложностиСредний
Время на прочтение14 мин
Охват и читатели25K

Если вам когда-либо приходилось передавать структурированные данные между двумя разными системами, вы наверняка сталкивались с JSON. Сегодня JSON (JavaScript Object Notation) — это общепринятый стандарт для обмена данными в интернете. Он стал настолько популярным благодаря своей простоте и эффективности.

Читать далее

Путь к Computer Vision: Чему меня научил простой NLP-классификатор на 5 МБ

Уровень сложностиПростой
Время на прочтение11 мин
Охват и читатели14K

Ретроспектива pet-проекта, который стал полигоном для отладки, архитектуры и оптимизации перед более сложными задачами в CV.

Читать далее

Парсим и определяем тональность сообщений в Telegram

Время на прочтение3 мин
Охват и читатели15K

Для работы использую Google Colaboratory.

Шаг 1. Получение  API ID и Hash.

До начала работы с  API Telegram необходимо получить собственный API ID и Hash. Это можно сделать пройдя по ссылке https://my.telegram.org/auth?to=apps, указав номер телефона привязанный к профилю, и заполнив App title и Short name. Platform - можно выбрать “Other (specify in description)”. Остальные параметры можно оставить пустыми.

После того как все шаги выполнены вы получите собственные API ID и Hash.

Важно: В Telegram в настройках конфиденциальности должна быть отключена двухэтапная аутентификация.

Шаг 2. Вход в аккаунт  Telegram.

Теперь переходим в  Google Colab и первым делом устанавливаем библиотеку telethon:

Читать далее

Сравнение алгоритмов сортировки на Python с Pygame-визуализацией

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели16K

Когда объясняешь школьникам или студентам, как работает сортировка, графика говорит громче слов. Наверняка, в интернете полно обзоров и сравнительных анализов различных алгоритмов сортировки, но я не нашел ничего что объединяло бы самые популярные алгоритмы в одном сравнительном экстазе. Поэтому я написал визуализатор, который показывает в реальном времени, как разные алгоритмы сортируют один и тот же массив — одновременно.

Читать далее

Разработка автономного речевого тренажёра для обучения иностранным языкам на основе больших языковых моделей

Уровень сложностиПростой
Время на прочтение11 мин
Охват и читатели13K

В статье рассматриваются технические аспекты разработки речевого тренажёра GolosAI, основанного на технологиях генеративного искусственного интеллекта и использовании больших языковых моделей (Large language models). Описана необходимость создания подобных средств обучения в России в условиях ограниченного доступа к зарубежным языковым сервисам, а также обозначена актуальность проблемы формирования разговорных навыков вне языковой среды. Автором представлен алгоритм функционирования тренажёра, включающий распознавание речи, генерацию ответов, синтез голоса и анализ выполнения учебных задач. В качестве важного достоинства тренажера отмечена его мультиязычная направленность и гибкость настройки под имеющиеся компьютерные средства. Дополнительно рассматривается потенциал интеграции речевого тренажера в образовательный процесс российских вузов на основе отечественных больших языковых моделей (YandexGPT, GigaChat) для создания автономных интерактивных речевых систем обучения иностранным языкам.

Далее

Ближайшие события

Оживляем ESP8266 и ESP32 за 15 минут без программистских заморочек с помощью MicroPython

Время на прочтение20 мин
Охват и читатели27K

Что, если я скажу, что для прошивки ESP8266/ESP32 не нужна Arduino IDE? Покажу, как с помощью портативных программ за 15 минут вдохнуть жизнь в ваш модуль: прошить MicroPython, помигать светодиодом и даже подключиться к Wi-Fi. Без установки гигабайтных программ и лишних телодвижений.

Прошить и оживить

Как мы применили LCA, чтобы понять, кто хочет уехать с Севера, а кто — остаться

Уровень сложностиПростой
Время на прочтение16 мин
Охват и читатели7.3K

Арктика — стратегический, но сложный регион России, где качество жизни тесно связано с климатом, логистикой и экономикой. Чтобы понять, кто из северян планирует уехать, а кто хочет остаться, в 2024 году было проведено масштабное социологическое исследование более 10 000 жителей Арктической зоны. Основная цель — выявить факторы, определяющие миграционные намерения: возраст, доход, уровень удовлетворенности, социальные связи и восприятие стабильности. Для анализа использовался латентный классовый анализ (Latent Class Analysis, LCA) — метод, позволяющий выделить скрытые группы респондентов с похожими паттернами ответов. После очистки и перекодировки данных модель StepMix выявила три устойчивых кластера: «мобильных», намеренных покинуть Север; «оседлых», предпочитающих остаться; и «неопределившихся», колеблющихся между этими полюсами. Модель показала высокую устойчивость (ARI = 1.0, энтропия ≈ 0.96), что подтверждает надежность разделения классов. Результаты демонстрируют, что за миграционными настроениями стоят не только объективные условия жизни, но и субъективные оценки стабильности и перспектив. LCA позволил увидеть эти различия, скрытые за усредненными показателями, и показать, что в арктическом обществе существует значимая группа «сомневающихся» — тех, чье решение уехать или остаться может измениться под воздействием социальных и экономических факторов.

Читать далее

Python через 10 лет: Гонка за производительностью или закат эпохи?

Уровень сложностиСложный
Время на прочтение12 мин
Охват и читатели15K

Python занимает лидирующие позиции в рейтингах популярности, таких как TIOBE и IEEE Spectrum, и является основным языком для самых быстрорастущих и востребованных областей: искусственного интеллекта, машинного обучения и анализа данных. Однако, несмотря на текущие успехи, технологический ландшафт меняется, и через 10 лет Python может существенно отличаться от того, каким мы его знаем сегодня. Цель этой статьи — предоставить серьезный и взвешенный прогноз его эволюции к 2035 году.

Читать далее

Собираем ANPR-систему на Python: от YOLOv8 и кастомного OCR до INT8-квантизации

Время на прочтение13 мин
Охват и читатели16K

Привет, Хабр!

Распознавание автомобильных номеров (ANPR) — задача не новая. Существует множество коммерческих решений и open-source библиотек. Но что, если стандартные инструменты не не подходят? А что, если нам нужна система, которая будет молниеносно работать на обычном CPU, без дорогих видеокарт?

Недавно я столкнулся именно с такой задачей. Вместо того чтобы просто "склеить" готовые решения, я решил пройти весь путь ML-инженера от начала до конца: от анализа данных до обучения кастомных SOTA-моделей и их финальной оптимизации. В этой статье я поделюсь всем процессом, кодом, результатами и проблемами, с которыми пришлось столкнуться.

Читать далее

ИИ-помощники для Python: как выбрать между чат-песочницей, IDE-ассистентом, агентами и open-source

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели10K

В 2025-м помощники для Python распались на 4 класса: онлайн-чаты с изолированной песочницей, IDE-плагины, автономные агенты и локальные/открытые модели. Разбираемся, что чем отличается, где уместно, сколько стоит и на что смотреть разработчикам при выборе. А так же примеры кода.

Читать далее

Ставим задачи в CRM автоматически по итогам звонков

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели7.1K

Привет, Хабр! Автоматизация рутинных действий в CRM остаётся одной из ключевых задач для кол-центров, отделов продаж и поддержки. Менеджеры берут на себя обязательства во время звонков — «пришлю предложение», «перезвоню завтра», «уточню по доставке», — но не всегда фиксируют их в системе. В результате теряются сделки и снижается качество сервиса.

В этом материале мы покажем, как на базе звонков МТС Exolve, нейросети GigaChat и CRM Битрикс24 автоматически извлекать такие договорённости с клиентами из звонков и превращать их в задачи, создавая автоматизированный сценарий.

Читать далее

Проверь себя: 10 практических задач на Python для новичков. Часть 1

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели16K

Переход от пассивного изучения синтаксиса языка программирования к его активному применению для решения практических задач является ключевым этапом в становлении любого разработчика. Освоив базовые конструкции Python, начинающий специалист неизбежно сталкивается с необходимостью закрепить теоретические знания и развить алгоритмическое мышление. Отсутствие структурированного набора задач с четко определенными условиями и тестовыми примерами может замедлить этот процесс и создать иллюзию пробелов в понимании фундаментальных концепций.

Читать далее