10 полезных Python-библиотек для автоматизации повседневных задач / Хабр

Каждый раз, когда мы пишем «быстрый скрипт на коленке» для автоматизации рутины, мы проходим через одни и те же стадии отрицания и принятия. Сначала мы думаем: «Тут делов на пять минут, хватит и стандартной библиотеки». А через час обнаруживаем себя в дебрях документации subprocess, пытаемся вспомнить, как правильно настроить ротацию логов, или в десятый раз пишем функцию для конвертации байтов в мегабайты.

Python знаменит своим девизом «Batteries Included» (батарейки в комплекте). Но иногда стандартные батарейки слишком громоздки или требуют слишком много шаблонного кода (boilerplate) для простых задач.

Настоящая магия автоматизации не в том, чтобы написать всё с нуля, а в умении вовремя вытащить из кармана нужную микро-библиотеку. В этой статье мы не будем говорить о гигантах вроде Pandas или Django. Вместо этого мы разберем 10 компактных утилит, которые решают одну конкретную задачу, но делают это чертовски элегантно.

Мы пройдемся:

Интерфейс: Как сделать так, чтобы скрипт выглядел профессионально и понятно.
Система: Как управлять процессами и файлами без боли в пояснице.
Архитектура: Как защитить себя от ошибок и хардкода, не раздувая проект.

Часть 1. Интерфейс и визуализация: чтобы скрипты «разговаривали» с вами

Первое, что отличает «наколенный» скрипт от профессионального инструмента — это обратная связь. Если ваша автоматизация работает дольше 10 секунд, отсутствие индикации превращает ожидание в гадание на кофейной гуще: «Оно зависло или еще работает?».

1. tqdm — прогресс-бары, которые не бесят

Название происходит от арабского taqaddum (прогресс). Это, пожалуй, самый простой способ мгновенно облагородить любой цикл.

Какую боль решает: Вы запускаете обработку 10 000 изображений и понятия не имеете, когда это закончится.

Как это выглядит в коде:
Вместо обычного цикла вы просто оборачиваете итерируемый объект в tqdm().

from tqdm import tqdm
import time

# Было:
# for i in range(100):

# Стало:
for i in tqdm(range(100), desc="Обработка файлов"):
    time.sleep(0.1)  # Имитация работы

Почему это круто:

Минимальный оверхед: Библиотека почти не потребляет ресурсы.
Автоматизация: Она сама вычисляет скорость обработки (it/s) и примерное время до конца (ETA).
Вложенность: Можно делать вложенные прогресс-бары для сложных задач.

2. Rich — терминал как искусство

Если tqdm отвечает только за полоски прогресса, то Rich берет на себя вообще всё оформление в консоли. Это золотой стандарт для современных CLI-приложений на Python.

Какую боль решает: Читать «простыню» из print() в логах тяжело. Данные сливаются, структуры не видно, ошибки теряются.

Что умеет Rich:

Печатать красивые таблицы.
Подсвечивать синтаксис (JSON, Python, SQL) прямо в консоли.
Отображать прогресс-бары, которые выглядят гораздо эстетичнее, чем в tqdm.
Делать логи цветными и структурированными.

Пример кода:

from rich.console import Console
from rich.table import Table

console = Console()

table = Table(title="Отчет по автоматизации")

table.add_column("Задача", style="cyan", no_wrap=True)
table.add_column("Статус", style="magenta")
table.add_column("Время", justify="right", style="green")

table.add_row("Парсинг логов", "✅ Успешно", "1.2s")
table.add_row("Очистка кэша", "✅ Успешно", "0.05s")
table.add_row("Бэкап БД", "❌ Ошибка", "—")

console.print(table)

Результат: Вы получаете аккуратную рамку, выровненные колонки и цвета, которые работают даже в обычном системном терминале.

3. Humanize — делаем данные понятными человеку

Компьютеры любят байты и секунды. Люди любят «мегабайты» и «два часа назад». Humanize берет на себя скучную математику перевода одних единиц в другие.

Какую боль решает: Когда ваш скрипт пишет: «Осталось 14567 секунд» или «Размер файла 1073741824 байт», это заставляет мозг совершать лишнюю работу.

Пример кода:

import humanize
import datetime

# Работа с размером файлов
print(humanize.naturalsize(1024 * 1024 * 50)) 
# Вывод: 50.0 MB

# Работа со временем
delta = datetime.timedelta(seconds=3665)
print(humanize.naturaldelta(delta))
# Вывод: an hour

# Списки
print(humanize.apnumber(1))
# Вывод: one

Фишка: Библиотека поддерживает локализацию. Если вам нужно, чтобы скрипт писал «5 минут назад» вместо "5 minutes ago", humanize умеет это делать через i18n.

Часть 2. Системная автоматизация и скриптинг

Скрипты автоматизации часто называют «клеем». Они соединяют разные программы, следят за файлами и запускают задачи по расписанию. Вот как сделать этот «клей» максимально прочным.

4. sh — замена subprocess для тех, кто любит лаконичность

Стандартный модуль subprocess мощный, но его синтаксис часто кажется избыточным. Попробуйте быстро вспомнить, как пробросить pipe из одной команды в другую, не заглядывая в StackOverflow. Библиотека sh позволяет вызывать системные утилиты так, будто это обычные Python-функции.

Какую боль решает: Громоздкие конструкции вроде subprocess.run(["ls", "-l"], capture_output=True).

Пример кода:

import sh

# Просто вызываем команду как функцию
print(sh.ls("-l", "/usr/bin"))

# Можно использовать цепочки (pipes)
# Аналог: ls /etc | grep python
print(sh.grep(sh.ls("/etc"), "python"))

# Управление git
sh.git.checkout("master")
sh.git.pull()

Почему это удобно:

Динамизм: Любая команда в вашем $PATH автоматически становится доступна как функция.
Обработка ошибок: sh бросает исключения, если команда завершилась с ненулевым кодом, что избавляет от ручных проверок returncode.
Примечание: Библиотека лучше всего работает на Linux и macOS. Для Windows есть свои нюансы.

5. Watchdog — когда нужно «приглядывать» за папкой

Многие задачи автоматизации начинаются с фразы: «Как только в этой папке появится файл, сделай с ним вот это». Можно запускать бесконечный цикл и проверять список файлов каждые 5 секунд, но это неэффективно. Watchdog использует события операционной системы, чтобы реагировать мгновенно.

Какую боль решает: Постоянный опрос (polling) файловой системы на наличие изменений.

Пример сценария: Автоматическая сортировка загрузок или конвертация .png в .webp в реальном времени.

Пример кода:

from watchdog.observers import Observer
from watchdog.events import FileSystemEventHandler

class MyHandler(FileSystemEventHandler):
    def on_created(self, event):
        print(f"Обнаружен новый файл: {event.src_path}")

observer = Observer()
observer.schedule(MyHandler(), path='./my_folder', recursive=False)
observer.start()

try:
    while True:
        pass # Скрипт работает в фоне
except KeyboardInterrupt:
    observer.stop()

6. Schedule — планировщик с человеческим лицом

Если ваша задача должна запускаться «каждый понедельник в 10 утра» или «каждые 5 минут», у вас есть два пути: изучать синтаксис Crontab (который живет отдельно от кода) или использовать Schedule.

Какую боль решает: Сложность настройки периодических задач внутри скрипта. Schedule не требует настройки демонов, он работает внутри вашего Python-процесса.

Пример кода:

import schedule
import time

def job():
    print("Делаю бэкап базы данных...")

# Синтаксис, который поймет даже ваша бабушка
schedule.every(10).minutes.do(job)
schedule.every().hour.do(job)
schedule.every().day.at("10:30").do(job)
schedule.every().monday.do(job)
schedule.every().wednesday.at("13:15").do(job)

while True:
    schedule.run_pending()
    time.sleep(1)

Почему это круто:

Читаемость: Код превращается в документацию.
Легкость: Никаких тяжелых зависимостей и баз данных (в отличие от Celery или APScheduler).
Предсказуемость: Вы четко видите в коде, когда и что произойдет.

Часть 3. Работа с данными и архитектурой

Когда скрипт разрастается, на первый план выходят вопросы безопасности (не «слить» ключи в публичный репозиторий) и чистоты кода. Эти четыре библиотеки помогут вам держать проект в тонусе.

7. python-dotenv — прощай, хардкод

Внимание: никогда не добавляйте файл .env в систему контроля версий (Git). Обязательно пропишите его в .gitignore, иначе ваши секреты станут достоянием общественности

Выкладывать API-ключи, пароли от баз данных или токены прямо в коде — это классическая ошибка, которая может стоить дорого. Правильный путь — хранить их в переменных окружения. python-dotenv позволяет удобно подгружать их из локального файла .env.

Какую боль решает: Случайная публикация секретных данных на GitHub и сложность настройки окружения на разных машинах.

Пример кода:
Создаем файл .env:

API_KEY=your_secret_token_here
DB_URL=postgresql://user:password@localhost/db

И используем в Python:

import os
from dotenv import load_dotenv

load_dotenv()  # Автоматически ищет и загружает .env файл

api_key = os.getenv("API_KEY")
print(f"Ключ загружен: {api_key[:4]}...")

8. Beartype — проверка типов со скоростью света

Type Hinting в Python — штука полезная, но по умолчанию она работает только как подсказка для IDE. Если вы хотите, чтобы программа упала с ошибкой, если в функцию пришла строка вместо числа, вам нужна проверка в рантайме. И если Pydantic слишком тяжел для ��елкого скрипта, то Beartype — идеален.

Какую боль решает: Сложные баги, когда функция получает «не те» данные и ломается где-то глубоко внутри.

Почему это круто: Это «O(1) runtime type checker». Он практически не замедляет работу программы, в отличие от аналогов.

Пример кода:

from beartype import beartype

@beartype
def process_data(count: int, names: list[str]):
    print(f"Обрабатываю {count} имен")

process_data(5, ["Alice", "Bob"])  # Всё ок
process_data("5", "Alice")          # Бросит BeartypeCallHintViolationError немедленно

9. Loguru — логирование, которое приносит радость

Стандартный модуль logging в Python требует целого ритуала: создать логгер, настроить хендлер, определить форматтер, добавить фильтры... Loguru позволяет начать писать логи сразу, при этом делая их информативными и красивыми.

Какую боль решает: Нечитаемые черно-белые логи и мучительная настройка ротации (удаления старых логов).

Пример кода:

from loguru import logger

# Настройка в одну строку: пишем в файл, ротируем при достижении 500 МБ
logger.add("debug.log", rotation="500 MB", compression="zip")

logger.info("Скрипт запущен")
logger.error("Что-то пошло не так!")

@logger.catch  # Ловит любые ошибки внутри и выводит подробный traceback
def critical_function():
    return 1 / 0

critical_function()

10. IceCream — забудьте о print() при дебаге

Иногда запускать полноценный дебаггер слишком долго, и мы по старинке пишем print(data). Но потом в консоли появляется куча цифр, и непонятно, какая переменная к чему относится. IceCream (или просто ic) делает отладку через вывод максимально удобной.

Какую боль решает: Необходимость подписывать каждый принт: print(f"user_id: {user_id}").

Пример кода:

from icecream import ic

def complex_function(a, b):
    result = a + b
    ic(result)  # Выведет: ic| result: 5 (с указанием строки и файла)
    return result

data = {"id": 1, "status": "active"}
ic(data) # Выведет структуру словаря красиво

Заключение

Автоматизация — это не всегда про написание сотен строк кода. Чаще это умение выбрать правильный инструмент, который сделает сложную задачу простой.

Нужен интерфейс? Берите tqdm и Rich.
Работаете с системой? Попробуйте sh и Watchdog.
Хотите порядка в коде? Внедряйте Loguru и python-dotenv.

Эти библиотеки весят немного, но экономят колоссальное количество времени, позволяя вам сфокусироваться на логике задачи, а не на борьбе с инструментарием.

Анонсы новых статей, полезные материалы, а так же если в процессе у вас возникнут сложности, обсудить их или задать вопрос по этой статье можно в моём Telegram-сообществе. Смело заходите, если что-то пойдет не так, — постараемся разобраться вместе.