Python *

Высокоуровневый язык программирования

СтатьиПостыНовостиАвторыКомпании

dianteroph 23 июл в 06:16

Парсинг российских СМИ

Простой

14 мин

1.8K

Python*Data Mining*Открытые данные*Веб-аналитика*

Из песочницы

В эпоху больших языковых моделей полноценный сбор информации с сайтов все еще не самый очевидный сценарий, требующий учета многих мелких деталей, а также понимания принципов работы сайта и взаимодействия с ним. В этом случае единственный оптимальный метод сбора такой информации - это парсинг.

В данной статье мы сфокусируемся на парсинге сайтов российских СМИ, в числе которых Meduza,* как официально запрещенное в РФ и более государственно-подконтрольных RussiaToday и Коммерсанта. Разберемся какой это сделать наиболее эффективно и получим текст и метаданные статей. Как основные инструменты используем классические библиотеки в Python: requests, BeautifulSoup, Selenium.

ira-k 23 июл в 06:15

Базовый Python для аналитика данных: подборка для самостоятельного обучения

Простой

4 мин

7.7K

Блог компании Яндекс ПрактикумАнализ и проектирование систем*Учебный процесс в ITPython*

Дайджест

Привет! Это команда курса «Python для анализа данных». Собрали для вас подборку бесплатных ресурсов для изучения Python с нуля. Здесь вы найдёте как интерактивные курсы с практическими заданиями, так и теоретические материалы с подробными объяснениями.

В нашей подборке оказалось много разных курсов — каждый со своим подходом и стилем подачи материала. Разумеется, вам не нужно проходить их все: попробуйте несколько из списка и остановитесь на том, который вам больше всего подходит. Главное — начать и довести обучение до конца.

Z1at 22 июл в 16:35

Фундаментальные шаблоны проектирования на Python

Средний

12 мин

8.1K

Python*ООП*

Разбор самых фундаментальных шаблонов проектирования на языке программирования python: наблюдатель, адаптер, команда, компоновщик, декоратор, фасад, фабрика, итератор, заместитель, одиночка, состояние, шаблонный метод.

+10

SidorkinAlex 22 июл в 15:16

Зачем я написал очередной велосипед для работы с директориями (спойлер: не совсем велосипед)

Простой

3 мин

1.1K

Python*PHP*Ruby*JavaScript*Веб-разработка*

Из песочницы

Вы когда-нибудь сталкивались с плагинами, которые лезут в чужие папки, перезаписывают файлы ядра и превращают git status в ад?

Я — да. И вместо того чтобы мириться с ручным копированием, гигантскими .gitignore и вечными конфликтами, написал dmp — инструмент, который:
Отслеживает, откуда взялся каждый файл,
Автоматически разрешает конфликты (или даёт контроль),
Не ломает IDE (никаких симлинков!),
Работает с любыми языками и фреймворками.

Для кого:
— Разработчики плагинов/модулей,
— Те, кто устал от git-submodules и rsync,
— Все, кто хочет чистый workflow без монрепозитория.

AlexErf13 22 июл в 14:01

Как тестировать качество ответов RAG системы?

Средний

6 мин

2.6K

Python*Искусственный интеллект

Обзор

LLM могут принимать на вход все большее кол-во токенов, но большое количество переданных на вход токенов, включая промт, контекст и историю переписки не равно качество ответа.

В идеале на вход LLM нужно передать минимально достаточный набор данных для получения ожидаемого качественного ответа.Ин

Иными словами, если на вход LLM дан один конкретный вопрос, то есть шанс близкий к 100%, чтоб будет получен качественный ответ. И наоборот, чем больше данных (вопросов, контекста и прочего) на вход LLM вы даете, тем больше вы понижаете качества ответа.

Поэтому в каждом конкретном случае нужно найти баланс минимального кол-ва данных на вход для RAG системы. То есть нужно оптимизировать промт и контекст получаемый из векторной БД для ответа на запрос пользователя.

При этом нужно определить качество ответов, то есть определить как мерять качество в конкретной RAG системе.

Минимальными вариантом будет следующий подход к измерению качества:

По каждому документу, который есть у нас, и который мы планируем векторизировать, нужно задать два вопроса:

ph_piter 22 июл в 13:51

Книга: «RAG и генеративный ИИ. Создаем собственные RAG-пайплайны с помощью LlamaIndex, Deep Lake и Pinecon»

5 мин

2.6K

Блог компании Издательский дом «Питер»Профессиональная литература*Python*Машинное обучение*

Привет, Харборожители! Мы представляем вам новую книгу Дэниса Ротмана — «RAG и генеративный ИИ. Создаем собственные RAG-пайплайны с помощью LlamaIndex, Deep Lake и Pinecone». Это практическое руководство для тех, кто хочет освоить передовые технологии искусственного интеллекта и научиться создавать эффективные системы на основе Retrieval-Augmented Generation (RAG).

В книге описываются приемы создания эффективных больших языковых моделей, систем компьютерного зрения и генеративного ИИ, показывающих высокую производительность при относительно невысоких затратах. В ней приводится подробное исследование технологии RAG, а также подходов к проектированию мультимодальных пайплайнов ИИ и управлению ими. Связывая вывод с исходными документами, RAG повышает точность и контекстную релевантность результатов, предлагая динамический подход к управлению большими объемами информации.

+13

austnv 22 июл в 12:16

Асинхронный Telegram бот на PyTelegramBotAPI

Средний

7 мин

1.5K

Python*

Из песочницы

В сети куча туториалов по синхронным ботам и почти ничего по асинхронным. Статья нацелена на новичков в асинхронном программировании в целом и в асинхронных ботах в частности. В этой статье не будет глубокого анализа асинхронности и технических деталей реализации со сложными терминами, только суть и практические примеры.

sound_right 22 июл в 07:45

Нагрузочное тестирование на Python и Locust с запуском на CI/CD

49 мин

1.5K

Тестирование IT-систем*Тестирование веб-сервисов*Высоконагруженные системы*Python*GitHub*

Разбираемся, как организовать нагрузочное тестирование на Python с Locust — с сидинговыми сценариями, кастомными API-клиентами на HTTPX, конфигурацией через Pydantic и автоматическим запуском в GitHub Actions. Всё — на практике, с архитектурой, фреймворком и публикацией отчётов в GitHub Pages.

epavlovich29 22 июл в 07:30

AI-бот для QA-инженеров: как я сделал Telegram-ассистента для ежедневной прокачки

Простой

6 мин

4.2K

Искусственный интеллектПроектирование и рефакторинг*Будущее здесьТестирование IT-систем*Python*

Кейс

Привет! Меня зовут Евгений. Я — Full-Stack QA Engineer в Devscribed и сегодня хочу поделиться своим экспериментом — QA Mentor Bot. Это Telegram‑бот, который отправляет в телеграмм группу случайные вопросы по тестированию и сразу же генерирует на них развёрнутые ответы с помощью AI. В этой статье я расскажу, как устроен проект и с какими «подводными камнями» столкнулся в процессе разработки.

van4956 22 июл в 07:15

Как я написал покер‑бот за 4 недели, используя Cursor + GPT

Средний

22 мин

17K

Python*Математика*Искусственный интеллект

Из песочницы

Мой первый опыт публикации и рассказ о том, как я за четыре недели сделал рабочую альфа-версию покер-бота. В проекте использованы методы Монте-Карло, компьютерное зрение (YOLO), Python и инструменты вроде Cursor и Roboflow.

Текст будет полезен новичкам в машинном обучении и компьютерном зрении, тем, кто хочет понять, как связать ИИ, детекцию объектов и покерную математику в одном проекте, а также всем, кто интересуется практическим применением ИИ для создания собственных инструментов.

+27

yakvenalex 22 июл в 05:04

Как научить нейросеть работать руками: создание полноценного ИИ-агента с MCP и LangGraph за час

24 мин

6.5K

Блог компании AmveraNatural Language Processing*Искусственный интеллектPython*Программирование*

Туториал

Надоели чат‑боты, которые только болтают? Создаём настоящего ИИ‑помощника: читает файлы, ищет в сети, запоминает всё. LangGraph + MCP — пошаговый гайд для Python‑разработчиков. Меньше теории, больше работающего кода.

— Два готовых агента: классификатор вакансий + файловый помощник
— Поддержка Ollama, OpenAI, DeepSeek — выбирайте любую модель
— Асинхронная архитектура с обработкой ошибок
— Полная интеграция в Python‑проекты без no‑code конструкторов
— Код готов к продакшену: логирование, retry‑механизмы, конфигурация

От настройки окружения до рабочего агента за час.

+18

DmitriiFilippov 22 июл в 04:30

Vibe Coding: Заглянем под капот Claude Code. Часть 2

Средний

5 мин

2.3K

Python*Программирование*

Туториал

В этой статье мы рассмотрим, как запускать Claude Code с другими моделями, включая возможность использования локальных моделей.

nifnaf94 21 июл в 18:33

Операции ввода-вывода в Python

Средний

6 мин

4.3K

Python*

Туториал

Все мы пользуемся различными приложениями для разных целей. Банковские приложения для операций с денежными средствами, мессенджеры для общения. Они принимают внутрь себя команду от человека и возвращают ответ. Банальный запрос ответ, но это так кажется с первого взгляда. Эти операции называются Input Output и они является самой распространённой операцией в сети. Предлагаю сегодня разобраться как они работают.

-3

DanilKomyshev 21 июл в 13:10

Почему бы я не выбрал WebRTC? (но всё-таки выбрал)

Средний

5 мин

3.5K

Блог компании Группа АстраJavaScript*Python*ВидеоконференцсвязьБраузеры

Аналитика

Привет, Хабр! Я Данил и я разработчик проекта Termidesk Assistant. На нашем проекте мы успешно используем технологию WebRTC, а еще ее используют такие технологические гиганты, как Google Meet, Microsoft Teams, Discord и многие другие.

Хотел бы поговорить о наболевшем, а именно о тех проблемах, с которыми я успел столкнуться, но почему мы все равно остановились на этой технологии. Возможно даже страница будет расширяться теми шишками, которые на меня упали по ходу движения через этот темный лес. Если вы планируете начать проект, который передает аудио и/или видео и ищите открытую технологию для него, ну, и для тех, кто просто интересуется и изучает этот стандарт, то это статья для вас.

krakotay 21 июл в 12:42

Навайбкодил самый быстрый xlsx editor

Простой

3 мин

9.9K

Python*Rust*XML*

Кейс

Предыстория: я фрилансер, основные деньги получаю, делая инструменты для редактирования xlsx файлов. Когда работы с Excel много, часто скапливаются задачи, что можно автоматизировать, но они делаются вручную. Я и пишу программы, что получают xlsx файл и обрабатывают данные с листов в удобный вид. Всё быстро, просто, понятно (одну кнопку нажать) и удобно.

+19

polisha_kr 21 июл в 10:44

Как я разработал скрипт для загрузки данных и разгрузил ИТ-отдел

5 мин

4.3K

Блог компании КОРУС КонсалтингУправление продуктом*Python*Финансы в IT

Привет, Хабр! Кто бы мог подумать, что рутинная просьба «помоги с Excel» запустит цепочку событий, которая изменит подход к работе всего отдела и вдохновит на создание собственного ИТ-продукта?

Меня зовут Максим Бритвин, я старший консультант-разработчик в «КОРУС Консалтинг», и сегодня расскажу, как один простой скрипт вырос в инструмент, который разгрузил айтишников и дал финансистам автономность в работе с данными.

Эта статья о том, как рождаются продукты из задач, которые никто не любит делать вручную.

kosyakus 20 июл в 12:58

Сравниваю автоматизацию n8n и скрипт на Python

Простой

2 мин

12K

Python*

Мнение

На днях мне попался заказ на автоматизацию. Нужно было парсить письма из email и сравнивать тему и содержание письма с эксель файлом. В файле 3 листа и в зависимости от того, что было в сравнении с темой письма в первом листе — разный алгоритм дальнейшего сравнения.

В общем, сделать я решила автоматизацию на n8n, так как она должна была работать исключительно локально на компьютере у заказчика. И я подумала, что так будет проще разобраться. Один раз настроить в терминале логин и всё.

+18

zzzzzzerg 20 июл в 09:24

CPython — бессмертные Immortal объекты

Сложный

16 мин

5.1K

Python*Программирование*

🛸 Космотекст

Начиная с версии 3.12 Python поддерживает такой тип объектов, как бессмертные (Immortal). Бессмертными объектами являются глобальные константы, такие как None, False, True, а также некоторые другие объекты. Если вам интересно, что это за объекты, как ими становятся обычные смертные, где они используются и как повлияли на CPython — добро пожаловать.

+29

Kirs1704 19 июл в 12:16

Анатомия проекта по автоматизации на Python: как не запутаться в тестах

Простой

9 мин

5.4K

Python*

Из песочницы

Создаем с нуля профессиональный фреймворк для автоматизации API-тестов на Python. Пошаговый гайд по структуре проекта, использованию Pytest и Requests, который поможет новичкам избежать типичных ошибок и писать чистый, поддерживаемый код. От хаоса к порядку!

oneastok 19 июл в 12:00

Raspberry Pi, веб‑камера и Python — все, что нужно для создания ИИ‑тренера по фортепиано

Простой

9 мин

3.7K

Блог компании SelectelИскусственный интеллектDIY или Сделай самPython*Работа с видео*

Обзор

Перевод

Здравствуйте! Меня зовут Ада Ло́пес, я студентка первого курса факультета «Креативные технологии и ИИ» в Университете Хауэст в Кортрейке.

Этот проект — моя первая полностью самостоятельная работа по интеграции искусственного интеллекта с «железом». Фортепианный тренер на базе ИИ — интерактивный комплекс для помощи начинающим в обучении игре на фортепиано. Система предоставляет обратную связь в реальном времени и отслеживает исполнение заранее заданной мелодии.

Под катом — весь путь создания проекта. Мы пройдем от обучения ИИ-модели и создания корпуса — до построения контура обратной связи и решения проблем с потоковой передачей данных в реальном времени. Опыт получился отличным! Он был наполнен отладкой, открытиями и множеством ночных тестов.

Читать далее →

+30

3 4 ...

451 452

Python *

Парсинг российских СМИ

Базовый Python для аналитика данных: подборка для самостоятельного обучения

Фундаментальные шаблоны проектирования на Python

Зачем я написал очередной велосипед для работы с директориями (спойлер: не совсем велосипед)

Как тестировать качество ответов RAG системы?

Книга: «RAG и генеративный ИИ. Создаем собственные RAG-пайплайны с помощью LlamaIndex, Deep Lake и Pinecon»

Асинхронный Telegram бот на PyTelegramBotAPI

Нагрузочное тестирование на Python и Locust с запуском на CI/CD

AI-бот для QA-инженеров: как я сделал Telegram-ассистента для ежедневной прокачки

Как я написал покер‑бот за 4 недели, используя Cursor + GPT

Как научить нейросеть работать руками: создание полноценного ИИ-агента с MCP и LangGraph за час

Vibe Coding: Заглянем под капот Claude Code. Часть 2

Операции ввода-вывода в Python

Ближайшие события

Почему бы я не выбрал WebRTC? (но всё-таки выбрал)

Навайбкодил самый быстрый xlsx editor

Как я разработал скрипт для загрузки данных и разгрузил ИТ-отдел

Сравниваю автоматизацию n8n и скрипт на Python

CPython — бессмертные Immortal объекты

Анатомия проекта по автоматизации на Python: как не запутаться в тестах

Raspberry Pi, веб‑камера и Python — все, что нужно для создания ИИ‑тренера по фортепиано

Вклад авторов