Python *

Высокоуровневый язык программирования

612,24

Рейтинг

СтатьиПостыНовостиАвторыКомпании

maluta 10 июл 2022 в 14:14

19 способов сделать сокет-сервер на Python. Эволюционный подход. Часть 1. Введение

9 мин

47K

Windows * Linux * Разработка игр * *nix * Python *

Дабы исчерпать до дна тему сокетов в Python я решил изучить все возможные способы их использования в данном языке. Чтобы всех их можно было испытать и попробовать на зуб, были созданы 19 версий простого эхо-сервера: от примитивного использования класса socket до asyncio. Блокирующие и неблокирующие сокеты, процессы и потоки, select'ы и selector'ы, коллбеки и сопрограммы — все эти темы расположены в эволюционном порядке, чтобы один пример плавно перетекал в другой.

Отдельно разобрано появление асинхронности в Python. На примерах детально показано, как и зачем появились итераторы, из них — генераторы, сопрограммы. Ближе к концу построен учебный макет библиотеки asyncio с минимально необходимым кодом, чтобы любой (даже такой, как я) смог разобраться, как на самом деле устроена асинхронность, как там все внутри работает.

Пишу подробно, чтобы случайно чего не пропустить. Поэтому понятно должно быть всем.

+16

AKlimenkov 10 июл 2022 в 13:20

Обзор книги Аллена Б. Дауни «Think Python. Основы Python»

5 мин

22K

Блог компании BercutPython * Программирование * Профессиональная литература * Учебный процесс в IT

Обзор

Написать хороший учебник по Python сложно. Пожалуй, сложнее, чем по любому другому языку программирования. Как ни странно, из-за того, что Python — универсальный, распространённый и очень простой язык. Но Аллену Дауни, профессору компьютерных наук, это, похоже, удалось.

В книге найдётся интересное упражнение для изучения любого аспекта языка Python. Если вы изучаете обязательный в таких случаях модуль turtle, то будете рисовать с помощью черепашки не просто какие-то скучные прямоугольники, а буквы алфавита и спираль Архимеда. А ещё — почему бы нам не нарисовать один из самых знаменитых фракталов — кривую Коха? Если вы знакомитесь с понятием функции, то вместо скучных вычислений попробуйте найти решение уравнения Великой теоремы Ферма.

i_shutov 10 июл 2022 в 07:58

Круглое катить, прямоугольное тащить. А шестигранник?

6 мин

5.5K

Python * R * Визуализация данных * Программирование *

В большинстве случаев в DS предпочитают работать с прямоугольными данными и на то есть масса причин и обоснований. Очень популярна тема парсинга и развертывания вложенных json. Часто дают тестовые задания на приведение к прямоугольному виду.

Но далеко не все задачи сводятся к data.frame и не обязательно весь DS сводить к ML. Есть масса задач, оперирующих, например, с графами или их частным случаем — деревьями. Можно использовать библиотеку igraph или аналоги и не думать о деталях. А можно попробовать чуть заглянуть внутрь алгоритмов.

На примере одной задачки посмотрим на работу с деревьями с альтернативной колокольни.

Все предыдущие публикации.

Читать дальше →

ph_piter 9 июл 2022 в 07:15

Что такое выпас данных и почему он необходим?

8 мин

6.5K

Блог компании Издательский дом «Питер»Машинное обучение * Big Data * Программирование * Python *

Перевод

Когда речь идет об анализе данных, результаты хороши лишь настолько, насколько хороши данные. И даже если на вашей стороне миллионы значений данных, и вы вооружены искусственным интеллектом и машинным обучения, вы можете не использовать эти данные в полной мере (возможно, это сыграет даже во вред вашей организации).

Плохие данные приводят к принятию некачественных решений.

Поэтому вам необходимо очистить и отформатировать ваши данные – взять их под контроль, чтобы они были готовы к последующим процессам.

Вот тут-то и приходит на помощь выпас данных.

Picard 8 июл 2022 в 16:49

Как писать преобразователи данных в Sklearn

7 мин

14K

Блог компании SkillfactoryМашинное обучение * Программирование * Python *

Туториал

Перевод

Сегодня разбираемся, как создавать собственные преобразователи Sklearn, позволяющие интегрировать практически любую функцию или преобразование данных в классы конвейера Sklearn. Подробности под катом к старту флагманского курса по Data Science.

NewTechAudit 8 июл 2022 в 08:54

GAN-модели для генерации набора данных из изображений

6 мин

5.8K

Python * Программирование * Обработка изображений * Машинное обучение *

Привет, Хабр! Для машинного обучения в специфических областях очень остро стоит проблема нехватки данных для обучения. Давайте рассмотрим один из способов генерировать изображения.

ivan_bragin 8 июл 2022 в 05:17

Оптимизация сервинга нейросетей

10 мин

5.3K

Блог компании ОКData Engineering * Python *

Я работаю ML-инженером в OK и последнее время занимался оптимизацией скорости инференса нейросетей, поэтому сегодня расскажу о них. И не просто о нейросетях, а о нейросетях в продакшене.

+18

anastasiyabr 7 июл 2022 в 13:13

Методика долгосрочной оценки эффекта целевого маркетинга

7 мин

4.3K

Блог компании GlowBytePython * CRM-системы *

Из песочницы

В последние годы компании с достаточной зрелостью процессов целевого маркетинга ставят перед собой задачу оценивать эффективность не отдельных кампаний, а всех кампаний в совокупности на продолжительном отрезке времени. Это связано с тем, что сети часто пытаются максимизировать выручку и прибыль лишь на горизонте действия целевой кампании, не учитывая, что может произойти каннибализация будущей выручки. Помимо этого, при активной контактной политике некоторые компании могут отправлять сразу несколько коммуникаций на клиента в один период времени. Если не учесть это при оценке кампаний, эффект будет дублироваться. В данной статье мы, команда Retail Solution компании GlowByte, планируем раскрыть основные сложности и особенности, с которыми придется столкнуться при разработке и внедрении методики оценки CRM на основе A/B-тестирования. Результаты получены нами на проекте с одним из ведущих ритейлеров страны.

Oltrs 6 июл 2022 в 16:06

Pet-проект для обучения или как я в одиночку писал Helpdesk

6 мин

31K

Веб-разработка * Python * Django * Help Desk Software * Учебный процесс в IT

Из песочницы

Ранее, у меня уже был опыт использования Helpdesk систем, но по разным причинам они не были внедрены у нас на предприятии. Хорошая возможность научится программировать, подумал я, и преступил к написанию собственного helpdesk’a.

+10

DanyByLuckyCraft 6 июл 2022 в 11:25

Как я пагинацию на telebot делал (пагинация для telegram бота)

13 мин

25K

Python * Функциональное программирование * ХакатоныПрототипирование *

Из песочницы

История о том, как мы пагинацию для бота делали.

Разберемся с начала, что это за статья зачем она и для кого. Пришлось мне в рамках хакатона "Поколение ИТ" писать бота для телеги.

Но готового решения для пагинации, которое бы нам подходило мы не нашли. Поэтому было принято решение изобретать велосипед. Решение моих товарищей было максимально странным, брать количество записей и перебирать их в цикле от 1 до N (конца, записей), но данная идея сразу была отброшена. Поэтому предоставляю вашему вниманию наше творчество, которое мы изобрели.

IronMesh 6 июл 2022 в 00:28

Как пакетно конвертировать изображения и видео в гифки с помощью FFmpeg минуя CLI

6 мин

5.9K

Python * Qt *

Привет, земляне. Многие из вас слышали про набор библиотек FFmpeg, а некоторые его активно используют. Я из их числа, но я не поклонник взаимодействия с приложением посредством текстовых команд, поэтому я предлагаю собственное приложение с графическим интерфейсом для взаимодействия с FFmpeg. Теперь, не нужно изучать текстовый интерфейс, чтобы произвести пакетное конвертирование изображений и видео в GIF-файлы высокого качества.

Пожалуйста, подробнее

vldmrvslv 5 июл 2022 в 14:07

Введение в извлечение сущностей из текста и NER

3 мин

15K

Natural Language Processing * Python *

Туториал

Извлечение информации означает создание структурированных данных из неструктурированного текста. На практике задача может выглядеть так: нужно автоматически создать запись в календаре исходя из текста письма, как на рисунке ниже.

vldmrvslv 5 июл 2022 в 14:04

Простым языком о языковых моделях и цепи Маркова (Markov Chain)

3 мин

22K

Big Data * Data Mining * Python * Natural Language Processing *

Туториал

N-граммы

N-граммы – это статистические модели, которые предсказывают следующее слово после N-1 слов на основе вероятности их сочетания. Например, сочетание I want to в английском языке имеет высокую вероятностью, а want I to – низкую. Говоря простым языком, N-грамма – это последовательность n слов. Например, биграммы – это последовательности из двух слов (I want, want to, to, go, go to, to the…), триграммы – последовательности из трех слов (I want to, want to go, to go to…) и так далее.

Такие распределения вероятностей имеют широкое применение в машинном переводе, автоматической проверке орфографии, распознавании речи и умном вводе. Например, при распознавании речи, по сравнению с фразой eyes awe of an, последовательность I saw a van будет иметь большую вероятность. Во всех этих случаях мы подсчитываем вероятность следующего слова или последовательности слов. Такие подсчеты называются языковыми моделями.

Как же рассчитать P(w)? Например, вероятность предложения P(I, found, two, pounds, in, the, library). Для этого нам понадобится цепное правило, которое определяется так:

vllv 5 июл 2022 в 09:41

Полковнику никто не пишет. Отправка писем по SMTP после изменения политики Google. С примером на Python

2 мин

28K

Python * Google Chrome

Недавно Google изменил политику по отношению к доступу к аккаунту из неизвестных источников. Давно приходили предупреждения, но я до последнего надеялся, что обойдется и не коснется меня. Наивный.

Докатилось до меня где-то в середине июня. Однажды, смотря логи одного из моих проектов, наткнулся на ошибку авторизации при попытке отправки электронного письма.

+20

Tehnologika 5 июл 2022 в 09:25

Papers, please! Как устроены сервисы по распознаванию лиц для идентификации клиента и проверки документов

8 мин

7.3K

Искусственный интеллектМашинное обучение * Обработка изображений * Разработка мобильных приложений * Python *

В популярной в свое время игре Papers, please! игрок выполняет роль таможенника, проверяющего документы по все более усложняющимся правилам. Главная игровая механика - проверка документов на соответствие всем нормам, таким как верная дата и место выдачи, соответствие имени и фамилии человека на всех документах, срок действия визы, наличие человека в “черных” списках и тому подобное.

Игра привлекла тысячи пользователей по всему миру самобытным стилем и необычной механикой игры, однако для некоторых людей подобная игра показалась бы настоящим кошмаром, ведь в реальной жизни, на своей реальной работе они занимаются тем же самым.

skaynet4788 5 июл 2022 в 08:56

Обзор книги «Python. Экспресс-курс», отличная книга для начинающих с нуля

4 мин

15K

Python * Профессиональная литература *

Всем доброго времени суток!

Публикую обзор книги "Python. Экспресс-курс" от автора Наоми Седера.

Стоит читать? Да! Почему? Опишу в статье.

Python - хороший первый язык программирования, а это отличная книга для его изучения с нуля.

-2

viktar1 5 июл 2022 в 01:43

Как сравнивать распределения. От визуализации до статистических тестов

15 мин

79K

Блог компании SkillfactoryPython * Программирование * Математика *

Перевод

В подробном лонгриде к старту курса по анализу данных вы найдёте авторские визуализации, пояснения и комментарии об искусстве сравнивать распределения и делать выводы.

Приятного чтения!

qbertych 4 июл 2022 в 14:47

Готовим статьи для Хабра: скрипт для подтягивания адресов картинок с habrastorage

6 мин

2.9K

HabrPython * Контент и копирайтинг *

Программист пишет интересную статью. Холст, масло, ruDALL-E.

Что самое сложное в написании статьи для Хабра? Конечно же сесть и начать писать! А потом вовремя остановиться. Ну а на третьем месте — во всяком случае для меня — стоит загрузка уже готовой статьи на Хабр. Про новый редактор я тактично промолчу, а старый в принципе весьма неплох: статью в markdown можно скопировать в него почти без изменений. Но вот с добавлением картинок есть пара нюансов.

Во-первых, форматирование: markdown не поддерживает ширину-высоту-выравнивание картинок, поэтому если вам захочется красоты, то все теги придется переписать в html. А во-вторых, когда вы зальете картинки на Habrastorage (или в любое другое облако), адреса локальных картинок по всему тексту придется вручную перебивать на ссылки в облаке. Как-то вечером я дописывал статью с ~50 картинками, ужаснулся количеству предстоящей работы, и решил написать простенький скрипт для автоматизации всего этого.

Читать дальше →

+19

neoflex 4 июл 2022 в 13:03

Как быстро разрабатывать сервисы обработки данных в реальном времени с помощью PySpark Structured Streaming и Kafka

16 мин

9.7K

Блог компании NeoflexPython * Big Data *

Туториал

Данная статья обобщает базовые шаги по установке и началу работы с PySpark Structured Streaming при участии брокера сообщений Kafka. Предполагается, что читатель уже знаком с языком программирования Python и сервисом Kafka.

При помощи PySpark Structured Streaming можно быстро разрабатывать масштабируемые сервисы обработки данных в реальном времени. Такой подход позволяет в короткие сроки сделать выгодное предложение клиенту, вовремя заметить аномалию в системе или же отображать актуальные данные.

1 2 ...

251 252

253

254 255 ...

519 520

Python *

19 способов сделать сокет-сервер на Python. Эволюционный подход. Часть 1. Введение

Обзор книги Аллена Б. Дауни «Think Python. Основы Python»

Круглое катить, прямоугольное тащить. А шестигранник?

Что такое выпас данных и почему он необходим?

Как писать преобразователи данных в Sklearn

GAN-модели для генерации набора данных из изображений

Оптимизация сервинга нейросетей

Методика долгосрочной оценки эффекта целевого маркетинга

Pet-проект для обучения или как я в одиночку писал Helpdesk

Как я пагинацию на telebot делал (пагинация для telegram бота)

Как пакетно конвертировать изображения и видео в гифки с помощью FFmpeg минуя CLI

Введение в извлечение сущностей из текста и NER

Простым языком о языковых моделях и цепи Маркова (Markov Chain)

Ближайшие события

Полковнику никто не пишет. Отправка писем по SMTP после изменения политики Google. С примером на Python

Papers, please! Как устроены сервисы по распознаванию лиц для идентификации клиента и проверки документов

Обзор книги «Python. Экспресс-курс», отличная книга для начинающих с нуля

Рекомендательная система через поиск схожих изображений с помощью Resnet50

Как сравнивать распределения. От визуализации до статистических тестов

Готовим статьи для Хабра: скрипт для подтягивания адресов картинок с habrastorage

Как быстро разрабатывать сервисы обработки данных в реальном времени с помощью PySpark Structured Streaming и Kafka