Все потоки

Python *

Высокоуровневый язык программирования

712,56

Рейтинг

СтатьиПостыНовостиАвторыКомпании

ru_vds 14 ноя 2019 в 09:30

Как в Redash заметили и исправили проблему, вызвавшую деградацию производительности Python-кода

5 мин

5.5K

Блог компании RUVDS.comPython * Отладка * Веб-разработка *

Перевод

Недавно в Redash приступили к смене одной системы выполнения задач на другую. А именно — они начали переход с Celery на RQ. На первом этапе на новую платформу перевели лишь те задания, которые не выполняют запросы напрямую. Среди таких заданий — отправка электронных писем, выяснение того, какие запросы должны быть обновлены, запись пользовательских событий и другие вспомогательные задачи.

После развёртывания всего этого было замечено, что RQ-воркеры требуют гораздо больше вычислительных ресурсов для решения того же объёма задач, который раньше решали средствами Celery.

Материал, перевод которого мы сегодня публикуем, посвящён рассказу о том, как в Redash выяснили причину проблемы и справились с ней.

Читать дальше →

+30

pushtaev 13 ноя 2019 в 13:32

Подборка @pythonetc, октябрь 2019

3 мин

7.2K

Блог компании VKPython * Программирование *

Новая подборка советов про Python и программирование из моего авторского канала @pythonetc.

← Предыдущие подборки

Если хотите итерировать сразу несколько итерируемых объектов, то можете использовать функцию zip (не имеет никакого отношения к файловому формату ZIP):

Читать дальше →

+43

OLZ1 12 ноя 2019 в 14:16

Блиц-проверка алгоритмов машинного обучения: скорми свой набор данных библиотеке scikit-learn

21 мин

26K

Python * Машинное обучение *

Из песочницы

Глобальная паутина изо дня в день пополняется статьями о популярных, наиболее употребляемых алгоритмах машинного обучения для решения различных задач. Причём основа этих статей, немного изменённая по форме в том или ином месте, кочует от одного исследователя данных к другому. При этом все эти работы объединяет один общепринятый, непреложный постулат: применение того или иного алгоритма машинного обучения зависит от размера и природы имеющихся в распоряжении данных и поставленной задачи.

Вдобавок к этому особо настоявшиеся исследователи данных, делясь своим опытом, подчёркивают: «Выбор метода оценки должен частично зависеть от ваших данных и от того, в чём, по вашему мнению, модель должна быть хороша» («Data Science: инсайдерская информация для новичков. Включая язык R», авторы Кэти О’Нил, Рэйчел Шатт).

Читать дальше →

+11

ru_vds 12 ноя 2019 в 09:38

Использование strict-модулей в крупномасштабных Python-проектах: опыт Instagram. Часть 1

5 мин

5.3K

Блог компании RUVDS.comPython * Веб-разработка *

Перевод

Публикуем первую часть перевода очередного материала из серии, посвящённой тому, как в Instagram работают с Python. В первом материале этой серии речь шла об особенностях серверного кода Instagram, о том, что он представляет собой монолит, который часто меняется, и о том, как статические средства проверки типов помогают этим монолитом управлять. Второй материал посвящён типизации HTTP-API. Здесь речь пойдёт о подходах к решению некоторых проблем, с которыми столкнулись в Instagram, используя Python в своём проекте. Автор материала надеется на то, что опыт Instagram пригодится тем, кто может столкнуться с похожими проблемами.

Читать дальше →

+27

staskanochek 12 ноя 2019 в 09:01

Что ты такое? Как мы spoof от human отличали — да еще и победили

4 мин

3.8K

Python * ЗвукИскусственный интеллектМашинное обучение *

Недавно прошел ID R&D Voice Antispoofing Challenge, главной задачей которого было создать алгоритм, способный отличить человеческий голос (human) от синтезированной записи (spoof). Я — ML Researcher в Dasha AI и много работаю над распознаванием речи, поэтому и решил поучаствовать. Вместе с командой мы заняли первое место. Под катом я расскажу о новых крутых подходах к обработке звука, а также о сложностях и странностях, с которыми нам пришлось столкнуться.

Читать дальше →

+16

MaxRokatansky 11 ноя 2019 в 15:10

Зачем использовать python -m pip

6 мин

34K

Блог компании OTUSPython * Программирование *

Перевод

И снова здравствуйте. В преддверии старта нового потока по курсу «Machine Learning», хотим поделиться переводом статьи, которая имеет довольно косвенное отношение к ML, но наверняка будет полезна подписчикам нашего блога.

Мариатта — разработчик из Канады, спросила в Твиттере о python -m pip, попросив рассказать об этой идиоме и объяснить принцип ее работы.

Недавно я узнала, что нужно писать python -m pip вместо обычного pip install, но теперь я не могу вспомнить от кого я это услышала. Наверное, от @brettsky или @zooba. У кого-нибудь из вас есть пост в блоге, чтобы я могла поделиться им с читателями?
— Мариатта (@mariatta) 29 октября 2019 г. (https://twitter.com/mariatta/status/1189243515739561985?ref_src=twsrc%5Etfw)

Я не уверен, что именно я сказал Мариатте о python -m pip, но есть все шансы, что это был именно я, поскольку я же просил, чтобы эта инструкция для установки пакетов с помощью PyPI писалась именно так с 2016 года. Итак, эта статья должна пояснить, что такое python -m pip и почему вы должны использовать именно ее при запуске pip.

Читать дальше →

+12

uncontrollable 10 ноя 2019 в 20:50

Визуальное представление выборов в Санкт-Петербурге — магия накрутки голосов

6 мин

18K

Big Data * Data Mining * Python * Визуализация данных * Геоинформационные сервисы *

Из песочницы

Привет!

В сентябре этого (2019) года прошли выборы Губернатора Санкт-Петербурга. Все данные о голосовании находятся в открытом доступе на сайте избирательной комиссии, мы не будем ничего ломать, а просто визуализируем информацию с этого сайта www.st-petersburg.vybory.izbirkom.ru в нужном для нас виде, проведем совсем несложный анализ и определим некоторые «волшебные» закономерности.

Обычно для подобных задач я использую Google Colab. Это сервис, который позволяет запускать Jupyter Notebook'и, имея доступ к GPU (NVidia Tesla K80) бесплатно, это заметно ускорит парсинг данных и их дальнейшую обработку. Мне понадобились некоторые подготовительные работы перед импортом.

%%time 
!apt update
!apt upgrade
!apt install gdal-bin python-gdal python3-gdal 
# Install rtree - Geopandas requirment
!apt install python3-rtree 
# Install Geopandas
!pip install git+git://github.com/geopandas/geopandas.git
# Install descartes - Geopandas requirment
!pip install descartes

Далее импорты.

import requests 
from bs4 import BeautifulSoup 
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import geopandas as gpd
import xlrd

Описание используемых библиотек

requests — модуль для запроса на подключение к сайту

BeautifulSoup — модуль для парсинга html и xml документов; позволяет получить доступ напрямую к содержимому любых тегов в html

numpy — математический модуль с базовым и необходимым набором математических функций

pandas — библиотека для анализа данных

matplotlib.pyplot — модуль-набор методов построения

geopandas — модуль для построения карты выборов

xlrd — модуль для чтения табличных файлов

Настал момент собирать сами данные, парсим. Избирком позаботился о нашем времени и предоставил отчетность в таблицах, это удобно.

Читать дальше →

+43

vajrock 9 ноя 2019 в 14:43

Таймлапс собственными силами с облачного сервиса видеонаблюдения IPEYE

7 мин

9.7K

Работа с видео * ВидеотехникаPython *

Из песочницы

Недавно появилась задача ежедневно формировать таймлапс с пары камер видеонаблюдения, подключенных к IPEYE. Если вам интересно как с этим справился человек с минимальными знаниями питона или вы хотите мне указать на мои ошибки — добро пожаловать под кат…

Читать дальше →

+15

intellimath 8 ноя 2019 в 17:52

Объекты без циклических ссылок и циклической сборки мусора

4 мин

5K

Каждый экземпляр класса в CPython, созданный при помощи синтаксической конструкции class, участвует в механизме циклической сборки мусора. Это увеличивает след в памяти каждого экземпляра и может создавать проблемы с памятью в высоконагруженных системах.

Нельзя ли обойтись в случае необходимости одним базовым механизмом подсчета ссылок?

Разберем один подход, который поможет создавать классы, чьи экземпляры будут удаляться только с помощью механизма подсчета ссылок.

Читать дальше →

+18

ru_vds 7 ноя 2019 в 09:30

Типы для HTTP-API, написанных на Python: опыт Instagram

9 мин

9.2K

Блог компании RUVDS.comСоциальные сетиВеб-разработка * Python * Проектирование API *

Перевод

Сегодня мы публикуем второй материал из цикла, посвящённого использованию Python в Instagram. В прошлый раз речь шла проверке типов серверного кода Instagram. Сервер представляет собой монолит, написанный на Python. Он состоит из нескольких миллионов строк кода и имеет несколько тысяч конечных точек Django.

Эта статья посвящена тому, как в Instagram используют типы для документирования HTTP-API и для обеспечения соблюдения контрактов при работе с ними.

Читать дальше →

+29

LEGOEducation 7 ноя 2019 в 07:36

LEGO MINDSTORMS Education EV3 + MicroPython: программируем детский конструктор взрослым языком

5 мин

61K

Блог компании LEGO EducationPython * Программирование * РобототехникаУчебный процесс в IT

Привет, Хабр! Мы уже рассказывали о платформе LEGO MINDSTORMS Education EV3. Основные задачи этой платформы — обучение на практических примерах, развитие навыков STEAM и формирование инженерного мышления. В ней можно проводить лабораторные работы по изучению механики и динамики. Лабораторные стенды из кубиков LEGO и утилиты по регистрации и обработке данных делают опыты еще интереснее и нагляднее и помогают детям лучше понять физику. Например, школьники могут собрать данные о температуре плавления и с помощью приложения систематизировать их и представить в виде графика. Но это только начало: сегодня мы расскажем, как дополнить этот набор средой программирования MicroPython и использовать его для обучения робототехнике.

Читать дальше →

+22

ru_vds 6 ноя 2019 в 09:30

Статический анализ больших объёмов Python-кода: опыт Instagram. Часть 2

8 мин

7.2K

Блог компании RUVDS.comPython * Веб-разработка *

Перевод

Сегодня публикуем вторую часть перевода материала, посвящённого статическому анализу больших объёмов серверного Python-кода в Instagram.

→ Первая часть

Читать дальше →

+31

sergey-b 5 ноя 2019 в 16:43

Почему Солнце вращается вокруг Земли

9 мин

99K

АстрономияМатематика * ФизикаНаучно-популярноеPython *

В России одна известная организация под названием ВЦИОМ проводила социологическое исследование, на котором гражданам предлагали ответить на вопрос: «Согласны ли вы со следующим утверждением: Солнце вращается вокруг Земли?» Данные этого опроса многократно перепечатываются в СМИ, и на различных сетевых ресурсах в комментариях часто ссылаются на него при обсуждении различных общественно-политических проблем.

Если бы я принял участие в этом опросе, я бы, скорее всего, был среди тех 30%, кто ответил утвердительно. Ниже я постараюсь объяснить, почему.

+63

rishat_edison 5 ноя 2019 в 15:25

34 open source библиотеки Python (2019)

2 мин

62K

Блог компании EdisonOpen source * Python * Программирование * Учебный процесс в IT

Перевод

Мы просмотрели и сравнили 10 000 open source библиотек для Python и выбрали 34 самые полезные.

Мы сгруппировали эти библиотеки в 8 категорий.

Читать дальше →

+19

sobolevn 5 ноя 2019 в 12:41

9 лучших опенсорс находок за октябрь 2019

2 мин

31K

Big Data * JavaScript * Python * Веб-разработка * Разработка мобильных приложений *

Доброго ноября, дамы и господа. Подготовил для вас подборку самых интересных находок из опенсорса за октябрь 2019.

За полным списком новых полезных инструментов, статей и докладов можно обратиться в мой телеграм канал @OpensourceFindings (по ссылке зеркало, если не открывается оригинал).

В сегодняшнем выпуске.
Технологии внутри: Rust, Swift, TypeScript, JavaScript, Go, Scala, Python.
Тематика: веб и мобильная разработка, визуализация данных, инструменты разработчика, документация.

Прошлый выпуск.

Читать дальше →

+31

ru_vds 5 ноя 2019 в 09:30

Статический анализ больших объёмов Python-кода: опыт Instagram. Часть 1

6 мин

18K

Блог компании RUVDS.comPython * Веб-разработка *

Перевод

Серверный код в Instagram пишут исключительно на Python. Ну, в основном это именно так. Мы используем немного Cython, а в состав зависимостей входит немало C++-кода, с которым можно работать из Python как с C-расширениями.

Наше серверное приложение — это монолит, представляющий собой одну большую кодовую базу, состоящую из нескольких миллионов строк и включающую в себя несколько тысяч конечных точек Django (вот выступление, посвящённое использованию Django в Instagram). Всё это загружается и обслуживается как единая сущность. Из монолита выделено несколько сервисов, но в наши планы не входит сильное разделение монолита.

Наша серверная система — это монолит, который очень часто меняется. Каждый день сотни программистов делают сотни коммитов в код. Мы непрерывно разворачиваем эти изменения, делая это каждые семь минут. В результате развёртывание проекта в продакшне выполняется около ста раз за сутки. Мы стремимся к тому, чтобы между попаданием коммита в ветку master и развёртыванием соответствующего кода в продакшне проходило бы менее часа (вот выступление об этом, сделанное на PyCon 2019).

Очень сложно поддерживать эту огромную монолитную кодовую базу, делая в неё ежедневно сотни коммитов, и при этом не довести её до состояния полного хаоса. Мы хотим сделать Instagram местом, работая в котором, программисты могут быть продуктивными и способными быстро готовить к выходу новые полезные возможности системы.

Этот материал посвящён тому, как мы пользуемся линтингом и автоматическим рефакторингом для того чтобы облегчить управление кодовой базой, написанной на Python.

Если вам интересно будет опробовать некоторые идеи, упомянутые в этом материале, то знайте, что недавно мы перевели в разряд опенсорсных проект LibCST, который лежит в основе многих наших внутренних инструментов, предназначенных для линтинга и автоматического рефакторинга кода.

→ Вторая часть

Читать дальше →

+35

rishat_edison 1 ноя 2019 в 14:55

Python за месяц

6 мин

151K

Блог компании EdisonPython * Программирование * Учебный процесс в IT

Перевод

Руководство для абсолютных ~~чай~~новичков.
(Прим. пер.: это советы от автора-индуса, но вроде дельные. Дополняйте в комментах.)

Месяц — это много времени. Если тратить на обучение по 6-7 часов каждый день, то можно сделать дофига.

Цель на месяц:

Ознакомиться с основными понятиями (переменная, условие, список, цикл, функция)
Освоить на практике более 30 проблем программирования
Собрать два проекта, чтобы применить на практике новые знания
Ознакомиться хотя бы с двумя фреймворками
Начать работу с IDE (средой разработки), Github, хостингом, сервисами и т. д.

Так вы станете младшим разработчиком (джуном) Python.

Теперь план по неделям.

Читать дальше →

+13

Rikhmayer 30 окт 2019 в 10:26

Сплайны в 3d графике, максимально автоматизированный вариант

5 мин

6.1K

Python * Математика * 3D-графика *

Из песочницы

С месяц назад начал учить Python по книге Доусона и очнулся уже глубоко в процессе написания своей игры под pygame. ТЗ было таково, что наиболее перспективным показалось сделать игру с псевдо-трехмерной графикой, запихнув в спрайты сохраненные поверхности 3d-сплайнов. О последних и напишу.

Итак, имеются полигоны (проще всего работать с четырехугольниками), на которые мы хотим натянуть кубические поверхности так, чтобы они стыковались достаточно плавно — эти поверхности и есть сплайны.

Читать дальше →

+15

TyVik 30 окт 2019 в 03:36

Мета-грамматика для PEG парсера

8 мин

2K

Python * Алгоритмы * Программирование *

Перевод

На этой неделе мы делаем генератор парсеров «самостоятельным», то есть он будет генерировать свой собственный парсер.

Содержание серии статей о PEG-парсере в Python

Итак, у нас уже есть генератор парсера, часть которого является парсером грамматики. Мы могли бы назвать это мета-парсером. Мета-парсер работает аналогично сгенерированным: GrammarParser наследуется от Parser и использует тот же механизм mark() / reset() / hope(). Тем не менее, там всё это было написано вручную. Но правильно ли это?

Читать дальше →

+11

oneSmilla 29 окт 2019 в 13:13

Опыт обучения из первых рук. Яндекс.Практикум – Аналитик данных

6 мин

108K

Python * Веб-аналитика * Карьера в IT-индустрииУчебный процесс в IT

Из песочницы

Делюсь опытом обучения в Яндекс.Практикуме, для тех, кто хотел бы получить или совершенно новую специальность или перейти из смежных сфер. Я бы назвала его первой ступенью в профессии, на мой субъективный взгляд. Точно знать, с нуля, что нужно изучить сложно, ведь у каждого есть определенный багаж знаний, а этот курс многому научит, и каждый поймет для себя, знания в каких сферах нужно будет дополучить – почти во всех случаях достаточно будет бесплатных дополнительных курсов.

Читать дальше →

+10

1 2 ...

145

146 147 ...