Все потоки

Python *

Высокоуровневый язык программирования

750,92

Рейтинг

СтатьиПостыНовостиАвторыКомпании

SanDark7 4 апр 2017 в 09:00

Митап по Apache Spark

2 мин

4.3K

Блог компании Rambler&CoScala * Python * Big Data * Машинное обучение *

27 апреля на Мансарде RAMBLER&Co пройдет первый митап, посвященный работе с Apache Spark.

Apache Spark уже успел зарекомендовать себя как один из основных фреймворков работы с большими данными и успешно применяется в таких крупных компаниях, как Amazon, Baidu, IBM, Databricks, NASA JPL и TripAdvisor. Нам известно, что и в России Spark используется во многих небольших и в некоторых крупных компаниях, причем весьма результативно.

В Rambler&Co мы уже около года используем Spark почти для всех задач департамента рекламных технологий, связанных с ETL и машинным обучением. Более того, в начале года мы успешно обновились до версии 2.1.0.

На митапе мы бы хотели поделиться нашим опытом внедрения Spark в продакшен, рассказать о проблемах, с которыми мы столкнулись, и обсудить решения, которые применили. Выяснить, какие новые и крутые фишки появились в Spark 2, и какие баги успешно мигрировали из предыдущих версий Ну и, конечно же, познакомиться с другими энтузиастами и практиками этого замечательного инструмента и сделать наше мероприятие регулярным! Приходите, будет интересно!

Читать дальше →

+3

RediHi 3 апр 2017 в 15:00

UFOCTF 2017: декомпилируем Python в задании King Arthur (PPC600)

7 мин

7.6K

CTF * Python * Информационная безопасность *

Из песочницы

Приветствую тебя хабраюзер! Недавно, закончилась ежегодная олимпиада по информационной безопасности UFO CTF 2017. В этой статье будет райтап одного задания из раздела PPC, под названием «King Arthur», за который можно было получить максимальное количество очков — 600.

Читать дальше →

+12

Arseny_Info 3 апр 2017 в 11:07

Открытый курс машинного обучения. Тема 6. Построение и отбор признаков

24 мин

205K

Блог компании Open Data ScienceData Mining * Python * Алгоритмы * Машинное обучение *

Сообщество Open Data Science приветствует участников курса!

В рамках курса мы уже познакомились с несколькими ключевыми алгоритмами машинного обучения. Однако перед тем как переходить к более навороченным алгоритмам и подходам, хочется сделать шаг в сторону и поговорить о подготовке данных для обучения модели. Известный принцип garbage in – garbage out на 100% применим к любой задаче машинного обучения; любой опытный аналитик может вспомнить примеры из практики, когда простая модель, обученная на качественно подготовленных данных, показала себя лучше хитроумного ансамбля, построенного на недостаточно чистых данных.

UPD 01.2022: С февраля 2022 г. ML-курс ODS на русском возрождается под руководством Петра Ермакова couatl. Для русскоязычной аудитории это предпочтительный вариант (c этими статьями на Хабре – в подкрепление), англоговорящим рекомендуется mlcourse.ai в режиме самостоятельного прохождения.

Читать дальше →

+49

petropavel 3 апр 2017 в 04:25

Украшаем жизнь с помощью gdb PrettyPrinting API

5 мин

7.8K

C * C++ * Python * Отладка *

Что gdb можно как-то улучшать на питоне, знает каждый, кто хоть раз заглядывал в документацию. А кто хоть раз просматривал ее по диагонали, знает про такую штуку, как «Pretty Printers» — которые вроде позволяют gdb красиво печатать разные сложные структуры. Я документацию по диагонали просматривал, хотя особо и не вникал. Но однажды, набирая в очередной раз что-то вроде (все примеры из исходников MariaDB, которые я дебажу по много раз каждый божий день, иногда исключая выходные):

(gdb) p/t table->read_set->bitmap[0] @ (table->read_set->n_bits+7)/8

Я подумал «а фигли?». И все заверте…

Читать дальше →

+16

SanDark7 31 мар 2017 в 16:07

Moscow Python Meetup №44

1 мин

1.9K

Блог компании Rambler&CoPython *

20-го апреля в 19:00 в Rambler&Co состоится 44-я встреча MoscowPython

На встрече мы услышим 3 доклада:

Сергей Сундуков (Borlas Consulting Group, Ведущий консультант). Python и исследование операций

Хочу рассказать об успешном опыте применения питона и опен-сорсных библиотек при решении реальных бизнес-задач планирования и оптимизации.

Антон Егоров (Sabaka.io, CTO). Authentication with JWT

Многие разработчики теряются, когда сталкиваются с таким, казалось бы простым, вопросом как авторизация. Все понятно, когда мы имеем дело с человеком на сайте, который вбивает свой логин и пароль. Но процедура становится в совсем другой, когда нужна аутентификация для API.

Павел Петлинский (Rambler&Co). Монады. Экспликация

В докладе мы разберемся, что за зверь такой эта «Монада», и где прекрасный чистый мир математики ломается об особенности языков программирования.

Для участия необходимо зарегистрироваться.

-3

SanDark7 31 мар 2017 в 15:54

Python Junior Meetup #2

1 мин

3.2K

Блог компании Rambler&CoPython *

13-го апреля в 19:00 cостоится встреча Python Junior Meetup #2. Это – митап для начинающих программистов на Python. Встречу организует команда Python.ru. Митап пройдёт в офисе Rambler&Co, в десяти минутах ходьбы от станции метро Тульская.

На встрече мы услышим три доклада:

Читать дальше →

0

Delael 31 мар 2017 в 14:10

Скачиваем историю переписки со всеми пользователями ВКонтакте с помощью Python

5 мин

146K

Проектирование API * Python *

Из песочницы

Для лингвистического исследования мне понадобился корпус прямой речи, порожденной одним человеком. Я решил, что для начала удобнее всего использовать собственную переписку в ВК. Это статья о том, как скачать все сообщения, которые Вы когда-либо отправляли своим друзьям, используя программу на Python и API ВКонтакте. Для работы с API будем использовать библиотеку vk.

Читать дальше →

+26

alexhouse 29 мар 2017 в 07:53

Запускаем простой блог на Wagtail CMS (Django) — часть 3, заключительная

4 мин

16K

CMS * Django * Python * Веб-разработка * Разработка под e-commerce *

Туториал

Третью часть про Wagtail CMS я решил посветить тем моментам, которые помогли мне снова полюбить Django. Благодаря большому сообществу, которое развивает эту CMS, любой найдет в ней что-то для себя.

В заключительной части будут затронуты следующие моменты:

StreamField
API + React
Разработка для e-commerce

Читать дальше →

+4

olemskoi 28 мар 2017 в 05:22

Сможет ли Питон прожевать миллион запросов в секунду?

6 мин

38K

Блог компании СлёрмOpen source * Python * Высоконагруженные системы * Программирование *

Перевод

Возможно ли с помощью Python обработать миллион запросов в секунду? До недавнего времени это было немыслимо.

Многие компании мигрируют с Python на другие языки программирования для повышения производительности и, соответственно, экономии на стоимости вычислительных ресурсов. На самом деле в этом нет необходимости. Поставленных целей можно добиться и с помощью Python.

Python-сообщество в последнее время уделяет много внимания производительности. С помощью CPython 3.6 за счет новой реализации словарей удалось повысить скорость работы интерпретатора. А благодаря новому соглашению о вызове (calling convention) и словарному кэшу CPython 3.7 должен стать еще быстрее.

Для определенного класса задач хорошо подходит PyPy с его JIT-компиляцией. Также можно использовать NumPy, в котором улучшена поддержка расширений на Си. Ожидается, что в этом году PyPy достигнет совместимости с Python 3.5.

Эти замечательные решения вдохновили меня на создание нового в той области, где Python используется очень активно: в разработке веб- и микросервисов.

Читать дальше →

+61

vradchenko 27 мар 2017 в 11:28

Открытый курс машинного обучения. Тема 5. Композиции: бэггинг, случайный лес

28 мин

315K

Блог компании Open Data SciencePython * Алгоритмы * Математика * Машинное обучение *

Пятую статью курса мы посвятим простым методам композиции: бэггингу и случайному лесу. Вы узнаете, как можно получить распределение среднего по генеральной совокупности, если у нас есть информация только о небольшой ее части; посмотрим, как с помощью композиции алгоритмов уменьшить дисперсию и таким образом улучшить точность модели; разберём, что такое случайный лес, какие его параметры нужно «подкручивать» и как найти самый важный признак. Сконцентрируемся на практике, добавив «щепотку» математики.

UPD 01.2022: С февраля 2022 г. ML-курс ODS на русском возрождается под руководством Петра Ермакова couatl. Для русскоязычной аудитории это предпочтительный вариант (c этими статьями на Хабре – в подкрепление), англоговорящим рекомендуется mlcourse.ai в режиме самостоятельного прохождения.

Видеозапись лекции по мотивам этой статьи в рамках второго запуска открытого курса (сентябрь-ноябрь 2017).

Список статей серии

Читать дальше →

+51

m0rtido 27 мар 2017 в 09:37

Варим ML Boot Camp III: Starter Kit

17 мин

15K

Спортивное программирование * Машинное обучение * Python *

Туториал

Из песочницы

16 марта закончилось соревнование по машинному обучению ML Boot Camp III. Я не настоящий сварщик, но, тем не менее, смог добиться 7го места в финальной таблице результатов. В данной статье я хотел бы поделиться тем, как начать участвовать в такого рода чемпионатах, на что стоит обратить внимание в первый раз при решении задачи, и рассказать о своем подходе.

Читать дальше →

+22

andrewnester 27 мар 2017 в 05:08

Pygest #6. Релизы, статьи, интересные проекты из мира Python [14 марта 2017 — 27 марта 2017]

2 мин

10K

Python * Программирование *

Всем привет! Это уже шестой выпуск дайджеста на Хабрахабр о новостях из мира Python. В сегодняшнем выпуске вы найдёте интересные материалы, касающиеся машинного обучения, профилирования и оптимизации Python-приложений, хороших практик при написании Python-кода и многого другого. Присылайте свои актуальные материалы, а также любые замечания и предложения, которые будут добавлены в ближайший дайджест.

А теперь к делу!

Перейти к дайджесту

+11

litvinenko1706 26 мар 2017 в 13:31

Как я SQLAlchemy удобной сделал

10 мин

58K

Open source * Python * Веб-разработка *

Из песочницы

Не секрет, что SQLAlchemy — самая популярная ORM на Python. Она позволяет писать куда более продвинутые вещи, чем большинство Active Record собратьев. Но плата за это — более сложный код, и в простых задачах вроде CRUD это напрягает.

О том, как я сделал Алхимию удобной, воспользовавшись опытом лучших Active Record ORM, читайте под катом.

Читать дальше →

+30

Eugene713 24 мар 2017 в 22:11

Соревнование mlbootcamp от mail.ru. Кратко о рецепте второго места

9 мин

11K

Python * Машинное обучение *

Добрый день, читатель! Данная статья расскажет о пути получения второго места на соревновании MLBootCamp III. Для тех, кто не в курсе — это соревнование по машинному обучению и анализу данных от Mail.Ru Group, проходило с 15 февраля по 15 марта.

В статье будет коротко про историю построения решения, немного советов про то, на чем набил шишек и благодарности.

Итак, поехали.

Читать дальше →

+32

miptgirl 23 мар 2017 в 11:01

Предсказываем будущее с помощью библиотеки Facebook Prophet

10 мин

143K

Блог компании Open Data ScienceData Mining * Python * Математика * Машинное обучение *

Прогнозирование временных рядов — это достаточно популярная аналитическая задача. Прогнозы используются, например, для понимания, сколько серверов понадобится online-сервису через год, каков будет спрос на каждый товар в гипермаркете, или для постановки целей и оценки работы команды (для этого можно построить baseline прогноз и сравнить фактическое значение с прогнозируемым).

Существует большое количество различных подходов для прогнозирования временных рядов, такие как ARIMA, ARCH, регрессионные модели, нейронные сети и т.д.

Сегодня же мы познакомимся с библиотекой для прогнозирования временных рядов Facebook Prophet (в переводе с английского, "пророк", выпущена в open-source 23-го февраля 2017 года), а также попробуем в жизненной задаче – прогнозировании числа постов на Хабрехабре.

Читать дальше →

+53

fall_out_bug 21 мар 2017 в 08:47

Использование ArcGIS API for Python в Jupyter Notebook

6 мин

21K

Блог компании ИТ-холдинг Т1Big Data * Python * Визуализация данных * Геоинформационные сервисы *

Туториал

Всем привет! Это блог компании "Техносерв". В процессе производства на проектах, которые мы выполняем, рождаются интересные технологические кейсы. Их скопилось такое количество, что мы решили начать делиться ими с миром. И да, это наша первая публикация.

Честь начать блог выпала мне, и я пишу о том, что мне близко и любимо: о геоинформационных технологиях. Я работаю в департаменте Больших Данных, где занимаюсь разработкой высоконагруженных геоинформационных систем и сервисов на базе движков для распределенных вычислений. О высоких материях мы еще поговорим, а сегодня плавно начнем погружение в ГИС.

Все чаще и чаще у аналитиков данных (или как еще их называют — Data Scientist) появляется потребность в визуализации данных на карте. Какой инструмент сейчас считается наиболее удобным для работы аналитика? Конечно же, тетрадки! До последнего времени возможностей по визуализации геоданных было не так много. Можно было делать статические растры в matplotlib, иногда можно было добавлять даже базовые карты. Интересной оказалась библиотека для работы с Leaflet, где можно открывать geojson-файлы. Сегодня же я хочу рассказать об ArcGIS API for Python от компании Esri.

Эта статья будет полезна как аналитикам, желающим изучить примеры работы с ГИС, так и картографам и ГИС-специалистам, которым интересно попробовать себя в написании кода.

Читать дальше →

+20

AloneCoder 21 мар 2017 в 08:46

Вызов функций Go из других языков

9 мин

27K

Блог компании VKPython * Go * C * Проектирование API *

Перевод

С версии 1.5 компилятор Go поддерживает несколько режимов сборки, определяемых флагом buildmode. Их ещё называют режимами исполнения Go (Go Execution Modes). С их помощью go tool может компилировать пакеты Go в нескольких форматах, включая архивы и библиотеки общего пользования Go (shared libraries), архивы и библиотеки общего пользования Си, а с версии 1.8 — и динамические плагины Go.

В статье мы рассмотрим компилирование пакетов Go в библиотеки Си. В этом режиме сборки компилятор генерирует стандартный бинарный файл объекта (shared object) (.so), передавая функции Go в качестве API в стиле Си. Мы поговорим о том, как создавать библиотеки Go, которые можно вызывать из C, Python, Ruby, Node и Java.

Весь код доступен на GitHub.

Читать дальше →

+50

PavelVainerman 20 мар 2017 в 17:35

Обзор uniset2-testsuite — небольшого велосипеда для функционального тестирования. Часть 2

23 мин

3.1K

Python * Отладка * Промышленное программирование *

В первой части был обзор возможностей. А в этой части рассмотрим, какие уже реализованы интерфейсы тестирования и как добавить свой…

Читать дальше →

+5

yorko 20 мар 2017 в 16:38

Открытый курс машинного обучения. Тема 4. Линейные модели классификации и регрессии

30 мин

624K

Блог компании Open Data SciencePython * Алгоритмы * Математика * Машинное обучение *

Всем привет!

Сегодня мы детально обсудим очень важный класс моделей машинного обучения – линейных. Ключевое отличие нашей подачи материала от аналогичной в курсах эконометрики и статистики – это акцент на практическом применении линейных моделей в реальных задачах (хотя и математики тоже будет немало).

Пример такой задачи – это соревнование Kaggle Inclass по идентификации пользователя в Интернете по его последовательности переходов по сайтам.

UPD 01.2022: С февраля 2022 г. ML-курс ODS на русском возрождается под руководством Петра Ермакова couatl. Для русскоязычной аудитории это предпочтительный вариант (c этими статьями на Хабре – в подкрепление), англоговорящим рекомендуется mlcourse.ai в режиме самостоятельного прохождения.

Все материалы доступны на GitHub.
А вот видеозапись лекции по мотивам этой статьи в рамках второго запуска открытого курса (сентябрь-ноябрь 2017). В ней, в частности, рассмотрены два бенчмарка соревнования, полученные с помощью логистической регрессии.

Читать дальше →

+47

alexhouse 20 мар 2017 в 02:33

Yapf — причесываем код Python автокорректором

2 мин

31K

Python * Проектирование и рефакторинг *

Туториал

В эпоху все большей популярности различных js и css linter'ов, не удивительно появление удобного линтера с автокоррекцией для Python.

Приветствуйте, Yapf — готовое решение, для превращения каши из строк во вполне читаемый код. И поверьте, он вам пригодится.

Читать дальше →

+14

1 2 ...

438

439 440 ...