Все потоки

Python *

Высокоуровневый язык программирования

СтатьиПостыНовостиАвторыКомпании

DominovTut 7 апр 2020 в 11:15

Тестирование производительности Python ORM методом, основанном на бенчмарке TPC-C

6 мин

5.9K

При написании приложений на Python, для работы с базами данных часто используются объектно-реляционные мапперы (ORM). Примерами ORM являются SQLALchemy, PonyORM и объектно-реляционный маппер, входящий в состав Django. При выборе ORM довольно важную роль играет её производительность.

На Хабре, да и в интернете в целом, можно найти не один тест производительности. Как пример качественного бенчмарка python ORM можно привести бенчмарк от Tortoise ORM (ссылка на репозиторий). Данный бенчмарк анализирует скорость работы шести ORM для одиннадцати различных видов SQL-запросов.

В целом бенчмарк от tortoise хорошо позволяет оценить скорость выполнения запросов при использовании разных ORM, но у такого подхода к тестированию я вижу одну проблему. ORM зачастую используют в веб приложениях, где одновременно несколько пользователей могут посылать различные запросы, но я не нашел ни одного бенчмарка, оценивающего работу ORM при таких условиях. Вследствие этого я решил написать свой бенчмарк и сравнить с помощью него PonyORM и SQLAlchemy. За основу я взял бенчмарк TPC-C.

Читать дальше →

+1

introvertingCode 7 апр 2020 в 08:36

LDA на статьях LiveJournal + визуализация

3 мин

2.4K

Natural Language Processing * Python *

Как-то раз стало интересно, какие темы выделит LDA (латентное размещение Дирихле) на материалах «Живого Журнала». Как говорится, есть интерес — нет проблем.

Для начала немного про LDA на пальцах, вдаваться в математические подробности не будем (кому интересно — почитает). Итак, LDA — является одним из наиболее распространенных алгоритмов для моделирования тем. Каждый документ (будь то статья, книга или любой другой источник текстовых данных) представляет собой смесь тем, а каждая тема представляет собой смесь слов.

Картинка взята из Википедии

Читать дальше →

-1

Hartpanzer 6 апр 2020 в 23:34

Применение библиотеки FuzzyWuzzy для нечёткого сравнения в Python. Расстояние Левенштейна (редакционное расстояние)

5 мин

88K

Python * Математика *

У него не было уверенности, что он правильно расслышал. От этого так много зависело! Но не переспрашивать же? (с) Борис Акунин. Весь мир театр.

Работая над голосовым помощником, который упоминается в предыдущей статье, понял, что просто не могу с вами не поделиться прекраснейшей библиотекой FuzzyWuzzy.

Читать дальше →

+4

OLZ1 6 апр 2020 в 14:18

Прогнозирование временных рядов с помощью рекуррентных нейронных сетей

16 мин

12K

Python * TensorFlow * Машинное обучение *

Туториал

Перевод

Удалённый режим работы на фоне всеобщей самоизоляции может привести к весьма дурным последствиям. И эмоциональное выгорание – это ещё куда ни шло: там ведь и до крыши недалеко. В этой связи, как и многие, попробовал «успокоить» себя выделением времени на другие занятия – и начал переводить наиболее интересные статьи с английского языка на русский: «Даёшь машинлёрнинг в массы!».) Нужно воздать должное: здорово отвлекает. Если у вас есть предложения как по смысловому наполнению, так и по переводу данного текста для русскоязычного читателя, присоединяйтесь к обсуждению.

Читать дальше →

+4

worksolutions 6 апр 2020 в 13:40

Подборка статей о машинном обучении: кейсы, гайды и исследования за март 2020

3 мин

5K

Python * TensorFlow * Искусственный интеллектМашинное обучение *

Кажется, что ни один пост сейчас не обходится без упоминаний коронавируса, и эта подборка не станет исключением.

Читать дальше →

+7

sobolevn 6 апр 2020 в 09:44

9 лучших опенсорс находок за март 2020

2 мин

24K

JavaScript * Python * Программирование * Веб-разработка * Софт

Доброго карантинного апреля, дамы и господа. Подготовил для вас подборку самых интересных находок из опенсорса за март 2020.

За полным списком новых полезных инструментов, статей и докладов можно обратиться в мой телеграм канал @OpensourceFindings (по ссылке зеркало, если не открывается оригинал).

В сегодняшнем выпуске.
Технологии внутри: Rust, TypeScript, JavaScript, Go, Python.
Тематика: веб разработка, тестирование, инструменты разработчика, администрирование и документирование.

Прошлый выпуск (аж ноябрь 2019!).

Читать дальше →

+41

DmitrySpb79 6 апр 2020 в 09:16

Covid-19: зачем мы сидим на карантине, и ответы на другие вопросы

7 мин

53K

Python * ЗдоровьеНаучно-популярноеСоциальные сети

Привет Хабр.

Изначально я не планировал публиковать здесь статью про коронавирус, аналитики на хабре уже более чем достаточно. Однако, читая разные местечковые форумы и соцсети, я с удивлением обнаружил сколько достаточно вредных мифов гуляет в сети, и что обычные люди, не специалисты, в это увы, верят. В итоге, после 10го ответа очередному юзеру на очередное сообщение «коронавирус не хуже гриппа», возникла идея создать FAQ на который можно просто давать ссылку, где бы понятным простым языком развенчивались наиболее популярные мифы.

КДПВ не будет, картинка с вирусом уже наверно и так всем надоела.

Статья рассчитана на широкую аудиторию, те кто всё это уже знают, могут не тратить свое время, вряд ли они найдут что-то новое. Я знаю, что многим не нравятся статьи формата «для чайников», но готов рискнуть. Тех кому интересно, приглашаю под кат. Как хабрабонус, в конце будет Python-код для желающих поэкспериментировать с графиками самостоятельно.

Читать дальше →

+77

ThomasAlva 6 апр 2020 в 07:39

Почему будущее не за Python

6 мин

37K

Блог компании EdisonПрограммирование * Высоконагруженные системы * Python * Go *

Перевод

Хотя, безусловно, этот язык программирования будет востребован ещё много лет.

Сообществу программистов понадобились десятилетия, чтобы по достоинству оценить Python. С начала 2010-х годов он переживает бум — и в итоге превосходит C++, C#, Java и JavaScript по популярности.

Но до каких пор эта тенденция будет сохраняться? Когда Python в конечном итоге будет заменён другими языками и почему это неизбежно произойдёт?

Читать дальше →

+3

Andreaskost 5 апр 2020 в 15:23

Как на Python подобрать экипировку для игрового перса

18 мин

11K

Игры и игровые консолиPython *

Из песочницы

Учимся находить лучшее для своего разбойника при помощи программирования. Также разбираемся, не водит ли нас программа «за нос».

Читать дальше →

+9

prinkov 4 апр 2020 в 15:19

ETL процесс получения данных из электронной почты в Apache Airflow

8 мин

9.5K

Python * Data Engineering *

Как бы сильно не развивались технологии, за развитием всегда тянется вереница устаревших подходов. Это может быть обусловлено плавным переходом, человеческим фактором, технологическими необходимостями или чем-то другим. В области обработки данных наиболее показательными в этой части являются источники данных. Как бы мы не мечтали от этого избавиться, но пока часть данных пересылается в мессенджерах и электронных письмах, не говоря и про более архаичные форматы. Приглашаю под кат разобрать один из вариантов для Apache Airflow, иллюстрирующий, как можно забирать данные из электронных писем.

Читать дальше →

+5

Jenyay 4 апр 2020 в 07:34

Создание Python-обвязки для библиотек, написанных на C/C++, с помощью SIP. Часть 2

24 мин

6.6K

C * C++ * Python *

Туториал

В первой части статьи мы рассмотрели основы работы с утилитой SIP, предназначенной для создания Python-обвязок (Python bindings) для библиотек, написанных на языках C и C++. Мы рассмотрели основные файлы, которые нужно создать для работы с SIP и начали рассматривать директивы и аннотации. До сих пор мы делали обвязку для простой библиотеки, написанной на языке C. В этой части мы разберемся, как делать обвязку для библиотеки на языке C++, которая содержит классы. На примере этой библиотеки мы посмотрим, какие приемы могут быть полезны при работе с объектно-ориентированной библиотекой, а заодно разберемся с новыми для нас директивами и аннотациями.

Читать дальше →

+4

Lubiviy_Alexander 3 апр 2020 в 21:00

Перспективны ли просевшие акции? Проанализируем с помощью python

4 мин

9.4K

Туториал

Проанализируем динамику акций аутсайдеров и лидеров

Недавно прочитал статью о том, что акции-аутсайдеры (те, что максимально упали в цене за месяц) индекса Мосбиржи имеют бОльшие перспективы роста, нежели в среднем по индексу.

В данном исследовании рассмотрю

динамику акций аутсайдеров и лидеров роста (период 30 дней)
Имеет ли смысл покупать на просадках и играть на понижение после значительного роста

Важно! Я буду рассматривать абсолютно каждый день по всем акциям, соответственно многие просадки будут дивидендными гэпами (идея — рассмотреть все отклонения).

Буду рассматривать акции индекса Мосбиржы (только акции с долей в индексе >0,5%), а именно:

Читать дальше →

+10

svetlogor 3 апр 2020 в 18:46

Начни зарабатывать на софте: cоздание mini-digital-business

10 мин

10K

Проектирование API * Maps API * Python * Бизнес-модели *

Сидя на freelance видел много раз задачи по сбору БД. Чаще всего просят собрать информацию о компаниях или специфические запросы на Google, Yandex картах.

Есть спрос, давайте создавать предложения, но обо всём по порядку.

Читать дальше →

0

RMavrichev 3 апр 2020 в 15:50

Самоходная платформа на МК esp8266 с micropython

5 мин

12K

Электроника для начинающихПрограммирование микроконтроллеров * Python *

Привет, Хабр!

Эта статья описывает ~~страдания начинающего~~ процесс изготовления самоходной платформы на базе МК esp8266 с micropython, управляемой через встроенный веб-сервер.

КДПВ:

Интерфейс:

+13

Jenyay 3 апр 2020 в 09:48

Создание Python-обвязки для библиотек, написанных на C/C++, с помощью SIP. Часть 1

29 мин

25K

Туториал

Иногда во время работы над проектом на языке Python возникает желание использовать библиотеку, которая написана не на Python, а, например, на C или C++. Причины для этого могут быть разные Во-первых, Python — язык замечательный, но в некоторых ситуациях недостаточно быстрый. И если вы видите, что производительность ограничена особенностями языка Python, то имеет смысл часть программы написать на другом языке (в этой статье мы будем говорить про C и C++), оформить эту часть программы в виде библиотеки, сделать Python-обвязки (Python bindings) поверх нее и использовать полученный таким образом модуль как обычную Python-библиотеку. Во-вторых, часто случается ситуация, когда вы знаете, что есть библиотека, которая решает требуемую задачу, но, к сожалению, эта библиотека написана не на Python, а на тех же C или C++. В этом случае также мы можем сделать Python-обвязку над библиотекой и пользоваться ей, не задумываясь о том, что библиотека изначально не была написана на Python.

Читать дальше →

+5

PatientZero 3 апр 2020 в 07:50

Как я сгенерировал на Python тысячу лиц для своей игры

3 мин

32K

Python * Дизайн игр * Обработка изображений * Разработка игр *

Перевод

На определённом этапе разработки своей игры я осознал, что мне нужна система диалогов с лицами-аватарами.

Поэтому я решил создать генератор лиц на основе знаменитой игры Papers, Please.

Генератор лиц Dukope (из Papers, Please)

Сбор данных

Я скачал примерно 50 портретов с pixabay.com (все изображения имеют лицензию CC и не требуют указания авторства).

Затем я вырезал фон каждого изображения в Photoshop (просто выбрал всё инструментом выделения многоугольника и нажал на Delete). В дальнейшем я планировал воспользоваться эффектом cutout , чтобы скрыть все недочёты.

Изображения с удалённым фоном

Читать дальше →

+36

Svetlyak 3 апр 2020 в 07:37

Макросы для питониста. Доклад Яндекса

8 мин

19K

Блог компании ЯндексТестирование веб-сервисов * Ненормальное программирование * Изучение языковPython *

Как можно расширить синтаксис Python и добавить в него необходимые возможности? Прошлым летом на PyCon я постарался разобрать эту тему. Из доклада можно узнать, как устроены библиотеки pytest, macropy, patterns и как они добиваются таких интересных результатов. В конце есть пример кодогенерации с помощью макросов в HyLang — Lisp-образного языка, бегущего поверх Python.

— Привет, ребята. Хочу в первую очередь поблагодарить организаторов PyCon. Я разработчик в Яндексе. Доклад будет совсем не про работу, а про экспериментальные вещи. Возможно, кого-то из вас они наведут на мысль, что в Python можно делать клевые штуки, о которых вы раньше даже не догадывались, не мыслили в эту сторону.

Читать дальше →

+17

valemak 3 апр 2020 в 02:17

Сортировка n-нарной пирамидой

8 мин

19K

Блог компании EdisonPython * Алгоритмы * Программирование * Качество кода *

Сортировку кучей (она же — пирамидальная сортировка) на Хабре уже поминали добрым словом не раз и не два, но это всегда была достаточно общеизвестная информация. Обычную бинарную кучу знают все, но ведь в теории алгоритмов также есть:

n-нарная куча; куча куч, основанная на числах Леонардо; дерамида (гибрид кучи и двоичного дерева поиска); турнирная мини-куча; зеркальная (обратная) куча; слабая куча; юнгова куча; биномиальная куча; и бог весть ещё какие кучи…

И умнейшие представители computer science в разные годы предложили свои алгоритмы сортировки с помощью этих пирамидальных структур. Кому интересно, что у них получилось — для тех начинаем небольшую серию статей, посвящённую вопросам сортировки с помощью этих структур. Мир куч многообразен — надеюсь, вам будет интересно.

+20

ph_piter 2 апр 2020 в 09:12

Машинное обучение без учителя. Отрывок из книги

7 мин

4K

Блог компании Издательский дом «Питер»Python * Искусственный интеллектПрофессиональная литература *

Привет, Хаброжители! Пока наши новинки печатаются в типографии, а офис сидит на удаленке, мы решили поделиться отрывком из книги Пола и Харви Дейтелов «Python: Искусственный интеллект, большие данные и облачные вычисления»

Практический пример: машинное обучение без учителя, часть 2 — кластеризация методом k средних

В этом разделе будет представлен, пожалуй, самый простой из алгоритмов машинного обучения без учителя — кластеризация методом k средних. Алгоритм анализирует непомеченные образцы и пытается объединить их в кластеры. Поясним, что k в «методе k средних» представляет количество кластеров, на которые предполагается разбить данные.

Читать дальше →

+4

DVoropaev 1 апр 2020 в 13:56

Альтернативная форма тернарного оператора Python

1 мин

14K

Ненормальное программирование * ГовнокодPython *

Дисклеймер: описанный в статье прием не рекомендуется к приенению. Он описан лишь для демонстрации интересной возможности языка Python

Недавно я открыл для себя альтернативу стандартной конструкции "expression_on_true if predicate else expression_on_false", которую я не встречал в справочниках:

(expression_on_false, expression_on_true)[predicate]

Как это работает

В круглых скобках объявляется кортеж из двух элементов.
В квадратных скобках вычисляется значение предиката.
Происходит обращение к кортежу по индексу 1 (если значение предиката True) или 0 (если значение предиката False)

Читать дальше →

+15

1 2 ...

338

339 340 ...