Python *

Высокоуровневый язык программирования

likeblood 14 ноя 2020 в 12:50

Как правильно и легко рассчитать прибыль на инвестиции или калькулятор ROI на Python

6 мин

Пусть у вас есть вложения активов в некую стратегию (даже если buy and hold), и вы хотите рассчитать return on investment (ROI). Если вы не производили никаких выводов или депозитов, тогда всё просто - используем школьную формулу.

Однако если в период инвестиций вы делали выводы или депозиты по счету, то нужно их учитывать, и тогда простой формулы здесь недостаточно...

Platonic 13 ноя 2020 в 16:01

Как совместить парадигму Объектно-ориентированного программирования и Python в голове новичка?

2 мин

10K

Python * Программирование * ООП *

Данная работа пригодится новичкам для осмысления Python и парадигмы объектно-ориентированного программирования, что называется в бою.

-15

Newchronik 13 ноя 2020 в 07:24

Умная нормализация данных: категориальные и порядковые данные, “парные” признаки

4 мин

15K

Data Engineering * Python * Алгоритмы * Искусственный интеллектМашинное обучение *

Эта статья внеплановая. В прошлый раз я рассматривал нюансы и проблемы различных методов нормализации данных. И только после публикации понял, что не упомянул некоторые важные детали. Кому-то они покажутся очевидными, но, по-моему, лучше сказать об этом явно.

Читать дальше →

MaxRokatansky 11 ноя 2020 в 16:01

Python API в Delta Lake — простые и надежные операции Upsert и Delete

11 мин

3.1K

Блог компании OTUSPython * Data Engineering *

Перевод

Delta Lake 0.4.0 включает Python API и преобразование Parquet в таблицу Delta Lake на месте

Мы рады объявить о релизе Delta Lake 0.4.0, в котором представлен Python API, улучшающий манипулирование и управление данными в Delta-таблицах. Ключевыми фичами этого релиза являются:

- Python API для DML и служебных операций (#89) - теперь вы можете использовать Python API для обновления(update)/удаления(delete)/слияния(merge) данных и выполнения служебных операций (а именно, vacuum и history) в таблицах Delta Lake. Они отлично подходят для создания сложных рабочих нагрузок в Python, например, операций медленно меняющихся измерений (SCD - Slowly Changing Dimension), слияния изменений данных для репликации и операций upsert из потоковых запросов. Для получения более подробной информации читайте документацию.

- Convert-to-Delta (#78) - теперь вы можете преобразовать таблицу Parquet в таблицу Delta Lake на месте без перезаписи каких-либо данных. Эта функция отлично подходит для преобразования очень больших таблиц Parquet, которые было бы довольно затратно перезаписывать в Delta-таблицу. Более того, этот процесс обратим - вы можете преобразовать таблицу Parquet в таблицу Delta Lake, поработать с ней (например, удалить или объединить) и легко преобразовать ее обратно в таблицу Parquet. Для получения более подробной информации читайте документацию.

- SQL для служебных операций - теперь вы можете использовать SQL для выполнения служебных операций vacuum и history. Смотрите документацию для получения дополнительных сведений о том, как настроить Spark для выполнения этих специфичных для Delta Lake команд SQL.

Больше информации вы можете найти в примечаниях к релизу Delta Lake 0.4.0 и в документации по Delta Lake > Удаление, обновление и слияние таблиц.

MaxRokatansky 11 ноя 2020 в 14:59

Быстрый градиентный бустинг с CatBoost

5 мин

100K

Блог компании OTUSПрограммирование * Машинное обучение * Python *

Перевод

Привет, хабровчане! Подготовили перевод статьи для будущих учеников базового курса Machine Learning.

В градиентном бустинге прогнозы делаются на основе ансамбля слабых обучающих алгоритмов. В отличие от случайного леса, который создает дерево решений для каждой выборки, в градиентном бустинге деревья создаются последовательно. Предыдущие деревья в модели не изменяются. Результаты предыдущего дерева используются для улучшения последующего. В этой статье мы подробнее познакомимся с библиотекой градиентного бустинга под названием CatBoost.

Источник

Читать дальше →

Stantin 11 ноя 2020 в 04:27

Архитектура облачного волейбольного сервиса

4 мин

2.1K

Kubernetes * Python * Машинное обучение * Облачные сервисы * Обработка изображений *

Не так давно я писал про волейбольный сервис, теперь пришло время описать его с технической точки зрения.

Возможно, общественное сознание найдет изъяны в архитектуре и подтолкнет к лучшим решениям.

Краткое описание функциональности:

пользователь загружает видео с записью волейбольной игры
один хитрый алгоритм распознает мяч на кадрах
другой хитрый алгоритм выделяет розыгрыши
розыгрыши компонуются в отдельные видеофайлы
файлы с розыгрышами собираются в дайджест всей игры
все видео заливается в облако
пользователи смотрят/качают/шарят клипы с самыми классными розыгрышами

Читать дальше →

MaxRokatansky 10 ноя 2020 в 14:23

Метаклассы в Python

4 мин

23K

Блог компании OTUSPython * Программирование *

Туториал

Перевод

Метаклассы – это такие классы, экземпляры которых сами являются классами. Подобно тому, как «обычный» класс определяет поведение экземпляров класса, метакласс определяет и поведение классов, и поведение их экземпляров.

Метаклассы поддерживаются не всеми объектно-ориентированными языками программирования. Те языки программирования, которые их поддерживают, значительно отличаются по способу их реализации. Но в Python метаклассы есть.

Некоторые программисты рассматривают метаклассы в Python как «решения, которые ждут или ищут задачу».

У метаклассов множество применений. Выделим несколько из них:

Newchronik 10 ноя 2020 в 12:01

Умная нормализация данных

8 мин

157K

Машинное обучение * Искусственный интеллектАлгоритмы * Python * Data Engineering *

Из песочницы

Эта статья появилась по нескольким причинам.

Во-первых, в подавляющем большинстве книг, интернет-ресурсов и уроков по Data Science нюансы, изъяны разных типов нормализации данных и их причины либо не рассматриваются вообще, либо упоминаются лишь мельком и без раскрытия сути.

Во-вторых, имеет место «слепое» использование, например, стандартизации для наборов с большим количеством признаков — “чтобы для всех одинаково”. Особенно у новичков (сам был таким же). На первый взгляд ничего страшного. Но при детальном рассмотрении может выясниться, что какие-то признаки были неосознанно поставлены в привилегированное положение и стали влиять на результат значительно сильнее, чем должны.

И, в-третьих, мне всегда хотелось получить универсальный метод учитывающий проблемные места.

Читать дальше →

+14

KivyMD 9 ноя 2020 в 17:33

Дополнительные компоненты для кроссплатформеннной библиотеки материального дизайна KivyMD

9 мин

6.3K

Windows * macOS * Linux * Android * Python *

Приветствую, уважаемые любители и знатоки Python!

Если вы используете в своих приложениях Python и такие кроссплатформенные инструменты как фреймворк Kivy и библиотеку материального дизайна KivyMD, тогда вам точно будет интересно эта статья, в которой я расскажу о дополнительных компонентах для расширения набора материальных виджетов библиотеки KivyMD

+14

skillfactory_school 9 ноя 2020 в 14:17

Как разобраться в дереве принятия решений и сделать его на Python

5 мин

37K

Блог компании SkillfactoryPython * Искусственный интеллектМатематика * Машинное обучение *

Туториал

Перевод

Совсем скоро, 20 ноября, у нас стартует новый поток «Математика и Machine Learning для Data Science», и в преддверии этого мы делимся с вами полезным переводом с подробным, иллюстрированным объяснением дерева решений, разъяснением энтропии дерева решений с формулами и простыми примерами, вводом понятия «информационный выигрыш», которое игнорируется большинством умозрительно-простых туториалов. Статья рассчитана на любящих математику новичков, которые хотят больше разобраться в работе дерева принятия решений. Для полной ясности взят совсем маленький набор данных. В конце статьи — ссылка на код на Github.

Приятного чтения!

+14

a-talentex 9 ноя 2020 в 08:56

Напишем и поймем Decision Tree на Python с нуля! Часть 5. Информационная энтропия

4 мин

7.8K

Python * Программирование *

Туториал

Перевод

Данная статья — пятая в серии. Ссылки на предыдущие статьи: первая, вторая, третья, четвертая

5.1 Информационная энтропия (Средний объем информации)

При создании дерева решений из данных алгоритм ID3 использует индекс, называемый информационной энтропией, чтобы определить, какой атрибут следует использовать для ветвления с наиболее эффективным распределением данных.

В начале, определимся с понятием объем информации. Интуитивно понятно, что объем данных = сложность, запутанность данных. Дерево решений собирает данные с одинаковыми значениями классов с каждого ветвления, таким образом снижая степень запутанности значений класса. Следовательно, при выборе атрибута, согласно которому лучше всего проводить ветвление, опираться стоит на то, насколько простыми стали данные после разветвления.

Читать дальше →

QtRoS 9 ноя 2020 в 07:21

Машинное обучение на помощь руководителю разработки

12 мин

3.8K

Блог компании Национальный расчетный депозитарийPython * Искусственный интеллектМашинное обучение * Программирование *

Интро

Интерес к теме машинного обучения и искусственного интеллекта неуклонно растет. Ежедневно в новостных сводках мы читаем про победу искусственного интеллекта над человеком. Как правило, описывается решение некоторой сложной задачи (челенджа). От жгучего желания воспроизвести результаты статьи во благо человечества (или своего собственного) в 99% случаев отговаривает отсутствие датасета, деталей реализации алгоритма и мощного железа (порой сотни единиц специализированных устройств для тензорных вычислений).

С другой стороны, есть много статей о решении задач машинного обучения на примере нескольких публичных затертых до дыр датасетов: MNIST, IMDB, ENRON, TITANIC. С ними ситуация обратная — все вершины уже покорены, алгоритмы известны, можно добиться рекордных цифр даже на простеньком ноутбуке. Снова мимо. Гораздо сложнее найти материал о практическим применении МО для решения повседневных задач. Данная статья, как можно догадаться, как раз из этой серии. На подробном практическом примере попробуем выяснить, можно ли собрать личного интеллектуального помощника (пусть и узкоспециализированного), сложно ли это, какие знания нужны и какие проблемы подстерегают на этом пути.

Читать дальше →

15432 8 ноя 2020 в 19:29

Windows: достучаться до железа

11 мин

61K

Информационная безопасность * Python * Реверс-инжиниринг * Windows *

Меня всегда интересовало низкоуровневое программирование – общаться напрямую с оборудованием, жонглировать регистрами, детально разбираться как что устроено... Увы, современные операционные системы максимально изолируют железо от пользователя, и просто так в физическую память или регистры устройств что-то записать нельзя. Точнее я так думал, а на самом деле оказалось, что чуть ли не каждый производитель железа так делает!

+168

sad__sabrina 8 ноя 2020 в 07:56

Формируем тренировочный сэмпл данных при distribution shift

6 мин

1.9K

Восстановление данных * Python * Data Mining * Data Engineering *

Туториал

Перевод

Дисклеймер: статья является переведенным продуктом автора Max’a Halforda. Перевод не чистый, а адаптивный. Такой, чтобы было понимание на любом рубеже знаний.

Читать дальше →

DmitrySpb79 6 ноя 2020 в 19:02

Как принять сигналы немецкого ВМФ с помощью звуковой карты, или изучаем радиосигналы сверхнизких частот

4 мин

29K

Системы связи * Программирование * Научно-популярноеАнализ и проектирование систем * Python *

Туториал

Привет, Хабр.

Тема приема и анализа сверхдлинных волн весьма интересна, но на Хабре она упоминается весьма редко. Попробуем восполнить пробел, и посмотрим как это работает.

Передатчик VLF в Японии (с) en.wikipedia.org/wiki/Very_low_frequency

Читать дальше →

+60

advertka 6 ноя 2020 в 09:18

PyCharm исполнилось 10 лет

2 мин

5.6K

Блог компании JetBrainsPython *

У PyCharm юбилей. На протяжении десяти лет наша IDE развивалась вместе с Python, отражая изменения в языке и отвечая на запросы Python-разработчиков. Все это время мы стремились сделать PyCharm максимально удобной и эффективной IDE.

PyCharm — не просто коммерческий продукт, это результат совместных усилий команды и сообщества. За эти годы пользователи внесли огромный вклад в улучшение PyCharm.

Мы гордимся проделанной работой и в честь праздника подготовили специальную страницу, на которой рассказываем о ключевых моментах из истории PyCharm и приглашаем принять участие в конкурсе.

Читать дальше →

+17

ph_piter 6 ноя 2020 в 07:39

Python. Язык, на котором просто мыслить

8 мин

11K

Блог компании Издательский дом «Питер»Программирование * МозгИстория ITPython *

Перевод

Привет, Хабр!

У нас возможен предзаказ долгожданного второго издания книги "Простой Python". Перевод первого издания вышел в 2016 году и по сей день остается в числе бестселлеров.

Поскольку мы убеждены, что Python — лучший язык программирования для начинающих, а также для работы с data science и машинным обучением, сегодня предлагаем вам перевод несколько мировоззренческого поста с сайта Dropbox, где завершил свою карьеру Гвидо ван Россум — о смысле и незаменимости языка Python.

Читать дальше →

LilHack 5 ноя 2020 в 14:02

Внедряем оплату BTC куда угодно (Python)

7 мин

52K

Криптография * Python * SQLite * GitHub * Криптовалюты

Туториал

Внедряем оплату BTC куда угодно (Python)

- генерация кошелька на основе seed фразы

- проверка баланса и транзакций

- отправка BTC на другие кошельки

- создаем телеграм бота для выполнения операций с BTC

- исходники бота (github)

saluev 5 ноя 2020 в 13:54

Делаем поиск в веб-приложении с нуля

26 мин

23K

Блог компании JoomВеб-разработка * Программирование * Поисковые технологии * Python *

Туториал

В статье «Делаем современное веб-приложение с нуля» я рассказал в общих чертах, как выглядит архитектура современных высоконагруженных веб-приложений, и собрал для демонстрации простейшую реализацию такой архитектуры на стеке из нескольких предельно популярных и простых технологий и фреймворков. Мы построили single page application с server side rendering, поддерживающее просмотр неких «карточек», набранных в Markdown, и навигацию между ними.

В этой статье я затрону чуть более сложную и интересную (как минимум мне, разработчику команды поиска) тему: полнотекстовый поиск. Мы добавим в наш контейнерный рай ноду Elasticsearch, научимся строить индекс и делать поиск по контенту, взяв в качестве тестовых данных описания пяти тысяч фильмов из TMDB 5000 Movie Dataset. Также мы научимся делать поисковые фильтры и копнём совсем немножко в сторону ранжирования.

Читать дальше →

+20

skillfactory_school 5 ноя 2020 в 13:36

21 канал на YouTube, где вы можете бесплатно изучить ИИ, машинное обучение и Data Science

5 мин

30K

Блог компании SkillfactoryData Engineering * Python * Искусственный интеллектМашинное обучение *

Перевод

Мы уже не раз делились в своем блоге полезными материалами для развития (их список можно найти в конце этого поста). Сегодня продолжаем это начинание и специально перед стартом новых потоков курсов по Data Analytics и Data Science представляем подборку YT-каналов по Data Science, искусственному интеллекту и машинному обучению, существование многих из которых неочевидно: например, представлен канал ArXiv Insights, посвящённый научным работам, и Google Cloud Platform.

Приятного чтения!

+13

1 2 ...

296 297

298

299 300 ...

488 489

Python *

Как правильно и легко рассчитать прибыль на инвестиции или калькулятор ROI на Python

Как совместить парадигму Объектно-ориентированного программирования и Python в голове новичка?

Умная нормализация данных: категориальные и порядковые данные, “парные” признаки

Python API в Delta Lake — простые и надежные операции Upsert и Delete

Быстрый градиентный бустинг с CatBoost

Архитектура облачного волейбольного сервиса

Метаклассы в Python

Умная нормализация данных

Дополнительные компоненты для кроссплатформеннной библиотеки материального дизайна KivyMD

Как разобраться в дереве принятия решений и сделать его на Python

Напишем и поймем Decision Tree на Python с нуля! Часть 5. Информационная энтропия

5.1 Информационная энтропия (Средний объем информации)

Машинное обучение на помощь руководителю разработки

Интро

Windows: достучаться до железа

Ближайшие события

Формируем тренировочный сэмпл данных при distribution shift

Как принять сигналы немецкого ВМФ с помощью звуковой карты, или изучаем радиосигналы сверхнизких частот

PyCharm исполнилось 10 лет

Python. Язык, на котором просто мыслить

Внедряем оплату BTC куда угодно (Python)

Делаем поиск в веб-приложении с нуля

21 канал на YouTube, где вы можете бесплатно изучить ИИ, машинное обучение и Data Science

Вклад авторов