Статьи / Закладки / Профиль LazyTalent / Хабр

Дмитрий @LazyTalent

Python, DE

Профиль Статьи 1Посты Новости Комментарии 109

zueve 12 фев 2021 в 15:41

Как скомпилировать Python

10 мин

60K

Блог компании ExnessВысокая производительность*Python*Программирование*Компиляторы*

Привет, Хабр!

Я хочу рассказать об удивительном событии, о котором я узнал пару месяцев назад. Оказывается, одна популярная python-утилита уже более года распространяется в виде бинарных файлов, которые компилируются прямо из python. И речь не про банальную упаковку каким-нибудь PyInstaller-ом, а про честную Ahead-of-time компиляцию целого python-пакета. Если вы удивлены так же как и я, добро пожаловать под кат.

+30

Picard 12 фев 2021 в 13:13

Анализ качества сна с машинным обучением, Python и SQL

7 мин

4.6K

Блог компании SkillfactoryPython*SQL*ГаджетыЗдоровье

Перевод

Последние примерно 2 месяца я ношу кольцо Oura, чтобы получать информацию о моём сне и о том, сколько я прошла шагов за день. Приложение считывает сон, разбитый на фазы (лёгкий, глубокий, быстрый), и даёт вам другие показатели, такие как частота сердечных сокращений, температура тела и частота дыхания. И для такого ботаника, как я, радостно было обнаружить, что у Oura есть API экспорта данных, чтобы я смогла лучше проанализировать их. Я загрузила данные в BigQuery и воспользовалась функцией CORR() (она потрясающая!), чтобы увидеть, какие показатели коррелируют с улучшением качества сна, а также визуализировала некоторые данные в Data Studio. Если у вас мало времени, переходите к разделу «Заключение», чтобы прочитать о том, что я узнала.

Дисклеймер: я не врач. Как раз наоборот: я ипохондрик, которому нравится писать на Python и SQL.

Приятного чтения!

+10

MaxRokatansky 12 фев 2021 в 14:49

Генерация текста с помощью GPT2 и PyTorch

5 мин

18K

Блог компании OTUSPython*Машинное обучение*Искусственный интеллект

Перевод

Генерация текста — одна из самых захватывающих прикладных задач обработки естественного языка (Natural Language Processing - NLP) за последние годы. Большинство из нас, вероятно, слышали о GPT-3, мощной языковой модели, которая может генерировать тексты, близкие к написанным человеком. Однако такие модели чрезвычайно трудно обучать из-за их большого размера, поэтому предварительно обученные модели обычно предпочтительнее там, где это приемлемо.

В этой статье мы научим вас генерировать текст с помощью предварительно обученного GPT-2 — более легкого предшественника GPT-3. Мы будем использовать именитую библиотеку Transformers, разработанную Huggingface. Если вы хотите узнать, как настроить GPT-2 на своем собственном наборе данных для генерации текста в конкретной предметной области, вы можете прочитать мою предыдущую статью: Настройка GPT2 для генерации текста с помощью Pytorch

Если предварительно обученной GPT-2 для ваших целей будет достаточно, то вы попали как раз туда, куда нужно! Без лишних отлагательств, приступим туториалу.

Picard 11 фев 2021 в 15:21

Как скопировать стиль Уорхола с помощью нейросети VGG-19, трансферного обучения и TensorFlow

6 мин

Блог компании SkillfactoryPython*Искусственный интеллектМашинное обучение*Обработка изображений*

Туториал

Перевод

То что мы сделаем ещё называется Нейронный перенос стиля – это метод смешивания двух изображений и создания нового изображения из изображения-контента путём копирования стиля другого изображения, которое называется изображением стиля. Созданное изображение часто называют стилизованным изображением.

В этой статье мы скопируем стиль Энди Уорхола с «Мэрилин Диптих» на наши фотографии. Уорхол создал диптих Монро в 1962 году, сначала раскрасив холст разными цветами, а затем разместив теперь знаменитое изображение Мэрилин поверх холста. Хотя Уорхол не является основателем поп-арта, он – одна из самых влиятельных фигур в этом жанре.

Начнем творить!

NewTechAudit 10 фев 2021 в 12:12

Распознавание символов

9 мин

8.1K

Python*Программирование**nix*Машинное обучение*

Работа с изображениями — одна из самых распространенных задач в машинном обучении. Мы покажем пример обработки изображения, получение матриц (тензоров) чисел, подготовку данных обучающего множества, пример архитектуры нейронной сети.

Работа с изображениями является одной из самых распространенных задач в машинном обучении. Обычная картинка, воспринимаемая человеком однозначно, для компьютера не имеет никакого смысла и интерпретации, только если нет предварительно обученной нейронной сети, которая способна отнести изображение к одному определенному классу. Для работы такой нейронной сети необходимо ее обучение на тренировочных данных, изображениях предварительно обработанных и поданных на вход нейронной сети в виде матрицы чисел, характеризующих определенный тон (цвет) на определенной позиции в изображении. В этой статье приводится пример обработки изображения, получение матриц (тензоров) чисел, подготовка данных обучающего множества, пример архитектуры нейронной сети.

Постановка задачи: имеются цветные изображения букв и цифр (CAPTCHA). Необходимо распознать буквы и цифры, находящиеся на изображениях. Последовательность решения задачи:

— анализ изображений;

— подготовка данных;

— генерация данных;

— тренировка нейронной сети, предсказание ответов.

honyaki 3 фев 2021 в 19:06

Как создавать красивые карты с помощью Python

4 мин

24K

Блог компании SkillfactoryOpenStreetMap*Python*Визуализация данных*

Туториал

Перевод

Мне всегда нравились карты городов, и несколько недель назад я решил создать свою собственную, художественную версию. Немного погуглив, я обнаружил крутое руководство, написанное Фрэнком Себальосом. Оно увлекательно и полезно, но я предпочитаю более подробные/реалистичные карты-схемы. Из-за этого я решил создать свою собственную версию карт. Итак, давайте посмотрим, как мы можем создавать красивые карты с помощью Python и данных OpenStreetMap.

Приятного чтения!

+21

MaxRokatansky 2 фев 2021 в 00:41

Самая лучшая практика: работа с path в Python

3 мин

25K

Блог компании OTUSPython*Программирование*

Перевод

В последней статье мы использовали рекурсивную функцию размером менее 10 строк для решения проблемы сканирования папок и ранжирования файлов по дате изменения и размеру.

Теперь я подниму планку и покажу, как можно было сделать лучше.

qrdl 31 янв 2021 в 14:26

FizzBuzz по-сениорски

7 мин

118K

Высокая производительность*Ненормальное программирование*C*

Из песочницы

Технотекст 2021

- Добрый день, я на интервью на позицию старшего разработчика.

- Здравствуйте, давайте начнем с небольшого теста, пока я ваше CV смотрю. Напишите программу, которая выводила бы числа от 1 до, скажем, миллиарда, притом если число кратно трем, то вместо числа выводится Fizz, если кратно пяти, то Buzz, а если и трем, и пяти, то FizzBuzz.

Серьезно, FizzBuzz? Задачка для начальной школы, на сениорскую позицию? Ну ладно.

+369

306

Rekken 23 янв 2021 в 10:14

Хранение данных в Docker

7 мин

101K

Блог компании СлёрмСерверное администрирование*Виртуализация*DevOps*Системное администрирование*

Важная характеристика Docker-контейнеров — эфемерность. В любой момент контейнер может рестартовать: завершиться и вновь запуститься из образа. При этом все накопленные в нём данные будут потеряны. Но как в таком случае запускать в Docker приложения, которые должны сохранять информацию о своём состоянии? Для этого есть несколько инструментов.

В этой статье рассмотрим docker volumes, bind mount и tmpfs, дадим советы по их использованию, проведём небольшую практику.

Читать дальше →

+15

Picard 22 янв 2021 в 13:13

Разрабатываем и развёртываем собственную платформу ИИ с Python и Django

11 мин

24K

Блог компании SkillfactoryPython*Алгоритмы*Искусственный интеллектМашинное обучение*

Перевод

Взлёт искусственного интеллекта привёл к популярности платформ машинного обучения MLaaS. Если ваша компания не собирается строить фреймворк и развёртывать свои собственные модели, есть шанс, что она использует некоторые платформы MLaaS, например H2O или KNIME. Многие исследователи данных, которые хотят сэкономить время, пользуются этими инструментами, чтобы быстро прототипировать и тестировать модели, а позже решают, будут ли их модели работать дальше.

Но не бойтесь всей этой инфраструктуры; чтобы понять эту статью, достаточно минимума знаний языка Python и фреймворка Django. Специально к старту нового потока курса по машинному обучению в этом посте покажем, как быстро создать собственную платформу ML, способную запускать самые популярные алгоритмы на лету.

Портрет Орнеллы Мути Джозефа Айерле (фрагмент), рассчитанный с помощью технологии искусственного интеллекта.

Приятного чтения!

+19

ru_vds 16 янв 2021 в 16:10

8 бесплатных инструментов для создания интерактивных визуализаций данных без необходимости написания кода

8 мин

84K

Блог компании RUVDS.comАдминистрирование баз данных*Веб-разработка*

Перевод

Когда тот, кто работает в сфере Data Science, собирается показать результаты своей деятельности другим людям, оказывается, что таблиц и отчётов, полных текстов, недостаточно для того чтобы представить всё наглядно и понятно. Именно в таких ситуациях возникает нужда в визуализации данных, в такой их обработке, которая позволит всем желающим в них разобраться и ухватить суть тех сложных процессов, которые они описывают.

В этом материале я расскажу о лучших бесплатных инструментах, позволяющих без особых сложностей создавать впечатляющие визуальные представления данных. При этом тут я не буду говорить о сложных системах вроде Power BI и Google Studio. Я выбрал те 8 инструментов, о которых пойдёт речь, из-за того, что ими легко пользоваться, из-за их приятного внешнего вида, из-за того, что работать с ними можно, не написав ни единой строчки программного кода и из-за того, что они бесплатны. Кроме того, они позволяют создавать интерактивные визуализации. А это значит, что графики, представляющие некие данные, могут содержать в себе больше сведений об этих данных, чем обычные изображения. Да и работать с такими графиками интереснее.

Так как инструменты для визуализации данных то появляются, то исчезают, я включил в этот материал только те из них, которые, вероятнее всего, ещё долго будут пребывать в добром здравии. А это значит, что вполне разумным шагом будет вложение некоторого времени в их изучение. Как уже было сказано, пользоваться этими инструментам можно без написания кода. Но если вас интересует визуализация данных именно через код — взгляните на этот материал.

Читать дальше →

+35

Anonerror 19 янв 2021 в 11:26

Настройка аутентификации JWT в новом проекте Django

28 мин

99K

Python*Django*

Из песочницы

Данная статья является сборкой-компиляцией нескольких (основано на первой) статей, как результат моих изучений по теме jwt аутентификации в джанге со всем вытекающим. Так и не удалось (по крайней мере в рунете) найти нормальную статью, в которой рассказывается от этапа создания проекта, startproject, прикручивание jwt аутентификации.

+10

DmitrySpb79 12 янв 2021 в 00:27

Стилометрия, или как отличить Акунина от Булгакова с помощью 50 строк кода?

7 мин

11K

Python*Программирование*Визуализация данных*Научно-популярноеNatural Language Processing*

Туториал

Привет, Хабр.

Довольно интересным направлением "прикладной статистики" и NLP (Natural Languages Processing а вовсе не то что многие сейчас подумали) является анализ текстов. Интересно, что появилось это направление задолго до первых компьютеров, и имело вполне практическую цель: определить автора того или иного текста. С помощью ПК это, впрочем, гораздо легче и удобнее, да и результаты получаются весьма интересные. Посмотрим, какие закономерности можно выявить с помощью совсем простого кода на Python.

Для тех кому интересно, продолжение под катом.

+18

cyberauthor 6 янв 2021 в 12:12

Визуализация пересечений и перекрытий с помощью Python

6 мин

12K

Блог компании SkillfactoryBig Data*Python*Визуализация данных*Открытые данные*

Перевод

Изучение вариантов решения одной из самых сложных задач визуализации данных

Преобладающая задача в любом анализе данных — сравнение нескольких наборов чего-либо. Это могут быть списки IP-адресов для каждой целевой страницы вашего сайта, клиенты, которые купили определённые товары в вашем магазине, несколько ответов из опроса и многое другое.

В этой статье воспользуемся Python для изучения способов визуализации перекрытий и пересечений множеств, наших возможностей, а также их преимуществ и недостатков.

Диаграмма Венна

Приятного чтения!

+28

ruvds 6 янв 2021 в 16:56

Самые упоротые и забавные расширения для браузера: подборка

5 мин

23K

Блог компании RUVDS.comРасширения для браузеровБраузерыGoogle ChromeFirefox

Иногда разработчики “Желают странного” (С) А. Б. Стругацкие, из-за этого появляются необычные проекты, вроде запуска Doom на терминалах для считывания банковских карт и других, еще менее приспособленных для этого, девайсах. Чаще всего такое получается в результате тренировок, когда программист осваивает новую тему и реализует тестовый проект не в виде традиционного “Hello, Word!”, а чего-то более изощренного. Но ведь не все занимаются портированием древних шутеров на смарт-часы, есть и другие области разработки, более прикладные, но не менее интересные. Предположим, что человеку наскучило смотреть на длинные логи в консоли и grep’ать из них данные для отладки, хочется добавить интерактива и наглядности в свое обучение. Инструменты для этого выбираются самые разные, кто-то пользуется обычным графическим выводом, кто-то выводит данные через простенький сайт, а кто-то… пишет расширения для браузера!

В этой статье я расскажу вам о нескольких не самых практичных (хотя о практичных — тоже расскажу), но необычных расширениях. Они вряд ли войдут в подборку типа: “Топ-10 самых полезных расширений для разработчика” или пригодятся для розыгрыша коллег, но заставят озадаченно почесать затылок: “Ну и фантазия у автора!..” или просто улыбнуться.

Читать дальше →

+39

avdosev 6 янв 2021 в 21:52

Генерация дефолтных Github аватарок

2 мин

19K

Работа с иконками*Python*GitHub*

Туториал

В данной статье я покажу и расскажу, как можно сгенерировать аватарки как на Github.

+28

derprimus 26 окт 2020 в 14:59

Принципиально новый метод позволяет тренировать ИИ практически без данных

5 мин

15K

Блог компании MadrobotsИскусственный интеллектМашинное обучение*

Перевод

Мифический носорогоединорог. MS TECH / PIXABAY

Обучение «менее чем с одной» попытки помогает модели идентифицировать больше объектов, чем количество примеров, на которых она тренировалась.

Как правило, машинное обучение требует множества примеров. Чтобы ИИ-модель научилась распознавать лошадь, вам потребуется показать ей тысячи изображений лошадей. Поэтому технология настолько вычислительно затратна и сильно отличается от человеческого обучения. Ребенку зачастую нужно увидеть всего несколько примеров объекта, или даже один, чтобы научиться распознавать его на всю жизнь.

Определяем носорогоединорогов без обучения

+27

Kantrollzed 26 окт 2020 в 13:43

Расширение возможностей алгоритмов Машинного Обучения с помощью библиотеки daal4py

4 мин

Data Engineering*Python*Алгоритмы*Машинное обучение*

Из песочницы

Каждый человек, который когда-либо сталкивался с алгоритмами машинного обучения знает, что даже простые ML модели на большом объёме данных могут обучаться непозволительно долго. Задачи восстановления зависимостей, классификации объектов оборачиваются минутами, а то и часами обучения сети.

Данная статья продемонстрирует, как на примере алгоритмов, взятых из библиотеки Scikit-Learn, можно расширить возможности обучения нейронных сетей, путём использования ускоренных вычислений библиотеки daal4py.

Читать дальше →

worksolutions 5 окт 2020 в 20:58

Подборка статей о машинном обучении: кейсы, гайды и исследования за сентябрь 2020

5 мин

4.3K

Python*TensorFlow*Искусственный интеллектМашинное обучение*

Сентябрьскую подборку мы начнем с кейса. В этот раз он всего один, но зато какой!

Мы не устаем восхищаться возможностями GPT-3 и рассказывать о сферах ее применения, но многие при этом видят в алгоритме угрозу своей профессии.
И компания VMO, которая занимается A/B тестированием, решила провести соревнование — профессиональные копирайтеры против GPT-3.

Они интегрировали алгоритм в свой визуальный редактор так, чтобы пользователи могли выбирать между сгенерированными и авторскими текстами. Пока что сервис позволяет только генерировать заголовки, описания товаров и услуг, а также кнопки-призывы к действию.

Почему это так интересно?

Читать дальше →

+19

Papazian 23 сен 2020 в 07:55

Unit-тестирование в Go с помощью интерфейсов

4 мин

14K

Go*

Вместо вступления

Эта статья посвящается тем, кто, как и я, пришел в Go из мира Django. Так вот, Django нас избаловал. Стоит только запустить тесты, как он сам, под капотом, создаст тестовую БД, прогонит миграции, а после прогона сам за собой приберёт. Удобно? Безусловно. Вот только времени на прогон миграций уходит — вагон, но это кажется разумной платой за комфорт, плюс всегда есть --reuse-db. Тем сильнее бывает культурный шок, когда бывалые джангисты приходят в другие языки, например в Go. То есть как-это никаких автомиграций до и после? Руками? А базу? Тоже руками? А после тестов? Что, и тирдаун руками? Ну и далее программист, перемежая код ахами и вздохами, начинает писать на Go джангу в отдельно взятом проекте. Конечно, выглядит всё это очень печально. Однако, в Go вполне возможно писать быстрые и надёжные юнит-тесты без использования сторонних сервисов типа тестовой БД или кэша.

Об этом и будет мой рассказ.

Читать дальше →

1 2 ...

16 17

19 20

Как скомпилировать Python

Анализ качества сна с машинным обучением, Python и SQL

Генерация текста с помощью GPT2 и PyTorch

Как скопировать стиль Уорхола с помощью нейросети VGG-19, трансферного обучения и TensorFlow

Распознавание символов

Как создавать красивые карты с помощью Python

Самая лучшая практика: работа с path в Python

FizzBuzz по-сениорски

Хранение данных в Docker

Разрабатываем и развёртываем собственную платформу ИИ с Python и Django

8 бесплатных инструментов для создания интерактивных визуализаций данных без необходимости написания кода

Настройка аутентификации JWT в новом проекте Django

Стилометрия, или как отличить Акунина от Булгакова с помощью 50 строк кода?

Визуализация пересечений и перекрытий с помощью Python

Изучение вариантов решения одной из самых сложных задач визуализации данных

Самые упоротые и забавные расширения для браузера: подборка

Генерация дефолтных Github аватарок

Принципиально новый метод позволяет тренировать ИИ практически без данных

Расширение возможностей алгоритмов Машинного Обучения с помощью библиотеки daal4py

Подборка статей о машинном обучении: кейсы, гайды и исследования за сентябрь 2020

Unit-тестирование в Go с помощью интерфейсов

Вместо вступления

Информация

Специализация