Статьи / Закладки / Профиль LazyTalent / Хабр

Дмитрий @LazyTalent

Python, DE

Профиль Публикации 1Комментарии 108Закладки 392

otter18 27 мар 2021 в 00:00

Делаем телеграм бота за 5 минут: быстрый старт с продвинутым шаблоном

2 мин

27K

Python*GitHub*Flask*

Туториал

В последнее время я сделал насколько много ботов для телеграмма, что крайне преисполнился в том, как их писать, как хостить, да и в принципе выработал красивый шаблон для быстрого их создания.

Потыкать в проект, сделанный на этом шаблоне, можно тут.

Сделать бота за 5 минут

khmelkoff 26 мар 2021 в 12:53

LIT – Инспектор для вашего NLP. Обзор, установка, тест

6 мин

2.9K

Python*Машинное обучение*Искусственный интеллектNatural Language Processing*

Туториал

Инспектор и даже где-то "толкователь", LIT или Language Interpretability Tool — мощная платформа с открытым исходным кодом для визуализации и интерпретации NLP-моделей. Платформа была представлена на EMNLP 2020 специалистами Google Research в ноябре 2020 года. LIT еще в статусе разработки, поэтому разработчики ничего не гарантируют, в том числе работу на платформе windows. Но у меня получилось, делюсь опытом.

N-Cube 13 мар 2021 в 07:23

Вычислительная геология и визуализация: пример Python 3 Jupyter Notebook

5 мин

5.8K

Open source*Программирование*Геоинформационные сервисы*Визуализация данных*Научно-популярное

Сегодня вместо обсуждения геологических моделей мы посмотрим пример их программирования в среде Jupyter Notebook на языке Python 3 и с библиотеками Pandas, NumPy, SciPy, XArray, Dask Distributed, Numba, VTK, PyVista, Matplotlib. Это довольно простой ноутбук с поддержкой многопоточной работы и возможностью запуска локально и в кластере для обработки больших данных, отложенными вычислениями (ленивыми) и наглядной трехмерной визуализацией результатов. В самом деле, я постарался собрать разом целый набор сложных технических концепций и сделать их простыми. Для создания кластера на Amazon AWS смотрите скрипт AWS Init script for Jupyter Python GIS processing, предназначенный для единовременного создания набора инстансов и запуска планировщика ресурсов на главном инстансе.

Визуализация с помощью Visualization Toolkit(VTK) и PyVista это уже далеко не Matplotlib

Читать дальше →

trim89 13 мар 2021 в 12:30

Tesseract vs таблицы. Распознавание документов

6 мин

17K

Python*Алгоритмы*1С*

Из песочницы

В данной статье описан пример распознавания сложного документа с таблицами с помощью tesseracta.

+18

Sakhar 13 мар 2021 в 12:42

Играем с CLIP. Создаем универсальный zero-shot классификатор на Android

9 мин

7.7K

Python*Java*Разработка под Android*Искусственный интеллектFlask*

TLDR: приложение можно скачать и потестить тут

Эта статья является дополненной и сильно расширенной версией моей статьи в TowardsDataScience о создании приложения, использующем новейшую мультимодальную нейросеть от OpenAI

В чем проблема классификаторов?

Многие заметили, что в последние годы все чаще для обработки изображений используется нейросетевой подход.

endlessnights 12 мар 2021 в 19:46

Запуск Django сайта на nginx + Gunicorn + SSL

4 мин

55K

Веб-разработка*Python*Django*Nginx*

Из песочницы

Технотекст 2021

Для написания этой статьи ушло очень много сил и времени. Я натыкался на множество инструкций, как на английском, так и на русском языках, но как я понял, - они все были клонами оригинальной статьи на Digital Ocean. Спросите вы, почему я так считаю, а все потому, что все ошибки и неточности передаются с одного ресурса на другой без всяких изменений.

parotikov 5 мар 2021 в 08:40

Читаем telegram-каналы в виде новостной ленты, часть вторая, с осмыслением

8 мин

18K

Мессенджеры*Python*Социальные сети и сообщества

Недолго я радовался после публикации статьи о Телегрегаторе.

Через несколько первых часов, где сообщения в основном содержали благодарности и вопросы по нюансам работы, стали поступать сообщения о том, что бот перестал добавлять в ленту новые каналы.

Я это списывал на не слишком подробную инструкцию по запуску, сбои в работе самого бота (о множестве существующих лимитов я узнал из недавней статьи), возможные ошибки пользователей.

Путем перекрестного опроса, чтением логов и раздумий пришел к выводу, что юзербот (а именно так, в соответствие со статьей выше, принято называть аккаунт телеграма, работающий в режиме бота) упёрся в лимит каналов (500 на аккаунт). Я не уточнял, приватных или публичных, да это и не важно. Юзер бот упёрся в них за день.

LeoSkliar 4 мар 2021 в 12:54

Как составить резюме на английском для иностранной компании

6 мин

38K

Блог компании Яндекс ПрактикумУправление персоналом*Карьера в IT-индустрииИзучение языков

Привет! Меня зовут Лео Скляр, я методист направления английского языка в Яндекс.Практикуме. Сейчас занимаюсь подготовкой курса английского для работы. Он может быть полезен как программистам, так и другим специалистам из digital-сферы. Я решил обобщить актуальную и самую ценную информацию из этого курса в гайд по грамотному составлению резюме на английском.

В первую очередь объясню, чем резюме для иностранных компаний принципиально отличается от резюме для российских. А также дам понимание, как выстраивать структуру хорошего резюме для зарубежного работодателя.

Англоязычное резюме не требует сверхсложного языка, и, скорее всего, если вы готовы начать работать в иностранной компании, вашего английского для написания резюме уже достаточно. Тем не менее попутно расскажу про некоторые специфичные ключевые английские формулировки и лайфхаки по наполнению резюме.

1. Специфика англоязычного резюме

В отличие от принятого в России резюме, которое больше похоже на CV (Curriculum vitae — описание профессионального пути на две–три страницы в хронологическом порядке) — резюме для американских и европейских компаний — это одностраничный документ, составленный по чёткой структуре. Такая лаконичность может казаться удивительной, но одна страница — это общепринятый стандарт резюме за рубежом. Даже если опыт большой, в резюме стоит сохранить упоминание только трёх–пяти последних мест работы, вашу позицию и ключевые достижения. Как правило, работодателя интересует актуальный опыт. Если ему потребуется узнать о вас больше, он может запросить расширенную версию резюме.

Читать дальше →

+16

chizh_andrey 1 мар 2021 в 12:00

Как построить четкие модели классов и получить реальные преимущества от UML. Часть 4

9 мин

4.1K

Блог компании Retail RocketСовершенный код*UML Design*ООП*Параллельное программирование*

Перевод

Пришло время посмотреть на тип модели классов UML, который можно встретить во множестве проектов. А ещё, увы, который часто поощряется в книгах по UML.

kai3341 28 фев 2021 в 11:55

Цензура в интернете. Когда базовых мер недостаточно — I2P

8 мин

33K

Децентрализованные сети*Сетевые технологии*I2P*БраузерыЗаконодательство в IT

Туториал

В прошлой статье я рассказал, какие выкрутасы можно сделать одним только браузером. В этой статье я расскажу, что ещё можно сделать, выйдя за рамки браузера

То, что изначально планировалось как небольшое дополнение к предыдущей статье с посылом "мы научились использовать прокси -- теперь добавим в их список шлюз i2p", выросло, словно собачка во время пути

Объём статьи не означает, что всё так сложно. Я подробно рассказал про несколько вариантов настройки. А какой выбрать -- решать вам

Поехали

+42

ruvds 23 фев 2021 в 16:37

Как написать простого бота для ВК и Телеграм

14 мин

62K

Блог компании RUVDS.comPython*Программирование*

Туториал

Мы уже упоминали, как мы предоставляем бесплатные VPS для студентов, чтобы они учились программировать. Один из наших подопечных Павел сделал простеньких телеграм и ВК ботов для FAQ. Они очень простые, тем не менее, начинающему программисту не помешают комментарии опытных ребят — поэтому публикуем его рассказ — Павел будет рад, если в комментариях ему дадут советы.

Читать дальше →

+29

MaxRokatansky 20 фев 2021 в 10:59

Ускоряем код на Python с помощью Nim

3 мин

7.7K

Блог компании OTUSPython*Программирование*

Перевод

Python — один из самых популярных и доступных языков программирования, но далеко не самый быстрый. Многие создатели библиотек и фреймворков прибегали к использованию расширения на С, чтобы их код работал быстрее, чем код на нативном Python. Этот способ вполне рабочий, но если вы не знакомы с С, сборка мусора и управление памятью станут вашим адом на Земле. И тут на сцену выходит Nim.

thelightningseas 12 фев 2021 в 15:08

Как с помощью нейросети определить лучшую дату отправки email и повысить доход рассылки в 8,5 раз

6 мин

6.9K

Блог компании MindboxPython*Big Data*Машинное обучение*Natural Language Processing*

Recovery Mode

Чтобы email-рассылка не затерялась во входящих, а клиенты чаще открывали письма и покупали, важно угадать правильное время отправки. С помощью нейросети мы проанализировали поведение клиентов и спрогнозировали дату отправки следующего email, чтобы порекомендовать клиенту товары в то время, когда он захочет их купить. Протестировали в зоомагазинах на рассылках с предложением повторной покупки и оценили результат с помощью AB-тестов. Получили следующие результаты:

в 23 раза
больше целевых отправок email с помощью нейросети по сравнению с триггером

в 8,5 раз
увеличился доход от email-рассылки по атрибуции last click

в 2 раза
уменьшился процент отписок

в 17 раз
выросло число открытий в абсолютном значении

Ниже поделимся опытом и расскажем:

почему решили использовать LSTM-модель нейросети для предсказания даты отправки email вместо алгоритма градиентного бустинга;
как устроена LSTM;
какие данные нейросеть использует для обучения;
какую архитектуру нейросети использовали и с какими сложностями столкнулись;
каких результатов достигли и как их оценивали.

Читать дальше →

zueve 12 фев 2021 в 15:41

Как скомпилировать Python

10 мин

57K

Блог компании ExnessВысокая производительность*Python*Программирование*Компиляторы*

Привет, Хабр!

Я хочу рассказать об удивительном событии, о котором я узнал пару месяцев назад. Оказывается, одна популярная python-утилита уже более года распространяется в виде бинарных файлов, которые компилируются прямо из python. И речь не про банальную упаковку каким-нибудь PyInstaller-ом, а про честную Ahead-of-time компиляцию целого python-пакета. Если вы удивлены так же как и я, добро пожаловать под кат.

+30

Picard 12 фев 2021 в 13:13

Анализ качества сна с машинным обучением, Python и SQL

7 мин

4.5K

Блог компании SkillfactoryPython*SQL*ГаджетыЗдоровье

Перевод

Последние примерно 2 месяца я ношу кольцо Oura, чтобы получать информацию о моём сне и о том, сколько я прошла шагов за день. Приложение считывает сон, разбитый на фазы (лёгкий, глубокий, быстрый), и даёт вам другие показатели, такие как частота сердечных сокращений, температура тела и частота дыхания. И для такого ботаника, как я, радостно было обнаружить, что у Oura есть API экспорта данных, чтобы я смогла лучше проанализировать их. Я загрузила данные в BigQuery и воспользовалась функцией CORR() (она потрясающая!), чтобы увидеть, какие показатели коррелируют с улучшением качества сна, а также визуализировала некоторые данные в Data Studio. Если у вас мало времени, переходите к разделу «Заключение», чтобы прочитать о том, что я узнала.

Дисклеймер: я не врач. Как раз наоборот: я ипохондрик, которому нравится писать на Python и SQL.

Приятного чтения!

+10

MaxRokatansky 12 фев 2021 в 14:49

Генерация текста с помощью GPT2 и PyTorch

5 мин

17K

Блог компании OTUSPython*Машинное обучение*Искусственный интеллект

Перевод

Генерация текста — одна из самых захватывающих прикладных задач обработки естественного языка (Natural Language Processing - NLP) за последние годы. Большинство из нас, вероятно, слышали о GPT-3, мощной языковой модели, которая может генерировать тексты, близкие к написанным человеком. Однако такие модели чрезвычайно трудно обучать из-за их большого размера, поэтому предварительно обученные модели обычно предпочтительнее там, где это приемлемо.

В этой статье мы научим вас генерировать текст с помощью предварительно обученного GPT-2 — более легкого предшественника GPT-3. Мы будем использовать именитую библиотеку Transformers, разработанную Huggingface. Если вы хотите узнать, как настроить GPT-2 на своем собственном наборе данных для генерации текста в конкретной предметной области, вы можете прочитать мою предыдущую статью: Настройка GPT2 для генерации текста с помощью Pytorch

Если предварительно обученной GPT-2 для ваших целей будет достаточно, то вы попали как раз туда, куда нужно! Без лишних отлагательств, приступим туториалу.

Picard 11 фев 2021 в 15:21

Как скопировать стиль Уорхола с помощью нейросети VGG-19, трансферного обучения и TensorFlow

6 мин

8.5K

Блог компании SkillfactoryPython*Обработка изображений*Машинное обучение*Искусственный интеллект

Туториал

Перевод

То что мы сделаем ещё называется Нейронный перенос стиля – это метод смешивания двух изображений и создания нового изображения из изображения-контента путём копирования стиля другого изображения, которое называется изображением стиля. Созданное изображение часто называют стилизованным изображением.

В этой статье мы скопируем стиль Энди Уорхола с «Мэрилин Диптих» на наши фотографии. Уорхол создал диптих Монро в 1962 году, сначала раскрасив холст разными цветами, а затем разместив теперь знаменитое изображение Мэрилин поверх холста. Хотя Уорхол не является основателем поп-арта, он – одна из самых влиятельных фигур в этом жанре.

Начнем творить!

NewTechAudit 10 фев 2021 в 12:12

Распознавание символов

9 мин

7.6K

Python*Программирование**nix*Машинное обучение*

Работа с изображениями — одна из самых распространенных задач в машинном обучении. Мы покажем пример обработки изображения, получение матриц (тензоров) чисел, подготовку данных обучающего множества, пример архитектуры нейронной сети.

Работа с изображениями является одной из самых распространенных задач в машинном обучении. Обычная картинка, воспринимаемая человеком однозначно, для компьютера не имеет никакого смысла и интерпретации, только если нет предварительно обученной нейронной сети, которая способна отнести изображение к одному определенному классу. Для работы такой нейронной сети необходимо ее обучение на тренировочных данных, изображениях предварительно обработанных и поданных на вход нейронной сети в виде матрицы чисел, характеризующих определенный тон (цвет) на определенной позиции в изображении. В этой статье приводится пример обработки изображения, получение матриц (тензоров) чисел, подготовка данных обучающего множества, пример архитектуры нейронной сети.

Постановка задачи: имеются цветные изображения букв и цифр (CAPTCHA). Необходимо распознать буквы и цифры, находящиеся на изображениях. Последовательность решения задачи:

— анализ изображений;

— подготовка данных;

— генерация данных;

— тренировка нейронной сети, предсказание ответов.

honyaki 3 фев 2021 в 19:06

Как создавать красивые карты с помощью Python

4 мин

23K

Блог компании SkillfactoryPython*OpenStreetMap*Визуализация данных*

Туториал

Перевод

Мне всегда нравились карты городов, и несколько недель назад я решил создать свою собственную, художественную версию. Немного погуглив, я обнаружил крутое руководство, написанное Фрэнком Себальосом. Оно увлекательно и полезно, но я предпочитаю более подробные/реалистичные карты-схемы. Из-за этого я решил создать свою собственную версию карт. Итак, давайте посмотрим, как мы можем создавать красивые карты с помощью Python и данных OpenStreetMap.

Приятного чтения!

+21

MaxRokatansky 2 фев 2021 в 00:41

Самая лучшая практика: работа с path в Python

3 мин

24K

Блог компании OTUSPython*Программирование*

Перевод

В последней статье мы использовали рекурсивную функцию размером менее 10 строк для решения проблемы сканирования папок и ранжирования файлов по дате изменения и размеру.

Теперь я подниму планку и покажу, как можно было сделать лучше.

1 2 ...

15 16

18 19 20

Делаем телеграм бота за 5 минут: быстрый старт с продвинутым шаблоном

LIT – Инспектор для вашего NLP. Обзор, установка, тест

Вычислительная геология и визуализация: пример Python 3 Jupyter Notebook

Tesseract vs таблицы. Распознавание документов

Играем с CLIP. Создаем универсальный zero-shot классификатор на Android

Запуск Django сайта на nginx + Gunicorn + SSL

Читаем telegram-каналы в виде новостной ленты, часть вторая, с осмыслением

Как составить резюме на английском для иностранной компании

1. Специфика англоязычного резюме

Как построить четкие модели классов и получить реальные преимущества от UML. Часть 4

Цензура в интернете. Когда базовых мер недостаточно — I2P

Как написать простого бота для ВК и Телеграм

Ускоряем код на Python с помощью Nim

Как с помощью нейросети определить лучшую дату отправки email и повысить доход рассылки в 8,5 раз

Как скомпилировать Python

Анализ качества сна с машинным обучением, Python и SQL

Генерация текста с помощью GPT2 и PyTorch

Как скопировать стиль Уорхола с помощью нейросети VGG-19, трансферного обучения и TensorFlow

Распознавание символов

Как создавать красивые карты с помощью Python

Самая лучшая практика: работа с path в Python

Информация

Специализация