Все потоки

Python *

Высокоуровневый язык программирования

СтатьиПостыНовостиАвторыКомпании

setflag 2 июн 2020 в 10:51

Жесткий цигун с условными знаками или зачем нужен geometry generator

15 мин

8K

Python * Геоинформационные сервисы *

Из песочницы

Требования заказчика к условным обозначениям на картах кажутся вам нереальными? Дальше вы узнаете, как с помощью geometry generator, QGIS и Python сделать так, чтобы ваши условники были лучше всех.

Читать дальше →

+10

ph_piter 2 июн 2020 в 09:10

Книга «Генеративное глубокое обучение. Творческий потенциал нейронных сетей»

5 мин

7.5K

Блог компании Издательский дом «Питер»Python * Алгоритмы * Машинное обучение * Профессиональная литература *

Привет, Хаброжители! Генеративное моделирование — одна из самых обсуждаемых тем в области искусственного интеллекта. Машины можно научить рисовать, писать и сочинять музыку. Вы сами можете посадить искусственный интеллект за парту или мольберт, для этого достаточно познакомиться с самыми актуальными примерами генеративных моделей глубокого обучения: вариационные автокодировщики, генеративно-состязательные сети, модели типа кодер-декодер и многое другое.

Дэвид Фостер делает понятными и доступными архитектуру и методы генеративного моделирования, его советы и подсказки сделают ваши модели более творческими и эффективными в обучении. Вы начнете с основ глубокого обучения на базе Keras, а затем перейдете к самым передовым алгоритмам.

Разберитесь с тем, как вариационные автокодировщики меняют эмоции на фотографиях.
Создайте сеть GAN с нуля.
Освойте работу с генеративными моделями генерации текста.
Узнайте, как генеративные модели помогают агентам выполнять задачи в рамках обучения с подкреплением.
Изучите BERT, GPT-2, ProGAN, StyleGAN и многое другое.

Читать дальше →

+5

Gleb_Sevruk 2 июн 2020 в 08:57

PyTrace — Time Travel Debugger для Python

2 мин

7.2K

Мне часто приходится сталкиваться с отладкой.

Иногда я ставлю точку останова, но понимаю что уже слишком поздно, и надо начинать все сначала.

Более того, перед началом отладки, я подготавливаю данные, очищаю базу данных от лишних записей. Все для того, чтобы забыть зайти в, на первый взгляд, безобидный метод, и начать весь процес заново.

Усложняется все тем, что приходится работать с унаследованным кодом, который иногда сложно понять.

Возможно ли лучше понимать запутанный код? А что, если мы сможем понимать такой код, быстрее чем тот, кто его написал?

Встречайте,

PyTrace — это трейсер с возможностями Time-Travel Debugging-а

+29

DimaFromMai 2 июн 2020 в 02:32

Эволюция монолитного приложения в микросервисы

14 мин

5.7K

Python * Анализ и проектирование систем * Микросервисы *

Recovery Mode

Как правило, когда нужно что-то сделать быстро и дёшево, мы не задумываемся над отказоустойчивостью и масштабируемостью нашего приложения, что через некоторое время обязательно приводит к боли. Современные решения позволяют быстро и просто решить эту проблему.

На примере перехода от монолитного приложения к микросервисам, я попробую показать все плюсы и минусы каждого подхода. Статья разделена на три части:

В первой части будет рассмотрено монолитное приложение на веб-фреймворке Dash, т.е. генерация данных и их отображение будут находиться в одном месте.
Вторая часть посвящена разложению монолитного приложения на микросервисы, т.е. генерацией данных будет заниматься один сервис, отображением другой, а связь между ними будет налажена через брокер сообщений Kafka.
В третьей части микросервисы будут "упакованы" в Docker контейнеры.

Конечное приложение будет выглядеть, как показано на диаграмме снизу.

Читать дальше →

+2

Sobolev5 1 июн 2020 в 15:43

Простое распознавание лица «на лету» в Django

2 мин

6.1K

Django * Python *

Доброго дня!

Меня зовут Соболев Андрей и сегодня мы с вами создадим простую «плюшку» к Django, которая будет проверять, что на фотографии именно лицо человека (что бывает полезно в куче ситуаций).

Для этого нам понадобится OpenCV и 5 минут свободного времени. Поехали.

Читать дальше →

+4

Stantin 1 июн 2020 в 12:29

Детектор приседаний на OpenCV и Tensorflow

5 мин

11K

Python * TensorFlow * Машинное обучение * Обработка изображений * Raspberry Pi *

В эпоху заточения хорошо заниматься физкультурой, но вот беда — не все домашние с этим согласны, так что приходилось прикладывать некоторые усилия. Работать надзирателем однако хотелось не очень, потому как надо было собственно работать, а пущеный на самотек спортивный процесс, наблюдаемый в лучшем случае одним глазом, заимел тенденцию скатываться в халяву.

Профессионально деформированный мозг беспокоился, что надо эти процессы как-то мониторить, собирать метрики, и делать это конечно не вручную, а чтобы оно все само себя посчитало.

Начать было решено с приседаний. Фундаментальное движение, с явными состояниями, большой амплитудой, в общем, идеальный выбор.

Читать дальше →

+23

Qra 1 июн 2020 в 09:58

Анализируем шедевры живописи с помощью классического ML

11 мин

9.5K

Блог компании OTUSPython * Машинное обучение *

Технотекст 2020

Из песочницы

Всем привет! Один мой друг учится на художника и регулярно вдохновленно рассказывает о том или ином шедевре, о неповторимых композиционных приемах, о цветовосприятии, об эволюции живописи и гениальных художниках. На фоне этого постоянного воздействия я решил проверить, годятся ли мои инженерные знания и навыки для анализа мирового культурного наследия.

Вооружившись самодельным парсером под покровом ночи я ворвался в онлайн галерею и вынес оттуда почти 50 тысяч картин. Давайте разберем, что интересного с этим можно сделать, используя только классические ML инструменты (осторожно, трафик).

Читать дальше →

+16

nice_one 1 июн 2020 в 08:15

Стажировка аналитиком в Яндексе: разбор тестовых задач

14 мин

59K

Python * Алгоритмы * Карьера в IT-индустрии

Из песочницы

Привет, Хабр!

Однажды, штудируя очередную книгу по пресловутой Data Science, я пришел к мысли, что пора бы применить накопленные знания на практике и увидеть жизнь отдела аналитики своими глазами. К моему счастью, Яндекс запустил отбор на полугодичную стажировку по соответствующему направлению, и я не мог пройти мимо. Приём заявок 2020 уже закончился, поэтому в этой статье я с чистой совестью разберу задачи, которые Яндекс предлагал решить соискателям на первом этапе. Будет и код на Python. Спойлер: сложно, но интересно.

Читать дальше →

+12

Rpsl 1 июн 2020 в 07:58

Zero Inbox. Гайд по наведению порядка в почте

9 мин

9.4K

GTD * Go * MongoDB * Python *

Моему почтовому ящику на gmail много лет. Более десяти лет самостоятельного существования, а также в нем лежат архивы из других почтовых систем. Все эти годы я использовал его так как и нужно использовать умные продукты:

Не сортировал письма, так как для этого есть хороший поиск
Не удалял письма с большими вложениями, так как для этого есть куча пространства
Не категоризировал письма и позволял сервису обучаться на моих привычках, для автоматических эвристик

И это было чудесное время, пока мне не захотелось навести в нем порядок.

Задача навести порядок не была самоцелью, скорее меня начало раздражать что весь inbox завален каким-то мусором: заказы из магазинов, рекламные письма, обновления от почты, все это вперемешку с периодическими дайджестами и личной перепиской.

gmail inbox
^^ Это не настоящий скрин моей почты. Просто картинка для превью.

+5

Witcher136 31 мая 2020 в 17:23

Как скомпилировать декоратор — C++, Python и собственная реализация. Часть 1

6 мин

9.8K

C++ * Python * Компиляторы * Функциональное программирование *

Данная серия статей (как выяснилось, целых две) будет посвящена возможности создания декоратора в языке С++, особенностям их работы в Python, а также будет рассмотрен один из вариантов реализации данного функционала в собственном компилируемом языке, посредством применения общего подхода для создания замыканий — closure conversion и модернизации синтаксического дерева. Вторая часть уже доступна: здесь.

Дисклеймер

В данной статье под декоратором понимается не паттерн проектирования, а декоратор в Python — способ изменить поведение функции. Декоратор в Python это функция, применяемая к другой (декорируемой). Функция-декоратор создает замыкание (новую функцию), вызывающее декорируемую функцию внутри себя и делающее что-то еще нужное программисту (логгирование вызовов, захват ресурсов и т.д.), а интерпретатор Python затем «привязывает» к названию целевой функции получившееся замыкание.

Читать дальше →

+8

s1m00n 31 мая 2020 в 13:06

Краткий обзор NLP библиотеки SpaСy

5 мин

47K

Natural Language Processing * Python * Машинное обучение *

Из песочницы

Обработка естественного языка(Natural Language Processing — NLP) сегодня становится очень востребованной, так как людям несомненно проще общаться с машинами также, как они общаются с людьми.

Поэтому сейчас, вместе с быстрым развитием этой области, всё больше сервисов используют NLP: чат-боты, в которых больше не нужно выбирать готовые ответы, голосовые ассистенты, электронная почта, чтобы автоматически сортировать письма и так далее. В этом посте я хочу рассказать об относительно новой Python библиотеке SpaCy, которая стала, если не индустриальным стандартом, как ~~кричат~~ заявляют сами создатели на сайте библиотеки: https://spacy.io/, то как минимум одним из самых популярных и удобных решений. Приятного чтения!

Читать дальше →

+8

dfedchenko 31 мая 2020 в 11:58

Как мужик квазигруппы искал (или Учи Python, а то будешь руками работать)

4 мин

4.2K

Математика * Python * Big Data *

Совсем немного теории

Латинский квадрат — табличка, заполненная буквами так, что в каждой строке и в каждом столбце никакая не повторяется дважды.

$inline$	$inline$	$inline$
$inline$	$inline$	$inline$
$inline$	$inline$	$inline$

Читать дальше →

+1

Olga_ol 29 мая 2020 в 18:55

Что посмотреть на карантине? Подборка материалов от Технострима (часть 6)

3 мин

5K

Блог компании VKBig Data * Python * Учебный процесс в IT

Продолжаем нашу подборку интересных материалов (1, 2, 3, 4, 5). На этот раз предлагаем послушать курс о введении в анализ данных и новый выпуск ток-шоу для айтишников «Oh, my code» с Павлом Dzirtik Щербининым.

+30

olga_neus 29 мая 2020 в 12:07

Установка OpenCV-Python на виртуальной среде для суперчайников

2 мин

88K

Из песочницы

Здесь вы найдете пошаговый пример установки библиотеки OpenCV на Python.

Установка Python
Установка виртуальной среды
Установка OpenCV + jupiterlab, numpy, matplotlib
Тестирование

Все тестировала на планшете Microsoft Surface, Windows 10 Pro, c 64-битной операционной системой.

Предположим, что на вашем устройстве ничего не установлено заранее.

Сначала установим Python.
Скачиваем нужную версию и запускаем .exe файл. Не забываем установить галочку add path. Я установила Python 3.7.3 от 25 марта 2019 г., потому что новая на данный момент версия Python 3.7.4 от 8го июля 2019 г. работала некорректно, а именно в терминале некоторые команды зависали. Открываем командную строку.
Устанавливаем virtualenv.

Читать дальше →

+3

alexeyk500 28 мая 2020 в 20:04

Быстрая загрузка большого количества данных в Google Colab

3 мин

42K

Google Cloud Platform * Python * Машинное обучение *

Из песочницы

Доброго времени суток, Хабр. Решил поделиться своим знанием, как можно быстро загрузить большое количество файлов в Google Colab с Google Drive.

Всем известно, что Google Colab отличная бесплатная платформа для обучения и экспериментов над Нейронными Сетями.

На платформе Google Colab Вам бесплатно предоставят мощную видеокарту на которой вы сможете поэкспериментировать с обучением своей нейросети на протяжении примерно 12 часов.
Затем сеанс прервется, но на следующий день от Google можно опять будет получить видеокарту и продолжить свои эксперименты.

Нейронным сетям требуется очень много данных для обучения, особенно если речь идет о нейросетях работающих с изображениями.

Для обучения таких нейросетей необходимо загрузить в обучающую и валидационную выборки тысячи и сотни изображений. К сожалению, если эти изображения загружать непосредственно из вашего Google Drive, это занимает неприлично долгое время — десятки минут или даже часы. Ведь каждое обращение за файлом в Google Drive и получение от него ответа с содержимым файла происходит последовательно и не быстро.

Обидно тратить время доступа к бесплатной видеокарте на загрузку данных, да и не разумно это.

А мы люди разумные, поэтому мы один раз обратимся к Google Drive считаем наши данные запакованные заранее в zip архив, распакуем полученный zip архив в память Google Colab и считаем свои данные со скоростью в сотни раз большей чем с Google Drive последовательно по одному файлу.

Для эксперимента со скорость загрузки данных в Colab я взял имеющуюся у меня базу «Airplanes» для сегментационной нейросети.

В этой базе есть папка с изображениями «самолеты» и папка «сегментация», где хранятся маски изображений самолетов из вышеназванной папки.
В каждой папке по 1005 изображений 1920*1080.
В общей сложности нам предстоит загрузить 2010 файлов.
Я заранее загрузил к себе на Google Drive как саму базу с изображениями, так и ее zip архив.

Структура Обучающей Базы:

Читать дальше →

+7

razrab_from_Mars 28 мая 2020 в 13:05

Генерация рандомных ветвлений на Питоне

17 мин

9.9K

Python * Алгоритмы * Искусственный интеллектНенормальное программирование * Программирование *

Технотекст 2020

Вспоминая Докинза, основную идею можно выразить так: если долго держать смерч над помойкой, то может собраться Боинг-747. Появление структуры из хаоса дуриком: перебирая и рекомбинируя всё подряд, из всех бессмысленных и беспорядочных процессов можно увидеть вполне осмысленные и упорядоченные. Если такие процессы каким-либо образом закрепляются и повторяются, то система, еще вчера представлявшая из себя броуновское движение, сегодня начинает выглядеть уже так, как будто ее поведение настроила невидимая рука, и что она совершает какие-то осмысленные с нашей точки зрения действия. При этом никакой руки и близко нет. Она настроила себя сама.

Чтобы в этом убедиться еще раз, я и стремлюсь написать некое подобие цифровой жизни, которая из хаоса и без лишних указаний от человека способна будет сама себе рандомно генерить логику и существовать по ней в своем естественном пространстве обитания — операционной системе. Да, в этом, вероятно, есть отличие от многих программ из направления «Искусственная жизнь», которые «живут» в загончиках, плодят «хищников» и «травоядных», и со-существуют на искусственных полях с «едой» и друг другом. Никакие из этих программ не взаимодействуют с объектами системы (процессами, файлами и т.д.), а значит код по-настоящему не живет. Кроме того, этот код так или иначе всё равно выполняет какую-то нужную человеку задачу и очень из-за этого ограничен рамками.

Чтобы реализовать код с большой степенью свободы действий в операционной системе, который при этом не представлял бы из себя просто хаотический набор исполняющихся инструкций, появилась модель, которая состоит из 3 модулей.

Читать дальше →

+13

i_shutov 27 мая 2020 в 20:16

Карантин, онлайн-системы и data science. Кто думает об удержании клиентов?

4 мин

1.7K

R * Python * Data Mining * CRM-системы *

Карантин явился своеобразной лакмусовой бумажкой для систем онлайн-обслуживания. Многие системы, даже Госуслуги, не выдержали нагрузки (а дистанционное образование вообще отдельная песня, некоторые семьи могли их даже не пережить). Многие системы оказались функционально не готовы к массовому обслуживанию. Проводя ретроспективу, сейчас на каждом углу начали писать про важность онлайн направлений для магазинов, о том, что надо было задумываться об этом ранее. 2 месяца активных онлайн заказов и постепенность последующего выхода вполне могли радикально изменить предпочтения и покупательскую модель жителей больших городов.

Сейчас ИТ может прийти к бизнесу и потребовать десятки и сотни миллионов на внедрение или разработку модных онлайн-систем. Однако окажется ли это все оправданным? Без построения полноценного управления оттоком клиентов (то что в телекоме называлось 'customer churn prediction') эффективность затраченных средств окажется под большим вопросом и вот почему.

В тематике CRM существует два широко употребляемых маркетинговых тезиса:

Стоимость привлечения нового клиента в 10 раз выше стоимости продажи существующему клиенту.
Довольный клиент приводит двух, а недовольный уводит десятерых.

Читать дальше →

0

asmisha 27 мая 2020 в 19:26

Создание торгового бота используя машинное обучение в анализе временных рядов

5 мин

15K

Python * Алгоритмы * Искусственный интеллектМашинное обучение * Программирование *

Из песочницы

Это не техническая статья, в ней нет подробного анализа методов и теории. Просто как-то я увлекся машинным обучением и как и многие начинающие в этой теме люди, решил сделать торгового бота. Однако это выросло в нечто большее, чем просто тренировочный проект. Вот обо всем этом я и хочу рассказать.

Читать дальше →

+5

nkrishelie 27 мая 2020 в 17:47

Сказ о том, как мы BigQuery приручали

8 мин

9.2K

Big Data * Google Cloud Platform * Python * SQL *

Из песочницы

Задача

На самом деле, задача, о которой хочется рассказать, проста до уныния по своей формулировке: нужно было визуализировать данные по продажам отдела e-commerce малой кровью, т.е., читай, практически даром.

Читать дальше →

+9

Aragroth 27 мая 2020 в 15:41

Внутри виртуальной машины Python. Часть 2

27 мин

19K

Профессиональная литература * Программирование * Компиляторы * Изучение языковPython *

Перевод

Привет, Хабр. Перевод этой статьи занял намного больше времени, чем ожидалось. Мне очень хотелось сделать всё качественно и без обмана, но если найдёте неточности, буду рад услышать о них. Также я буду сам перечитывать и исправлять ошибки предыдущих статей, если где-то оказался не прав. Мне предстоит перевести ещё около 4-5 статей такого объёма, поэтому прошу оценить мой труд, если вам понравилось.

Читать дальше →

+16

1 2 ...

323

324 325 ...