Data Science Digest (August 2019) / Хабр

Приветствую всех! DataFest возвращается в Украину и пройдет 7 сентября в Одессе. Сейчас формируется программа, но если вы хотите выступить с докладом, то можно подать свою тему здесь. Зарегистрироваться в качестве участника можно здесь. Напоминаю, что у дайджеста есть свой Telegram-канал и страницы в соцсетях (Facebook, Twitter, LinkedIn), где я ежедневно публикую ссылки на полезные материалы. Присоединяйтесь!

А пока предлагаю свежую подборку материалов под катом.

Статьи

Personalized Recommendations for Experiences Using Deep Learning — в этой статье вы узнаете, как недавно разработанная в TripAdvisor модель «Recommended For You» (RFY) генерирует персонализированные рекомендации на веб-сайте с использованием истории браузинга и глубокого обучения.
Building Data Pipelines With Kafka — статья предназначена для начинающих инженеров, которые собираются построить свой первый data pipeline на базе Kafka.
MIT Deep Learning Basics: Introduction and Overview with TensorFlow — обзор 7 deep learning архитектур со ссылками на TensorFlow примеры для каждой из них.
Introducing Dagster — введение в Dagster — Python библиотеку для построения дата приложений на основе ETL процессов или ML пайплайнов. Ссылка на itHub.
Using DVC to create an efficient version control system for data projects — в этой статье вы узнаете, что такое DVC и как его использовать для версионирования проекта.
Top 10 Statistics Mistakes Made by Data Scientists — 10 ошибок, которые Data Scientists делают, используя статистику, включая примеры и решения.
Anomaly Detection for Dummies — в статье рассматривается обнаружение неконтролируемых аномалий для одномерных и многомерных данных, а также различные стратегии их обнаружения. Jupyter notebook.
Top 25 pandas tricks — 25 советов о том, как работать быстрее и лучше писать код с использованием pandas.
Tips for Training Likelihood Models — в статье вы узнаете про распространенные методы обучения генеративных моделей, которые оптимизируют вероятность для авторегрессионных моделей и нормализующих потоков.
Panel: A high-level app and dashboarding solution for the PyData ecosystem — введение в Panel — новую Python библиотеку, которая позволяет создавать пользовательские интерактивные веб-приложения и информационные панели.
How to Perform Face Recognition With VGGFace2 in Keras — в этой статье вы узнаете о моделях VGGFace и VGGFace2 для распознавания лиц; как разработать систему идентификации лиц, чтобы предсказать имена знаменитостей по заданным фотографиям; как разработать систему проверки лица, чтобы подтвердить личность человека по фотографии.
Neural Architecture Search at CVPR 2019 — в этой статье вы узнаете о neural architecture search (NAS) и о том, как NAS был представлен на CVPR 2019.
And voilà! — в этой статье вы узнаете, как Voilà превращает блокноты Jupyter в автономные веб-приложения.
Building Lyft’s Marketing Automation Platform — статья о маркетинговой платформе Lyft, которая работает на основе машинного обучения.
Best Resources for Getting Started With GANs — подборка хороших ресурсов для изучения generative adversarial networks: методы использования, видеопрезентации, статьи и книги о GAN.

Проект

TRFL — это библиотека на TensorFlow, которая облегчает реализацию агентов обучения с подкреплением, разработанная командой исследователей в DeepMind.
NumPy implementations of various ML models — репозиторий с различными моделями машинного обучения на основе NumPy.
PyTorch Image Models — репозиторий различных ML моделей на PyTorch для работы с изображениями.

Video

ICML 2019 Videos — видео и слайды с International Conference on Machine Learning.

Книги

Advanced R
Study E-Book — репозиторий содержит множество электронных книг о компьютерном зрении, глубоком обучении, машинном обучении, математике, NLP, Python и обучении с подкреплением.

Мероприятия

Moscow Data Science Major — 31 августа, Москва — бесплатная конференция сообщества Open Data Science. 11 секций: Summer ML conf, SysML, Fail/cess story, ML trainings, A/B testing, NLP, PyData, ML4SG, CV/Learn to match, DS 4 Life, Random beer. Участие бесплатное, регистрация обязательна.
Odessa Data Fest — 7 сентября, Одесса — бесплатная конференция сообщества Open Data Science. 4 секции: Computer Vision, NLP, SysML, Business & Cases. Участие бесплатное, регистрация обязательна.
Data Science fwdays’19 — 7 сентября, Киеве — конференция, посвященная AI и Data Science. Вас ожидают 2 потока докладов; discussion corners; afterparty. Билеты. Для читателей дайджеста скидка 15% по промокоду: digest_fwdays.
AI Ukraine 2019 — 21-22 сентября, Киев — одна из самых сильных AI конференций в Украине в этом году будет проходить в 3 потока: Data Science and Machine Learning; Big Data and Analytics; AI Business and Startups. Программа уже на сайте. Для читателей дайджеста скидка 7% по промокоду: DSDigest-AI2019.
Data Science UA Conference — 19 октября, Киев — 7-я конференция о машинном обучении, искусственном интеллекте и науке о данных в Киеве. Продуктивный нетворкинг и технические инсайты. Более 500 участников и 20 спикеров, 3 потока. Больше информации. Для читателей дайджеста скидка 10% по промо коду: DSUA_Digest.

Спасибо, что дочитали этот выпуск. Надеюсь, каждый нашел для себя полезное. Буду благодарен за любые предложения для следующего дайджеста. Присоединяйтесь к Telegram-каналу дайджеста и его страницам в соцсетях: Medium, Facebook, Twitter, LinkedIn.

← Предыдущий выпуск: Data Science Digest (July 2019)