Data Science Digest (August 2019)



    Приветствую всех! DataFest возвращается в Украину и пройдет 7 сентября в Одессе. Сейчас формируется программа, но если вы хотите выступить с докладом, то можно подать свою тему здесь. Зарегистрироваться в качестве участника можно здесь. Напоминаю, что у дайджеста есть свой Telegram-канал и страницы в соцсетях (Facebook, Twitter, LinkedIn), где я ежедневно публикую ссылки на полезные материалы. Присоединяйтесь!

    А пока предлагаю свежую подборку материалов под катом.

    Статьи


    • Personalized Recommendations for Experiences Using Deep Learning — в этой статье вы узнаете, как недавно разработанная в TripAdvisor модель «Recommended For You» (RFY) генерирует персонализированные рекомендации на веб-сайте с использованием истории браузинга и глубокого обучения.
    • Building Data Pipelines With Kafka — статья предназначена для начинающих инженеров, которые собираются построить свой первый data pipeline на базе Kafka.
    • MIT Deep Learning Basics: Introduction and Overview with TensorFlow — обзор 7 deep learning архитектур со ссылками на TensorFlow примеры для каждой из них.
    • Introducing Dagster — введение в Dagster — Python библиотеку для построения дата приложений на основе ETL процессов или ML пайплайнов. Ссылка на itHub.
    • Using DVC to create an efficient version control system for data projects — в этой статье вы узнаете, что такое DVC и как его использовать для версионирования проекта.
    • Top 10 Statistics Mistakes Made by Data Scientists — 10 ошибок, которые Data Scientists делают, используя статистику, включая примеры и решения.
    • Anomaly Detection for Dummies — в статье рассматривается обнаружение неконтролируемых аномалий для одномерных и многомерных данных, а также различные стратегии их обнаружения. Jupyter notebook.
    • Top 25 pandas tricks — 25 советов о том, как работать быстрее и лучше писать код с использованием pandas.
    • Tips for Training Likelihood Models — в статье вы узнаете про распространенные методы обучения генеративных моделей, которые оптимизируют вероятность для авторегрессионных моделей и нормализующих потоков.
    • Panel: A high-level app and dashboarding solution for the PyData ecosystem — введение в Panel — новую Python библиотеку, которая позволяет создавать пользовательские интерактивные веб-приложения и информационные панели.
    • How to Perform Face Recognition With VGGFace2 in Keras — в этой статье вы узнаете о моделях VGGFace и VGGFace2 для распознавания лиц; как разработать систему идентификации лиц, чтобы предсказать имена знаменитостей по заданным фотографиям; как разработать систему проверки лица, чтобы подтвердить личность человека по фотографии.
    • Neural Architecture Search at CVPR 2019 — в этой статье вы узнаете о neural architecture search (NAS) и о том, как NAS был представлен на CVPR 2019.
    • And voilà! — в этой статье вы узнаете, как Voilà превращает блокноты Jupyter в автономные веб-приложения.
    • Building Lyft’s Marketing Automation Platform — статья о маркетинговой платформе Lyft, которая работает на основе машинного обучения.
    • Best Resources for Getting Started With GANs — подборка хороших ресурсов для изучения generative adversarial networks: методы использования, видеопрезентации, статьи и книги о GAN.


    Проект


    • TRFL — это библиотека на TensorFlow, которая облегчает реализацию агентов обучения с подкреплением, разработанная командой исследователей в DeepMind.
    • NumPy implementations of various ML models — репозиторий с различными моделями машинного обучения на основе NumPy.
    • PyTorch Image Models — репозиторий различных ML моделей на PyTorch для работы с изображениями.


    Video


    • ICML 2019 Videos — видео и слайды с International Conference on Machine Learning.


    Книги


    • Advanced R
    • Study E-Book — репозиторий содержит множество электронных книг о компьютерном зрении, глубоком обучении, машинном обучении, математике, NLP, Python и обучении с подкреплением.


    Мероприятия


    • Moscow Data Science Major — 31 августа, Москва — бесплатная конференция сообщества Open Data Science. 11 секций: Summer ML conf, SysML, Fail/cess story, ML trainings, A/B testing, NLP, PyData, ML4SG, CV/Learn to match, DS 4 Life, Random beer. Участие бесплатное, регистрация обязательна.
    • Odessa Data Fest — 7 сентября, Одесса — бесплатная конференция сообщества Open Data Science. 4 секции: Computer Vision, NLP, SysML, Business & Cases. Участие бесплатное, регистрация обязательна.
    • Data Science fwdays’19 — 7 сентября, Киеве — конференция, посвященная AI и Data Science. Вас ожидают 2 потока докладов; discussion corners; afterparty. Билеты. Для читателей дайджеста скидка 15% по промокоду: digest_fwdays.
    • AI Ukraine 201921-22 сентября, Киев — одна из самых сильных AI конференций в Украине в этом году будет проходить в 3 потока: Data Science and Machine Learning; Big Data and Analytics; AI Business and Startups. Программа уже на сайте. Для читателей дайджеста скидка 7% по промокоду: DSDigest-AI2019.
    • Data Science UA Conference — 19 октября, Киев — 7-я конференция о машинном обучении, искусственном интеллекте и науке о данных в Киеве. Продуктивный нетворкинг и технические инсайты. Более 500 участников и 20 спикеров, 3 потока. Больше информации. Для читателей дайджеста скидка 10% по промо коду: DSUA_Digest.


    Спасибо, что дочитали этот выпуск. Надеюсь, каждый нашел для себя полезное. Буду благодарен за любые предложения для следующего дайджеста. Присоединяйтесь к Telegram-каналу дайджеста и его страницам в соцсетях: Medium, Facebook, Twitter, LinkedIn.

    ← Предыдущий выпуск: Data Science Digest (July 2019)
    • +14
    • 3,2k
    • 1
    Поделиться публикацией
    AdBlock похитил этот баннер, но баннеры не зубы — отрастут

    Подробнее
    Реклама

    Комментарии 1

      0
      У кого-нибудь Voila работает нормально под виндой?

      Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

      Самое читаемое