
Приветствую всех!
Встречайте свежий выпуск дайджеста полезных материалов из мира Data Science & Machine Learning подготовленный командой Data Phoenix и не забывайте подписываться на наш Telegram-канал.
Напоминаю, что 17 августа буду проводить вебинар "The A-Z of Data: Introduction to MLOps". В его рамках мы рассмотрим, что такое MLOps, основные принципы и практики, лучшие инструменты и возможные архитектуры. Мы начнем с простого жизненного цикла разработки ML решений и закончим сложным, максимально автоматизированным, циклом, который нам позволяет реализовать MLOps. Детали и обязательная предварительная регистрация здесь.
Статьи
Building Architectures that Can Handle the World’s Data - обзорная статья о Perceiver от команды DeepMind.
Make a Rock-Solid ML Model Using Sklearn Pipeline - статья о том, почему, как и когда использовать Sklearn Pipeline.
Continuous Integration and Continuous Deployment (CI/CD) Tools for Machine Learning - обзор CI/CD тулов для машинного обучения.
How to Detect Seasonality, Outliers, and Changepoints in Your Time Series - использование Kats для обнаружения аномалий в данных.
Open MLOps: Open Source Production Machine Learning - вводная статья об Open MLOps.
Creating a Modern, Open Source MLOps Stack at Home - Статья про MLOps и наборе тулов для него.
Data Monetization 101 - статья о том, как можно монетизировать данные.
Introducing Triton: Open-Source GPU Programming for Neural Networks - вводная статья о Triton, новом языке программирования от OpenAI, похожем на Python.
Pinot Real-Time Ingestion with Cloud Segment Storage - Uber о работе с данными в реальном времени.
Научные статьи
Alias-Free Generative Adversarial Networks - работа о архитектурных особенностях генеративных сетей без псевдонимов.
Image Super-Resolution via Iterative Refinement - сверхвысокое разрешение изображений с помощью итеративного уточнения.
Sketch Your Own GAN - работа про GAN, который позволяет создавать изображение из набросков.
MixLacune: Segmentation of Lacunes of Presumed Vascular Origin - работа о MixLacune - двухэтапном подходе к сегментированию лакун.
StyleGAN-NADA: CLIP-Guided Domain Adaptation of Image Generators - новый метод адаптации генераторов изображений.
NeX: Real-Time View Synthesis with Neural Basis Expansion - работа о NeX, новом методе синтеза эффектов в реальном времени.
AutoTinyBERT: Automatic Hyper-Parameter Optimization for Efficient Pre-Trained Language Models - автоматический поиск гиперпараметров архитектуры.
Droidlet: Modular, Heterogenous, Multi-Modal Agents - работа о платформе Droidlet - модульной, гетерогенной архитектуре интеллектуальных агентов и платформе для их создания, которая находится на пересечении обработки естественного языка, компьютерного зрения и робототехники.
Contextual Transformer Networks for Visual Recognition - новый модуль "трансформер" для обнаружения изображений.
Курсы
Designing, Visualizing and Understanding Deep Neural Networks - курс про Deep Neural Networks от UC Berkeley.
Инструменты
ZPY [by Zumo Labs] - тулза для генерации синтетических данных.
Спасибо, что дочитали этот выпуск. Надеюсь, каждый нашел для себя что-то полезное. Буду благодарен за любые предложения для следующего дайджеста.
Присоединяйтесь к Telegram-каналу дайджеста и его страницам в соцсетях: Twitter, Facebook, а также подписывайтесь на нашу еженедельную рассылку.