Приветствую всех!
Встречайте свежий выпуск дайджеста полезных материалов из мира Data Science & Machine Learning и не забывайте подписываться на наш Telegram-канал.
Статьи
How to Use XGBoost for Time Series Forecasting - небольшой туториал об использовании XGBoost для прогнозирования временных рядов
Genetic Algorithms for Natural Language Processing - вводная статья о генетических алгоритмах и об их взаимодействии с NLP алгоритмами.
Differential Evolution from Scratch in Python - статья о методах применения и использования алгоритмов дифференциальной эволюции на Python.
Style Your Pandas DataFrame and Make It Stunning - техники использования встроенных методов работы с датафреймами на Pandas.
The FLORES-101 Data Set: Helping Build Better Translation Systems Around the World - обзор FLORES-101, нового мультиуровневого датасета для разработки более совершенных систем перевода от команды Facebook AI.
Научные статьи
Alias-Free GAN - новое исследование о применении продвинутых генеративных моделей для работы с изображениями, видео и анимацией от NVIDIA.
You Only Look at One Sequence: Rethinking Transformer in Vision through Object Detection - работа от китайских ученых об You Only Look at One Sequence (YOLOS), новом наборе моделей для детекции предметов.
CoAtNet: Marrying Convolution and Attention for All Data Sizes - научная работа о CoAtNets, новом семействе гибридных сверточных моделей.
Consistent Instance False Positive Improves Fairness in Face Recognition - обзор нового метода уменьшения ложных срабатываний при распознавании лиц.
Multivariate Probabilistic Regression with Natural Gradient Boosting - новый эффективный метод многомерной вероятностной регрессии с естественным усилением градиента.
DynamicViT: Efficient Vision Transformers with Dynamic Token Sparsification - фреймворк динамического разбиения токенов для постепенного и динамического удаления избыточных токенов в зависимости от входных данных.
Проекты
MLOps Toys - каталог MLOps тулзов с возможностью поиска по категориям.
Видео
Data Governance - предметный разговор об управлении данными.
Ingestion and Historization in the Data Lake - доклад о приеме и историзации данных в озерах данных.
Спасибо, что дочитали этот выпуск. Надеюсь, каждый нашел для себя что-то полезное. Буду благодарен за любые предложения для следующего дайджеста.
Присоединяйтесь к Telegram-каналу дайджеста и его страницам в соцсетях: Twitter, Facebook, а также подписывайтесь на нашу еженедельную рассылку.