company_banner

Moscow Data Science Major: анонс и регистрация



    1 сентября Mail.Ru Group и сообщество Open Data Science проведут крупнейший митап Moscow Data Science Major. Событие состоит из пяти тематических блоков докладов, одной ML-тренировки и целого зала для нетворкинга и знакомств.

    Знакомьтесь с программой и регистрируйтесь! Вход на событие бесплатный, по одобренной регистрации.

    Доклады на Moscow Data Science Major пройдут в два потока. В таблице вы найдете сетку с расписанием, а ниже — описания докладов.

    Расписание:



    Описания докладов:

    «Speaker Diarization Problem», Григорий Стерлинг, NeurodataLab LLC
    Коротко расскажу про speech processing в целом и про задачу speaker diarization (по записи диалога нужно определить, кто и когда говорил). Расскажу про историю проблемы, зачем, почему, про cocktail party problem, кто как решал, почему это сложно. Основная часть доклада будет посвящена результатам 2017-2018 годов, например, о статье Google, в которой описано решение задачи для видео (там нейросетка как будто пытается читать по губам). Закончу тем, что делают, когда видео нет, а есть только звук (диалог по телефону, например), пройдусь по статьями и нашему подходу.

    «Нейросетевые вокодеры», Сергей Дуканов, Mail.Ru Group
    Сначала будет небольшой экскурс в современные подходы к решению задачи синтеза речи, затем поговорим про вокодеры, а потом сосредоточимся на одном из наиболее интересных из них (как с точки зрения теории, так и практики).

    «Пицца а-ля semi-supervised», Артур Кузин, Dbrain
    На примере контроля продукции в «Додо Пиццы» расскажу о приемах работы с данными при обучении моделей. В частности, покажу, как ббоксы натягиваются на семантическую сегментацию объектов, а также как обучить модель и получить разметку датасета, разметив только несколько сэмплов.

    «Архитектура OCR и TD в распознавании фотографий печатных документов», Алексей Гончаров, Илья Жариков, Никитин Филипп, Лаборатория машинного интеллекта МФТИ
    Доклад описывает структуру OCR (распознавание символов) и TD (детекция окон с текстом), которые наша команда использует в проектах по распознаванию фотографий печатных документов различного типа. Поговорим как об архитектуре, так и об обучении этих систем.

    «Как делать domain adaptation, и идеи для повышения его качества», Ренат Баширов, Samsung AI
    Доклад представляет из себя выжимку идей из пары десятков статей. Статьи выбирались по степени полезности для осуществления domain adaptation для изображений: имея одно размеченное множество, как получить/улучшить разметку на другом похожем множестве.

    Будет:

    • много GAN'ов,
    • несколько архитектур с десятком функций потерь,
    • рассказано про
      • что такого разного можно подавать в функции потерь,
      • перенос стиля,
      • применение domain adaptation для разных задач: классификация, сегментация.

    Не надо думать, что ничего не будет понятно, если ты понимаешь, например:

    • что такое функция потерь,
    • как работает backprop,
    • зачем нужен batchnorm и как он работает,
    • какого размера тензор получаются после global average pooling.

    «Поиск по товарам — организация работы», Дмитрий Дремов, Анализ чеков
    Про задачу, подход к организации работы и результаты.

    «Витрины в социальной сети: как и что показывать», Сергей Бойцов, Одноклассники
    Пройдём весь путь от пользователя до конкретного элемента в витрине, которую он видит. Сбор, предобработка данных, аналитическая обработка, A/B-тестирование.

    «Рекомендательные системы для транспортных билетов», Артем Просветов и Константин Коточигов, CleverDATA
    В докладе расскажем о применении рекомендательных систем в необычной для них области: для продажи транспортных билетов. Какие традиционные подходы могут помочь в решении этой задачи, какие эвристики хорошо себя показывают и какие открытия для себя мы сделали, занимаясь этим проектом.

    «Тюнинг Jupyter Notebook», Александр Лифанов, MarketGuard
    Как настроить Jupyter Notebook для продуктивной и удобной работы.

    «BigArtm — не только для текста», Максим Стаценко, Mail.Ru Group
    Многие привыкли, что эмбединг — это про текст: мы делаем эмбедниг слов, предложений и т.д. В некотором смысле тематическое моделирование — это тоже эмбединг. В своём докладе я хочу показать, что с помощью Python и изобретательности можно использовать подходы тематического моделирования и эмбедингов в задачах, в которых текстов нет совсем, а именно в кластеризации пользователей по источникам заработка и по интересам.

    «PID Controller intro, или Как варить пиво с PyData», Антон Лебедевич
    Постепенное введение в самый популярный автоматический регулятор на примере затирания солода для пива, с анимацией и кодом на Python. Помимо базового PID controller будет пара трюков, которые улучшают его работу в реальной жизни. На практике часто нужна автоматическая регуляция, и почти любая её реализация содержит элементы PID вместе с их недостатками, о которых надо знать и уметь их чинить.

    Зона «Кинозал»
    Зона нетворкинга и знакомств. В этом зале вы сможете общаться с коллегами и другими участниками мероприятия в свободном формате.

    Для участия необходимо зарегистрироваться. Не забудьте паспорт или водительские права.

    Сбор участников и регистрация: 10:00 — 11:00.
    Начало докладов: 11:00.
    Примерное окончание мероприятия: 17:00.
    Адрес: г. Москва, м. Аэропорт, Ленинградский пр-т, д. 39, стр.79.

    Трансляции
    • +18
    • 4,7k
    • 9
    Mail.ru Group
    1 040,13
    Строим Интернет
    Поделиться публикацией

    Комментарии 9

      0
      Прямо подарок на день знаний. Спасибо!
        0
        Подскажите пожалуйста, для просмотра видео-трансляции нужно регистрироваться?
        И будет ли доступна запись мероприятия (и нужна ли регистрация для этого)?
          0
          Для трансляции регистрироваться не нужно. Сразу после мероприятия будет доступна трансляция, а немного позже будут оформлены все выступления в отдельные видеозаписи и доступны публично для всех
            0
            Отлично, спасибо за подарок!
          0
          А где можно посмотреть все ссылки из слайдов? Например те же ссылки на tutorials из обзоров конференций?
            0
            Мы подумаем, как лучше опубликовать материалы.
            Следить за обновлениями можно в ODS slack.
            0

            deleted

              0
              Юля, а я и ещё двое моих друзей зарегались на мероприятие, а подтверждение никто не получил ещё.Что делать?
                0
                Привет, приглашение начнём отправлять к концу это недели.

                На всякий случай обращаю внимание, что это пост прошлого года, программу этого года анонсируем примерно через неделю.

              Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

              Самое читаемое