4 декабря приглашаем ML-разработчиков и Data Science-специалистов на встречу с командами разработки продакшн GigaChat и речевых технологий. На митапе SberDevices ведущие разработчики GigaChat поделятся деталями сбора данных для предобучения новой версии модели и метриками, которых достигают 7B и 29B модели, лежащие в основе GigaChat.
А ещё расскажут о подходах в разработке речевых технологий (ASR/TTS):
Создании моделей распознавания речи;
Дообучении для задач распознавания речи и эмоций;
Модификации технологий в обучении, архитектуре и инференсе моделей TTS.
В программе:
Федор Минькин, технический директор GigaChat и Сергей Марков, руководитель исследовательской программы GigaChat и R&D SberDevices.
«Открытие митапа, о команде и разработке GigaChat»;Григорий Лелейтнер (команда GigaChat).
«Что мы улучшили в процессе pre-training LLM»;Эмиль Шакиров и Никита Сидоров (команда GigaChat).
«Наш путь в процессе Alignment для совершенства моделей глубокого обучения»;Александр Максименко (команда Speech).
«Speech-only Pre-training: обучение универсального аудиоэнкодера»;Григорий Федоров (команда SaluteSpeech).
«Intended Query Detection: распознаём только нужные запросы»;Гриша Стерлинг (команда SaluteSpeech).
«Как мы заставили модель синтеза речи 2023 года говорить лучше модели 2018 года».
Гостей ждёт участие в дискуссиях и возможность задать вопросы спикерам во время докладов.
Количество мест офлайн ограничено. Для участия нужно зарегистрироваться на сайте.
UPD: Офлайн-регистрация завершена. Всех, кто не успел зарегистрироваться, приглашаем пройти регистрацию для участия в онлайн-формате.