Articles / Profile of ggospodinov / Habr

Георгий Господинов @ggospodinov

User

ProfileArticles2PostsNewsComments8

ggospodinov Apr 29 at 12:00

Как мы научили GigaChat слышать: погружение в аудиомодальность

Medium

13 min

5.2K

SberDevices corporate blogСбер corporate blogArtificial IntelligenceMachine learning*

В конце прошлого года мы рассказывали про эксперименты с аудиомодальностью GigaChat, эксклюзивно показывали стенд на нашей конференции. Теперь аудиомодальность GigaChat доступна всем — в веб-интерфейсе giga.chat и Telegram-боте!

Сегодня мы расскажем, почему ушли от классической схемы ASR (Automatic Speech Recognition) + LLM и построили end-to-end модель, которая понимает речь; как устроена наша новая модель; на каких данных мы её обучали; и что из этого получилось.

+21

ggospodinov Apr 8 2024 at 09:50

GigaAM: класс открытых моделей для обработки звучащей речи

Medium

10 min

18K

SberDevices corporate blogOpen source*Machine learning*Artificial Intelligence

Салют, Хабр! Ранее мы в SberDevices анонсировали предобученную на русском языке модель GigaAM (Giga Acoustic Model) и её дообученные состояния под распознавание речи (GigaAM-CTC) и определение эмоций (GigaAM-Emo). Сегодня же делимся с сообществом весами моделей и примерами использования.

Приглашаем под кат погрузиться в self-supervised learning для звучащей речи и оценить возможности предобученных моделей!

+30