Search
Write a publication
Pull to refresh
4
0
Сергей Братчиков @hivaze

NLP Researcher. https://t.me/nlpwanderer

Send message

Контекст больше не предел: Линейка русскоязычных энкодеров ruRoPEBert и как она создавалась

Level of difficultyMedium
Reading time9 min
Views8.6K

Привет, Хабр! Если вы интересуетесь NLP или просто современными DL моделями, то приглашаю вас узнать, как можно, имея всего лишь одну A100, около 30 гигабайтов текста и несколько дней обучения, решить проблему ограниченного окна контекста для русскоязычных трансформеров. А ещё сделаем несколько оптимизаций и добьёмся почти лучших метрик в бенчмарке encodechka.

Погрузиться в контекст

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Works in
Date of birth
Registered
Activity