Search
Write a publication
Pull to refresh
3
0
Send message

Для машинного обучения использовалась видеокарта 3090 Ti. Одна эпоха занимала около 3 дней при использовании модели xlm-roberta-base и около 5 дней при xlm-roberta-large.

Для обработки и очистки датасета использовался процессор. Также при прогоне текста через Named Entity Recognition (NER) с помощью библиотеки SpaCy вычисления выполнялись на процессоре.

В процессе работы компьютер периодически крашился, и приходилось запускать эпоху обучения заново. На вид казалось, что система уходит в сон и перестает реагировать. Если подобное происходило часто, то чистил компьютер, снимал боковую крышку корпуса и устанавливал напольный вентилятор, направляя поток воздуха на системный блок.

Дописал в статье, что для машинного обучения использовалась видеокарта.

Information

Rating
Does not participate
Registered
Activity