Для машинного обучения использовалась видеокарта 3090 Ti. Одна эпоха занимала около 3 дней при использовании модели xlm-roberta-base и около 5 дней при xlm-roberta-large.
Для обработки и очистки датасета использовался процессор. Также при прогоне текста через Named Entity Recognition (NER) с помощью библиотеки SpaCy вычисления выполнялись на процессоре.
В процессе работы компьютер периодически крашился, и приходилось запускать эпоху обучения заново. На вид казалось, что система уходит в сон и перестает реагировать. Если подобное происходило часто, то чистил компьютер, снимал боковую крышку корпуса и устанавливал напольный вентилятор, направляя поток воздуха на системный блок.
Для машинного обучения использовалась видеокарта 3090 Ti. Одна эпоха занимала около 3 дней при использовании модели xlm-roberta-base и около 5 дней при xlm-roberta-large.
Для обработки и очистки датасета использовался процессор. Также при прогоне текста через Named Entity Recognition (NER) с помощью библиотеки SpaCy вычисления выполнялись на процессоре.
В процессе работы компьютер периодически крашился, и приходилось запускать эпоху обучения заново. На вид казалось, что система уходит в сон и перестает реагировать. Если подобное происходило часто, то чистил компьютер, снимал боковую крышку корпуса и устанавливал напольный вентилятор, направляя поток воздуха на системный блок.
Дописал в статье, что для машинного обучения использовалась видеокарта.