Pull to refresh
2
Никита Шевцов@Travvy

CV Инженер

1
Subscribers
Send message

Генератор синтетических документов для обучения моделей ИИ

Level of difficultyMedium
Reading time4 min
Reach and readers2.8K

Где взять пару миллионов документов с разметкой для обучения модели ИИ? Сгенерировать синтетически! Меня зовут Никита, я работаю в ИСП РАН и веду блог по ИИ. Выложил в открытый доступ проект, который поможет дата-саентистам самостоятельно создавать датасеты сканированных документов с разметкой, используя только CPU. Подойдет для предобучения мультимодальных трансформеров, OCR и проч.

Читать далее

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Registered
Activity