Комментарии 2
Модели, работающие с неразмеченными данными, часто требуют более сложной архитектуры. По сути, вы просто меняете затраты на разметку данных на затраты на вычислительные мощности.
Нет. Читайте статьи, из которых вы это взяли, заново и внимательно. Предобучение на огромных объемах неразмеченных данных делается не для этого.
сбор данных остается больным местом для стартапов. И похоже, что ни сообщества, ни рынок пока не готовы решить эту проблему
Не стоит недооценивать рынок. Если есть стабильный спрос на качественные данные, то предложение всегда найдётся, надо просто поискать.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Как собирать данные: руководство для ИИ-стартапов