Как стать автором
Обновить

Комментарии 7

При анализе цвета вы никак не учитываете насыщенность цвета. В итоге у вас серый цвет распознаётся так же, как чисто зелёный. А если бы картина была сфотографирована при немножко другом освещении, этот же серый распознался бы как чисто красный или чисто синий.
Кажется, имеет смысл либо не учитывать пиксели, у которых насыщенность ниже определённого порога, либо учитывать их взвешенно относительно насыщенности.
Хорошая идея, спасибо!
Надо будет попробовать сделать простенький фильтр (конверсия hsv -> фильтрация по насыщенности -> конверсия в оригинальное цветовое пространство) и посмотреть на работы, где это серьезным образом влияет на результаты
Спасибо, обязательно посмотрю.
Собрали отличный датасет, многим было бы интересно использовать. Eсли лицензия позволяет стоит загрузить например на www.kaggle.com/datasets

А почему решили использовать именно классические подходы? Сюда CNN так и просится, потом ембединги очень интересно анализировать.
Я не уверен насчет лицензии. Напишу письмо администратору галереи, уточню.
А с выбором методов все просто — я пока не силен в NN, работал только с классикой и только на табличках. Мне стало интересно, взлетит ли это все на изображениях, вот я и попробовал.
Как подтяну свои знания NN продолжу эксперименты.

Сейчас это стало очень просто ;)


Для начала можно взять любую сетку для классификации (ResNet, допустим), предобученную на ImageNet и брать выход ее предпоследнего слоя — это и будет эмбеддинг (представление) изображения. Работы на десяток строк, даже меньше, примеров в сети куча.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий