Comments / Profile of ZlodeiBaal / Habr

Мальцев Антон @ZlodeiBaal

Computer Vision, Machine Learning

Profile Publications 56Comments 1.3KBookmarks 127

Яндекс открывает новое направление своей деятельности — Yandex Data Factory

ZlodeiBaal Dec 10 2014 at 23:07

Вы мне самому предлагаете найти статью, в которой SVM бы назывался Deep Learning'ом?

Видно google ищет по разному в зависимости от истории запросов. У меня одно из первых было напмер такое. А дальше ещё пара похожих.
videolectures.net/roks2013_wiering_vector/

Просто потому что здесь не выполняется базовая гипотеза Deep Learning'а: нет иерархичности признаков.

Воот. А о чём я вам говорю. Процент эффективной информации на изображении 0.001. А если нарезать сегменты вдоль проводов, то будет 100%. И нейросети уже заработают.

У вас же есть только провод и ветки сами по себе; ни из чего они не состоят, поэтому и толку от глубоких сетей нет. С другой стороны, в Вашей задаче понятнее, как её решать (в отличие от мотоциклов): найти провода и проследить их по всей картинке на предмет пересечения с ветками. Понятно, что дьявол в деталях и как найти провода, так и ветки задача нетривиальная, но тут уж нужно думать (например, провода не висят в воздухе сами по себе, они цепляются к чему-нибудь. Вот это что-то можно и искать. Ветки обычно имеют либо сильно нерегулярную структуру, либо покрыты обильной зеленью).

И вот мы подошли к тому, с чего я начал:

Задачка с проводами и беспилотником немножко выбивается из стройного ряда. Не совсем понятно, каким образом Computer Vision задача стала задачей big data. Конечно, там можно применить ML алгоритмы. Но они там будут не первичны.

Что Вы понимаете под размерностью?

Размер входного вектора обучения.

А в какой задаче, решаемой машинным обучением, входных ситуаций 33 или 150 или, пусть даже, меньше 1 000 000?

MNIST и любая задача выделения цифр? 10 ситуаций + 1 ситуация на ложняки.

Это почему? Вот, на MNIST'е эти алгоритмы уже обходят человека по точности.

А наилучшую точность на MNIST даёт SVM. Ага. Но только MNIST не имеет с реальными задачами ну вот вооооообще ничего общего. Это идеальная база, написанная парой людей (если ещё раскидать нейронным газом или DBN, то там получается несколько групп на каждый символ), идеально сегментированная.
Вот вам реальный пример: habrahabr.ru/company/recognitor/blog/243919/
Мы выложили базу на 5000 нарезанных символов. Глазом опознаются все. Получите 99.9% точность алгоритмом ML. Тут вообще нет особенностей написания. Только небольшие искажения камеры.