Хмм.
Как-то плохо про Caffe всё написано. Ощущение, что вы с ним либо вообще не работали либо работали очень давно.
1) Загон про питон — непонятный. Обёртка работает, работает хорошо. Если не лезть в недра слоёв — то обёртка полностью даёт доступ. Для 90% задач доступ в недара не нужен.
2) RNN там уже пол года как есть. Нет каких-то нормальных мануалов к ним только.
3) Написанных мануалов вообще мало — это факт. Но. Огромное сообщество. Гугление даёт ответы практически на все возможные ошибки. По количеству информации в инете Caffe на первом месте. Хотя TF уже скоро дагонит и перегонит.
4) Научное сообщество. С начала года я достаточно плотно ознакомлялся работами с 20. Из них 3-4 реализовывал. Из 20 работ лишь 1-2 имели исходники на TF. Всё остальное — Caffe. Если вы пробуете взять какие-то чужие прототипы — работать без Caffe не получится.
5) Да, п.4 во многом из-за того что Caffe один из немногих фреймворков поддерживающих Matlab. В Caffe половина слоёв с завязкой на него.
Так же в сравнении полностью упущенна поддержка чего-то за исключение x86 архитектуры. Тот же Caffe на андроиде вы запустите с трудом. Зато Tensor Flow проще.
А вот при запуске на Jetson|RaspberryPi уже обратная ситуация.
Но нельзя не отметить что сейчас самый перспективный — Tensor Flow
1) Можно было бы взять хэш с небольшой подборкой сдвигов. Хотя на мой взгляд pHash должен к таким сдвигам и так устойчивым быть. Он понижает разрешение, там долно всё съесться.
2) Можно было бы построить гистограмму яркости-цвета. Очень просто, очень быстро. Думаю, что достаточно устойчиво по такой маленькой базе героев.
А как научно-развлекательный проект для себя — да, классно!
Чьи решения по лицам/радужке/венам/пальцам используете?
Это достаточно крупный стек технологий, который с нуля самим собрать практически невозможно. Разве что какие-то базовые вещи по лицам из open source.
Вы интегратор, или у вас что-то своё?
Да, чтото файл затёр случайно. Заапдейтил ссылку. Вот файл.
Какой красный прямоугольник?!
Нужно на вход сетки подавать чистое изображение. А на выход — параметрическую модель результата. В той статье есть масса примеров описания такой модели на базе существующих датасетов.
Недавно копался. Пока в dlib поиск лиц DL, а особые точки были не DL. Причём поиск не был подключаем для питона, только плюсы.
Это не мешает существовать другим открытым работам, где поиск и точек и лиц существует.
Зачем это делать в локальной сети? Или вы про удалённый просмотр?
Там у WD проблемм и глюков море, если что. Он требует чтобы и устройство с которого и устройство на которое заходят прокидывалось через NAT. А сейчас море провайдеров NAT частично банят.
Видно что-то не то прочитал про него.
Вообще снапшоты это не такая большая проблема. А вот ещё скорости, конечно, хочется.
Сейчас полистал инет. Натолкнулся что возможно сейчас самый осмысленный это некий QuickNet, но у него нет порта на Caffe.
Или что-то ещё сейчас есть более быстрое с разумной точностью?
Прикольно. Был уверен, что встречал фразу в 50раз быстрее. Но точно помню что не в статье. И не помню где.
Получается, что единственный смысл — уменьшение веса файла сетки?
В памяти то она тоже не мало жрёт.
Для современных алгоритмов эта предварительная фильтрация не нужна. Они и так работают. От фильтрации всё может стать только хуже.
Главное — база. Чем больше, тем лучше!
Не хочу с вами спорить. Задачами CV занимаюсь уже лет 8. Делал крупные проекты ещё до прихода нейросетей. В том числе в сфере безопасности. То что вы тут написали простите — полная чушь.
Могу лишь предложить сделать стабильное решение предложенным вами способом, а потом написать статью почему это не работает:)
Да, сделать детекцию без сетей можно (но не так как вы пишите). Огромный труд, где-то 3-5 человекомесяцев. При этом работать будет хреново. А на половине окон вообще не будет.
Нет, не проще:
1) Точка подвеса камеры движется. Положение летка тоже. Пришлось бы ручную разметку использовать.
2) Это не решает проблему движущегося фона.В моём случае — качающихся деревьев.
3) Задача сегменации от фона — это вообще жесткач, если у объекта есть хоть часть цвета совпадающего с фоном.
4) Еще до появления нейронных сетей я делал такие алгоритмы. Это очень сложно. И очень много эмпирик. А после того как появиться контровое солнце — всё равно всё перестанет работать, пока вручную ещё пяток эмпирик не воткнуть. Нейронная сеть тем и хороша, что она сама ищет эмпирики. И потенциально, при большой базе может использоваться везде.
Очень хорошая идея! Да, мы это с коллегами обсуждали очень активно. Сейчас думаем может прикрутить в свои серьёзные проекты этот подход. Когда есть распознавание чего-то и хочется на первых порах контролировать систему.
Тут не стал прикручивать пока. Возможно в следующую итерацию сделаю.
В телеграмме можно для этого удобные кнопочки посылать вместе с фото. Чтобы не пришлось писать на клаве ничего.
У производителя кормушек есть группа в вконтакте. Изучал там комментарии. Про «отвалилась» не нашёл ни одного. Учитывая, что страховка есть — не очень парюсь. Максимум придётся корм заменить.
Я покупал готовую кормушку российского производителя. На сайте он утверждает, что присоски держат очень серьёзный минус. У меня висит с начала января — пока не оторвалась, минус 30 было. Страховка есть. Верёвочка небольшая, её нужно протянуть через окно, или подвязать к чему-нибудь снаружи.
Как-то плохо про Caffe всё написано. Ощущение, что вы с ним либо вообще не работали либо работали очень давно.
1) Загон про питон — непонятный. Обёртка работает, работает хорошо. Если не лезть в недра слоёв — то обёртка полностью даёт доступ. Для 90% задач доступ в недара не нужен.
2) RNN там уже пол года как есть. Нет каких-то нормальных мануалов к ним только.
3) Написанных мануалов вообще мало — это факт. Но. Огромное сообщество. Гугление даёт ответы практически на все возможные ошибки. По количеству информации в инете Caffe на первом месте. Хотя TF уже скоро дагонит и перегонит.
4) Научное сообщество. С начала года я достаточно плотно ознакомлялся работами с 20. Из них 3-4 реализовывал. Из 20 работ лишь 1-2 имели исходники на TF. Всё остальное — Caffe. Если вы пробуете взять какие-то чужие прототипы — работать без Caffe не получится.
5) Да, п.4 во многом из-за того что Caffe один из немногих фреймворков поддерживающих Matlab. В Caffe половина слоёв с завязкой на него.
Так же в сравнении полностью упущенна поддержка чего-то за исключение x86 архитектуры. Тот же Caffe на андроиде вы запустите с трудом. Зато Tensor Flow проще.
А вот при запуске на Jetson|RaspberryPi уже обратная ситуация.
Но нельзя не отметить что сейчас самый перспективный — Tensor Flow
2) Можно было бы построить гистограмму яркости-цвета. Очень просто, очень быстро. Думаю, что достаточно устойчиво по такой маленькой базе героев.
А как научно-развлекательный проект для себя — да, классно!
Это достаточно крупный стек технологий, который с нуля самим собрать практически невозможно. Разве что какие-то базовые вещи по лицам из open source.
Вы интегратор, или у вас что-то своё?
Какой красный прямоугольник?!
Нужно на вход сетки подавать чистое изображение. А на выход — параметрическую модель результата. В той статье есть масса примеров описания такой модели на базе существующих датасетов.
Это не мешает существовать другим открытым работам, где поиск и точек и лиц существует.
Ализар, пожалуйста, почитай матчасть, не позорься. На Хабре было много статей…
Там у WD проблемм и глюков море, если что. Он требует чтобы и устройство с которого и устройство на которое заходят прокидывалось через NAT. А сейчас море провайдеров NAT частично банят.
Вообще снапшоты это не такая большая проблема. А вот ещё скорости, конечно, хочется.
Сейчас полистал инет. Натолкнулся что возможно сейчас самый осмысленный это некий QuickNet, но у него нет порта на Caffe.
Или что-то ещё сейчас есть более быстрое с разумной точностью?
Получается, что единственный смысл — уменьшение веса файла сетки?
В памяти то она тоже не мало жрёт.
Но вам скорее нужен тот кто в Data Scince специализируется.
CV — это несколько другое.
Главное — база. Чем больше, тем лучше!
Могу лишь предложить сделать стабильное решение предложенным вами способом, а потом написать статью почему это не работает:)
Да, сделать детекцию без сетей можно (но не так как вы пишите). Огромный труд, где-то 3-5 человекомесяцев. При этом работать будет хреново. А на половине окон вообще не будет.
1) Точка подвеса камеры движется. Положение летка тоже. Пришлось бы ручную разметку использовать.
2) Это не решает проблему движущегося фона.В моём случае — качающихся деревьев.
3) Задача сегменации от фона — это вообще жесткач, если у объекта есть хоть часть цвета совпадающего с фоном.
4) Еще до появления нейронных сетей я делал такие алгоритмы. Это очень сложно. И очень много эмпирик. А после того как появиться контровое солнце — всё равно всё перестанет работать, пока вручную ещё пяток эмпирик не воткнуть. Нейронная сеть тем и хороша, что она сама ищет эмпирики. И потенциально, при большой базе может использоваться везде.
Тут не стал прикручивать пока. Возможно в следующую итерацию сделаю.
В телеграмме можно для этого удобные кнопочки посылать вместе с фото. Чтобы не пришлось писать на клаве ничего.