Так интересно сколько в пике, а nvidia-smi даст только для текущего момента, если только дергать её через какие то короткие интервалы и логировать и потом парсить.
Не знаю как это реализованно в caffe, но по логике чтобы прогнать через сетку изображение надо загрузить обученные веса + в каждый момент времени в памяти можно держать данные только для curr и prev слоя, т.е. должно получится сильно меньше чем в тренировочной фазе, еще учитывая то что в блобах в тестовой фазе и градиенты не надо хранить.
Недавно читнул некоторые главы этой книги www.amazon.com/Machine-Learning-Action-Peter-Harrington/dp/1617290181 и еще есть репа с кодом github.com/pbharrin/machinelearninginaction, хоть сам экспертом не являюсь в ML и Python, но есть подозрения, что так писать на Python противопоказано, там даже не используется numpy, но думаю автор специально делает упрощения для новичков, но не сообщает, что это явно не для продакшена код. Теоретический материал изложен очень понятно почти без формул (опять же для новичков), не весь спектр ML алгоритмов рассмотрен, но автор об этом пишет. Наверно можно порекомендовать как первую книгу, но может привить неправильное представление об использовании так скажем scientific подмножества python.
https://en.wikipedia.org/wiki/Bayesian_optimization
Попробовал так же на CPU, тоже зафейлилось, но видимо по какой то другой причине, хотя вроде как все 8Gb памяти сожрало.
Попробовал так же уменьшать размер изображения, но тогда надо подбирать параметры
upsample_param
, автоматом (как сверточные слои) это не работает.вот можете ознакомится еще с подходами
https://github.com/mrgloom/Semantic-Segmentation-Evaluation
GPU: GeForce GTX 460
Platform: Windows 10
CUDA toolkit: cuda_7.5.18_win10_network.exe
GPU даёт прирост в x15 раз на MNIST.
Есть еще github.com/rasbt/python-machine-learning-book выглядит посерьезнее, но пока не читал.
p.s. scikit learn хорош если его использовать как black box, т.е. именно как инструмент, но код у него не читаемый, по крайней мере для меня.
вот еще неплохой обзор
on-demand.gputechconf.com/gtc/2014/presentations/S4739-gpus-accelerate-learning-rank-yandex.pdf
похожий проект
www.robots.ox.ac.uk/~szheng/crfasrnndemo
вот еще, датасет для классификации по музыкальным жанрам.
www.slideshare.net/dalpozz/racing-for-unbalanced-methods-selection
алгоритм SMOTE генерирует синтетические примеры.
graphics.cs.msu.ru/ru/research/projects/imagerecognition/trafficsign
Пример data augumentation на mnist (mnist8m (infinite MNIST dataset)):
leon.bottou.org/papers/loosli-canu-bottou-2006
Кстати какие есть готовые тулзы для разметки данных?
www.zbs-ilmenau.de/pdf/FWS2014_Stricker.pdf
такой вот автомат, я так понимаю пульс меряет по цвету кожи, пейпер от 2014 года.
а если загуглить «remote pulse measurement» то можно наткнуться и на такую статью
web.media.mit.edu/~zher/papers/Poh-etal-OptExp.pdf
Даже вот как то и не вериться, что это работает.