На самом деле, подходит. В датасете есть такие, с ними модель неплохо справлялась. А кейс с двумя знаками есть даже в верхней гифке.
Не продакшен — да, в проде для бизнеса нужно что-то типа SSD/YOLO
В моём случае, детекция (определение bounding box знака) и классификация знаков — это две разные задачи, я делаю только классификацию. Детекцию на видеопотоке можно сделать как классическими методами (например, HOG + SVM), так и с помощью YOLO/Faster RCNN сетей, что лучше. Это самое интересное, конечно, я расскажу об этой задаче в части про MultiNet
Я отталкивался от публикации ЛеКуна, он как раз использует grayscale-изображения: http://yann.lecun.com/exdb/publis/pdf/sermanet-ijcnn-11.pdf
Но у меня не получилось получить лучшую точность, используя цветные изображения. Во многом, наверное, из-за того, что их нужно как-то хитрее препроцессить. Мой же интерес был, скорее, в тренировке STN, чем в получении state-of-the-art результата (один из лучших сейчас даёт DenseNet: https://arxiv.org/pdf/1608.06993.pdf, TF-имплементации легко гуглятся)
Мне кажется, интереса в проект можно добавить и самому. Для факта сдачи этого проекта, например, требовалось почти ничего, но многие студенты не ограничиваются базовым заданием и придумывают-исследуют что-то дополнительно. Udacity даёт направление, а копаешь уже сам.
В следующем проекте (классификатор дорожных знаков на свёрточных сетях), кстати, несколько студентов добились state-of-the-art точности, что совсем не тривиально, хотя от них никто этого не требовал. Но именно такие посты потом и интересно читать :)
Продвинулся. Насчёт стоящего — вопрос сложный, я ведь деньги заплатил, поэтому уже необъективен :)
Вообще, в плане чистых знаний Udacity сам по себе мало что даст: всё и так давно выложено в открытый доступ, а обучающие материалы в Udacity поверхностны. Лично для меня ценность скорее в дедлайнах, сертификате и общей методологии. Плюс, Sebastian Thrun, их СЕО, и развил в Гугле self-driving car, так что курс получился «из первых рук». Программа значительно лучше продумана и более требовательна, чем, например, их ML Nanodegree (который я прошёл, так что есть с чем сравнивать). Term 1 маркетинговый, конечно, но я купился на Term 2 и 3, в которых хайп заканчивается и начинается работа на C++.
В чём выражается результат? В плане получения хардкорных доменных знаний — разумеется, их не будет, времени не хватит. Математики не будет. Но в плане нетворкинга, общения с профессионалами и широты охвата (data science + data engineering) курс отличный (я выпускник).
Курс дорогой, потому что, помимо всего прочего, для вас поднимают кластер с hadoop, spark, питоновским data-стеком и разрешают всем этим неограниченно пользоваться в течение всего курса.
Мы пока что сверстали под вебкит, как самый распространенный движок для айфонов / андроидов. Т.е., в десктопном Сафари с айфонным user agent все действительно выглядит как на телефоне. Про версию для Оперы думаем.
Мы пробовали заливать серым, разными оттенками – все получалось плохо. Совсем отрывать белое выделение – ссылка становится незаметной. Пока что остановились на таком варианте, но будем экспериментировать дальше.
Вы, наверное, зашли с параметром new=1? Без него вам новая страница пока не показалась бы. В дальнейшем андроиды с маленькими экранами будут получать чуть измененные стили.
Мы разведем стили для айфонов и андроидов. Дефолтный андроидный вебкит рендерит бордеры и тени не так аккуратно, как айфонный. Сделаем стиль под андроиды полегче и страница должна перестать тормозить.
не согласен. Нужна не технологичность, а 1. умение определить и решить четкую проблему, 2.показать результат и доказать эффективность и 3. суметь заработать на этом деньги.
Если это достигается разработкой новой технологии — отлично. Не PageRank, а контекстная реклама (спасибо Эрику Шмидту) приносит Гуглу деньги.
Не продакшен — да, в проде для бизнеса нужно что-то типа SSD/YOLO
Но у меня не получилось получить лучшую точность, используя цветные изображения. Во многом, наверное, из-за того, что их нужно как-то хитрее препроцессить. Мой же интерес был, скорее, в тренировке STN, чем в получении state-of-the-art результата (один из лучших сейчас даёт DenseNet: https://arxiv.org/pdf/1608.06993.pdf, TF-имплементации легко гуглятся)
В следующем проекте (классификатор дорожных знаков на свёрточных сетях), кстати, несколько студентов добились state-of-the-art точности, что совсем не тривиально, хотя от них никто этого не требовал. Но именно такие посты потом и интересно читать :)
Вообще, в плане чистых знаний Udacity сам по себе мало что даст: всё и так давно выложено в открытый доступ, а обучающие материалы в Udacity поверхностны. Лично для меня ценность скорее в дедлайнах, сертификате и общей методологии. Плюс, Sebastian Thrun, их СЕО, и развил в Гугле self-driving car, так что курс получился «из первых рук». Программа значительно лучше продумана и более требовательна, чем, например, их ML Nanodegree (который я прошёл, так что есть с чем сравнивать). Term 1 маркетинговый, конечно, но я купился на Term 2 и 3, в которых хайп заканчивается и начинается работа на C++.
Курс дорогой, потому что, помимо всего прочего, для вас поднимают кластер с hadoop, spark, питоновским data-стеком и разрешают всем этим неограниченно пользоваться в течение всего курса.
Если это достигается разработкой новой технологии — отлично. Не PageRank, а контекстная реклама (спасибо Эрику Шмидту) приносит Гуглу деньги.