Как стать автором
Обновить
26
0
Кирилл Данилюк @kirilldaniluk

Компьютерное зрение в беспилотниках Яндекса

Отправить сообщение
Не обидно. Оригинальный пост был на английском, а теперь, на русском, он найдёт ещё сколько-то читателей — за что Newprolab спасибо.
На самом деле, подходит. В датасете есть такие, с ними модель неплохо справлялась. А кейс с двумя знаками есть даже в верхней гифке.
Не продакшен — да, в проде для бизнеса нужно что-то типа SSD/YOLO
В моём случае, детекция (определение bounding box знака) и классификация знаков — это две разные задачи, я делаю только классификацию. Детекцию на видеопотоке можно сделать как классическими методами (например, HOG + SVM), так и с помощью YOLO/Faster RCNN сетей, что лучше. Это самое интересное, конечно, я расскажу об этой задаче в части про MultiNet
Я отталкивался от публикации ЛеКуна, он как раз использует grayscale-изображения: http://yann.lecun.com/exdb/publis/pdf/sermanet-ijcnn-11.pdf

Но у меня не получилось получить лучшую точность, используя цветные изображения. Во многом, наверное, из-за того, что их нужно как-то хитрее препроцессить. Мой же интерес был, скорее, в тренировке STN, чем в получении state-of-the-art результата (один из лучших сейчас даёт DenseNet: https://arxiv.org/pdf/1608.06993.pdf, TF-имплементации легко гуглятся)
Да, вы правы, но этот wheel-пакет неофициальный, не хотелось в это ввязываться. skimage не замена opencv, но часто бывает удобнее именно он.
Мне кажется, интереса в проект можно добавить и самому. Для факта сдачи этого проекта, например, требовалось почти ничего, но многие студенты не ограничиваются базовым заданием и придумывают-исследуют что-то дополнительно. Udacity даёт направление, а копаешь уже сам.

В следующем проекте (классификатор дорожных знаков на свёрточных сетях), кстати, несколько студентов добились state-of-the-art точности, что совсем не тривиально, хотя от них никто этого не требовал. Но именно такие посты потом и интересно читать :)
Продвинулся. Насчёт стоящего — вопрос сложный, я ведь деньги заплатил, поэтому уже необъективен :)

Вообще, в плане чистых знаний Udacity сам по себе мало что даст: всё и так давно выложено в открытый доступ, а обучающие материалы в Udacity поверхностны. Лично для меня ценность скорее в дедлайнах, сертификате и общей методологии. Плюс, Sebastian Thrun, их СЕО, и развил в Гугле self-driving car, так что курс получился «из первых рук». Программа значительно лучше продумана и более требовательна, чем, например, их ML Nanodegree (который я прошёл, так что есть с чем сравнивать). Term 1 маркетинговый, конечно, но я купился на Term 2 и 3, в которых хайп заканчивается и начинается работа на C++.
В чём выражается результат? В плане получения хардкорных доменных знаний — разумеется, их не будет, времени не хватит. Математики не будет. Но в плане нетворкинга, общения с профессионалами и широты охвата (data science + data engineering) курс отличный (я выпускник).

Курс дорогой, потому что, помимо всего прочего, для вас поднимают кластер с hadoop, spark, питоновским data-стеком и разрешают всем этим неограниченно пользоваться в течение всего курса.
Курс помог, но самообучение тоже никто не отменял. Что-то одно вряд ли научит «всему».
Над постом мы подумаем, а пока можно просто сбросить резюме или ссылку на свой самый удачный проект нам на job@zeptolab.com, мы всегда вам рады!
Думали об этом, сделаем.
Мы пока что сверстали под вебкит, как самый распространенный движок для айфонов / андроидов. Т.е., в десктопном Сафари с айфонным user agent все действительно выглядит как на телефоне. Про версию для Оперы думаем.
Мы пробовали заливать серым, разными оттенками – все получалось плохо. Совсем отрывать белое выделение – ссылка становится незаметной. Пока что остановились на таком варианте, но будем экспериментировать дальше.
Вы, наверное, зашли с параметром new=1? Без него вам новая страница пока не показалась бы. В дальнейшем андроиды с маленькими экранами будут получать чуть измененные стили.
Обязательно. Для ретины будут показываться другие иконки
Мы разведем стили для айфонов и андроидов. Дефолтный андроидный вебкит рендерит бордеры и тени не так аккуратно, как айфонный. Сделаем стиль под андроиды полегче и страница должна перестать тормозить.
Класс. Но с другой стороны вы и денег заплатили за выступление :)
не согласен. Нужна не технологичность, а 1. умение определить и решить четкую проблему, 2.показать результат и доказать эффективность и 3. суметь заработать на этом деньги.
Если это достигается разработкой новой технологии — отлично. Не PageRank, а контекстная реклама (спасибо Эрику Шмидту) приносит Гуглу деньги.
еще минус: модем сам по себе довольно широкий и на маке заслоняет второй usb-порт. Т.е. если включили йоту, мышку уже не подключите.
1

Информация

В рейтинге
Не участвует
Откуда
Москва, Москва и Московская обл., Россия
Работает в
Зарегистрирован
Активность