Alena_Fox_Spb Oct 23 2018 at 13:57

Как разобраться в Tensorflow и не умереть, а даже научить чему-то машину

8 min

41K

Artificial IntelligenceMachine learning * Development of mobile applications * Development for Android *

From sandbox

+23

Comments 15

jugor Oct 23 2018 at 14:44

Если я не ошибаюсь, то `legacy/train.py` на текущий момент не может работать с faster_rcnn моделями.
Требуется использовать `main_model.py`

Alena_Fox_Spb Oct 23 2018 at 14:47

Там вообще интересная история с файлом `main_model.py` — можете ознакомиться с [холиваром](https://github.com/tensorflow/models/issues/5348) по поводу того, что он может не работать как надо во время обучения модели. Например, у кого-то просто сообщения не шли в консоль (что простительно), а у меня, например, обучение по этому файлу вообще не шло. А пилить стандартные скрипты в мои задачи не входило, поэтому считаю это существенным недостатком. И в итоге, собственно, был взят 'train.py' файл

se_pavel Oct 23 2018 at 15:15

А что делать, если я хочу отсортировать документы с печатями по организациям (количество организаций конечно)?

Alena_Fox_Spb Oct 23 2018 at 15:35

1) По идее у каждой организации должна быть своя уникальная печать (или их несколько, но они все различные). Значит они и будут основаниями для классификатора и определять количество ваших распознаваемых типов.
2) Осталось только понять, какой способ в вашей задаче лучше — пытаться научить сеть распознавать документы целиком по этим печатям как единое изображение (и обучать по аналогии со 2 или 3 пунктом) или все же делать по пути object detection и размечать на каждом изображении нужный вид печати. Как показала практика на небольших выборках в таких ситуациях все же эффективнее путь object-detection, тк печати довольно похожи друг на друга и в 2 и 3 случае могут плохо отличаться в процессе распознавания.

Aracon Oct 23 2018 at 17:33

Есть ли на документах реквизиты организаций? Возможно, поможет OCR?

se_pavel Oct 23 2018 at 18:06

ОCR это бизнес решение, а хочу понять как развить сказанное в статье в более сложную модель

Aracon Oct 24 2018 at 09:05

OCR — это, в первую очередь, распознавание текста. Мой комментарий был к тому, что на хороших сканах печатных документов распознать реквизиты организаций может быть легче (либо надёжнее), чем их печати, которые часто ставят поверх подписи и текста, иногда они не полностью пропечатанные из-за нервной поверхности или заканчивавшихся чернил. Это, конечно, лишь мысли, на практике нужно смотреть конкретные примеры сканов, но попробовать подход с распознаванием текста тоже стоит.
Но если цель не в решении конкретной задачи, а в тренировке навыков, то другое дело.

rbobot Oct 24 2018 at 05:07

А ты классная.

Jolt Oct 24 2018 at 07:33

классный мануал, вечером опробую)

tarakanoff Oct 24 2018 at 12:25

Алена, большое спасибо Вам за статью. Недавно сам начал интересоваться ML и начал проходить точно такой же тяжелый путь с Tensorflow (туториалы, примеры и пр.). Ваша статья существенно облегчает жизнь.

mokhin-denis Oct 24 2018 at 17:43

Вот Liza Alert запустила ресурс «Вольный наблюдатель» (watcher.lizaalert.ru). Можно ли TF или другую систему научить в помощь команде Liza Alert?

olegfil Oct 25 2018 at 13:37

В этой задаче лучше получить ложные срабатывания, чем пропустить, так что совсем без человека не обойтись
Можно выделять «подозрительные» снимки (те на которых предположительно может быть человек) среди всей массы и показывать пользователю первыми — это может значительно оптимизировать процесс.
Фактически любая технология, описанная в статье, способна на такое. Custom Vision в этом плане самое простое — минимум технических знаний и этот сервис часто дает ложно-положительные срабатывания, что в данной задаче неслишком большая проблема.

mokhin-denis Oct 31 2018 at 07:14

Запущен масштабный проект по разработке технологии поиска людей. Призовой фонд 75 лямов.

Можно было бы прикрутить данные технологии к поиску людей на видео от коптера?

olegfil Nov 7 2018 at 08:46

Конечно можно.
Скорее всего боьшинство команд в этом конкрусе будет использовать распознавание на подобных технологиях (нейронные сети). И не так много полноценных и качественных опенсорсных инструментов для этого — 4-5.

TsarIoann Aug 17 2019 at 12:17

Почините ссылку на статью про Object Detection API, пожалуйста.
У компании, похоже, сменился никнейм на Хабре, и в Вашей статье ссылка не работает.
По номеру в ссылке смог восстановить рабочие варианты:
habr.com/ru/post/422353
habr.com/ru/company/nix/blog/422353