Как стать автором
Обновить

части тела

Чулан
Задаю немного странный, но очень нужный по работе вопрос. Я прошу вас на него ответить, отнеситесь к нему серьёзно!

И так, вопрос:
* какие части человеческого тела привлекают ваше внимание?
* какие части вы рассматриваете наиболее внимательно?
* в какой позиции должна находиться часть тела, чтобы вы уделили ей максимальное внимаение?

Желательно ответить для тела человека «впринципе», для мужского тела, для женского. Если будут картинки-примеры — вообще замечательно! Стесняться эротики не нужно — женская грудь, к примеру, является такой же неотъемлимой частью тела, как и голова.

Хорошим ответом будет что-то типа этого:
«чаще всего я рассматриваю глаза человека, когда он начинает говорить — смотрю на его губы. Кроме того я обращаю внимание на руки человека, особенно на ногти»

Вопросы задаю в рамках вот этого проeкта.
Всего голосов 27: ↑11 и ↓16 -5
Просмотры 447
Комментарии 48

Фильтрация ложных соответствий между изображениями при помощи динамического графа соответствий

Алгоритмы *Обработка изображений *

Многие современные алгоритмы компьютерного зрения строятся на основе детектирования и сопоставления особых точек визуальных образов. По этой теме было написано немало статей на хабре(например SURF, SIFT). Но в большинстве работ не уделяется должного вниманию такому важному этапу, как фильтрация ложных соответствий между изображениями. Чаще всего для этих целей применяют RANSAC-метод и на этом останавливаются. Но это не единственный подход для решения данной задачи.
Данная статья посвящена одному из альтернативных способов фильтрации ложных соответствий.
Читать дальше →
Всего голосов 73: ↑73 и ↓0 +73
Просмотры 23K
Комментарии 23

Британские спутниковые снимки 2: как все было на самом деле

Блог компании Open Data Science Python *Алгоритмы *Обработка изображений *Машинное обучение *
image

Сразу оговорюсь, что данный пост не несет большой технической нагрузки и должен восприниматься исключительно в режиме «пятничной истории». Кроме того, текст насыщен английскими словами, какие-то из них я не знаю как перевести, а какие-то переводить просто не хочется.

Краткое содержание первой части:

1. DSTL (научно-техническая лаборатория при министерстве обороны Великобритании) провела открытое соревнование на Kaggle.
2. Соревнование закончилось 7 марта, результаты объявлены 14 марта.
3. Пять из десяти лучших команд — русскоговорящие, причем все они являются членами сообщества Open Data Science.
4. Призовой фонд в $100,000 разделили брутальный малазиец Kyle, команда Романа Соловьева и Артура Кузина, а также я и Сергей Мушинский.
5. По итогам были написаны блог-посты (мой пост на хабре, пост Артура на хабре, наш с Серегой пост на Kaggle), проведены выступления на митапах (мое выступление в Adroll, мое выстпление в H20.ai, выступление Артура в Yandex, выступление Евгения Некрасова в Mail.Ru Group), написан tech report на arxiv.

Организаторам понравилось качество предложенных решений, но не понравилось, сколько они отстегнули за это соревнование. В Каggle ушло $500k, в то время как призовые всего $100k.
Читать дальше →
Всего голосов 110: ↑109 и ↓1 +108
Просмотры 34K
Комментарии 28

Лекция Владимира Игловикова на тренировке Яндекса по машинному обучению

Блог компании Яндекс Ненормальное программирование *Спортивное программирование *Машинное обучение *
Скорее всего, вы слышали об авторе этой лекции. Владимир ternaus Игловиков занял второе место в британском Data Science Challenge, но организаторы конкурса не стали выплачивать ему денежный приз из-за его российского гражданства. Затем наши коллеги из Mail.Ru Group взяли выплату приза на себя, а Владимир, в свою очередь, попросил перечислить деньги в Российский Научный Фонд. История получила широкий охват в СМИ.

Спустя несколько недель Владимир выступил на одной из тренировок Яндекса по машинному обучению. Он рассказал о своём подходе к участию в конкурсах, о сути Data Science Challenge и о решении, которое позволило ему занять второе место.


Всего голосов 51: ↑46 и ↓5 +41
Просмотры 13K
Комментарии 6

Распознавание объектов с помощью PowerAI Vision

Блог компании IBM Облачные вычисления *Обработка изображений *Машинное обучение *
Туториал


Разработчики программного обеспечения уже несколько лет активно работают с библиотеками машинного обучения, решая задачи компьютерного зрения и обнаружения объектов. Но реализация таких задач (а каждую модель машинного обучения необходимо спроектировать, развернуть, собственно обучить, настроить и установить) обычно требует глубоких знаний и навыков. С новым продуктом IBM PowerAI Vision Вы можете этого избежать. Этот продукт предоставляет интерфейс, в котором можно обучать, настраивать и тестировать свою собственную модель, не углубляясь в детали реализации машинного обучения.

В этой инструкции я расскажу как использовать PowerAI Vision, чтобы обучить систему и создать готовый к использованию сервис REST API, который можно использовать для обнаружения и распознавания объектов в Ваших приложениях.
Подробная инструкция
Всего голосов 11: ↑11 и ↓0 +11
Просмотры 7.3K
Комментарии 3

Как разобраться в Tensorflow и не умереть, а даже научить чему-то машину

Разработка мобильных приложений *Разработка под Android *Машинное обучение *Искусственный интеллект
Из песочницы

Привет, Хабражители. Сегодняшний пост будет о том, как не затеряться в дебрях многообразия вариантов использования TensorFlow для машинного обучения и достигнуть своей цели. Статья рассчитана на то, что читатель знает основы принципов работы машинного обучения, но пока еще не пробовал это делать своими руками. В итоге мы получим работающее демо на Андроиде, которое кое-что распознает с довольно высокой точностью. Но обо всем по порядку.


Читать дальше →
Всего голосов 26: ↑26 и ↓0 +26
Просмотры 35K
Комментарии 15

Для чего и как мы скрываем госномера автомобилей в объявлениях Авито

Блог компании AvitoTech Python *Программирование *Алгоритмы *Машинное обучение *
Привет. В конце прошлого года мы стали автоматически скрывать номера автомобилей на фотографиях в карточках объявлений на Авито. О том, зачем мы это сделали, и какие есть способы решения таких задач, читайте в статье.

Hide my plate!
Hide my plate!
Всего голосов 105: ↑87 и ↓18 +69
Просмотры 85K
Комментарии 181

Как мы боремся с копированием контента, или первая adversarial attack в проде

Блог компании AvitoTech Программирование *Алгоритмы *Обработка изображений *Машинное обучение *

Привет.


Вы знали, что платформы для размещения объявлений часто копируют контент у конкурентов, чтобы увеличить количество объявлений у себя? Они делают это так: обзванивают продавцов и предлагают им разместиться на своей платформе. А иногда и вовсе копируют объявления без разрешения пользователей. Авито — популярная площадка, и мы часто сталкиваемся с такой недобросовестной конкуренцией. О том, как мы боремся с этим явлением, читайте под катом.


Читать дальше →
Всего голосов 228: ↑216 и ↓12 +204
Просмотры 55K
Комментарии 122

Издевательски точный, быстрый и легковесный поиск баркодов через семантическую сегментацию

Блог компании ABBYY Обработка изображений *Машинное обучение *Искусственный интеллект

Поиск объектов на изображениях? Имея обучающую выборку и минимальный набор знаний о нейросетях, любой студент сегодня может получить решение определенной точности. Однако большинство нейросетей, использующихся для решения этой задачи, достаточно глубокие, а соответственно, требуют много данных для обучения, сравнительно медленно работают на этапе inference (особенно если на устройстве отсутствует GPU), много весят и достаточно энергозатратны. Все вышеперечисленное может быть весьма критично в определенных случаях, в первую очередь, для мобильных приложений.


Баркоды — объекты с достаточно простой структурой. В ходе исследований у нас получилось с помощью сравнительно оригинального подхода искать такие простые объекты весьма точно (мы побили state-of-the-art) и достаточно быстро (real-time на среднем CPU). Плюс наш детектор очень легкий, имеющий всего 30к весов. О результатах нашего исследования мы и расскажем в этой статье.

Читать дальше →
Всего голосов 48: ↑47 и ↓1 +46
Просмотры 9.6K
Комментарии 10

Использование камеры Fish eye на Raspberry Pi 3: запуск предобученных DL моделей для компьютерного зрения

Робототехника
Добрый день,

в продолжение серии статей: первая и вторая об использовании fish eye камеры с Raspberry Pi 3 и ROS я бы хотел рассказать об использовании предобученных Deep Learning моделей для компьютерного зрения с камерой Fish eye на Raspberry Pi 3. Кому интересно, прошу под кат.
Читать дальше →
Всего голосов 4: ↑4 и ↓0 +4
Просмотры 3.5K
Комментарии 1

TensorRT 6.x.x.x — высокопроизводительный инференс для моделей глубокого обучения (Object Detection и Segmentation)

Блог компании Open Data Science Python *Обработка изображений *Машинное обучение *DevOps *
Туториал
image
Больно только в первый раз!

Всем привет! Дорогие друзья, в этой статье я хочу поделиться своим опытом использования TensorRT, RetinaNet на базе репозитория github.com/aidonchuk/retinanet-examples (это форк официальной репы от nvidia, который позволит начать использовать в продакшен оптимизированные модели в кратчайшие сроки). Пролистывая сообщения в каналах сообщества ods.ai, я сталкиваюсь с вопросами по использованию TensorRT, и в основном вопросы повторяются, поэтому я решил написать как можно более полное руководство по использованию быстрого инференса на основе TensorRT, RetinaNet, Unet и docker.
Читать дальше →
Всего голосов 57: ↑56 и ↓1 +55
Просмотры 15K
Комментарии 10

Видео с облачным детектором объектов на Raspberry Pi

Python *Обработка изображений *Облачные сервисы *Разработка на Raspberry Pi *Искусственный интеллект

Пролог


По сети сейчас гуляет видео — как автопилот Теслы видит дорогу.

У меня давно чесались руки транслировать видео, обогащенное детектором, да и в реальном времени.



Проблема в том, что транслировать видео я хочу с Raspberry, а производительность нейросетевого детектора на ней оставляет желать лучшего.
Читать дальше →
Всего голосов 14: ↑13 и ↓1 +12
Просмотры 12K
Комментарии 19

Распознавание объектов на android с помощью TensorFlow: от подготовки данных до запуска на устройстве

Блог компании red_mad_robot Разработка под Android *TensorFlow *
Туториал

Обучение нейросети распознаванию образов — долгий и ресурсоемкий процесс. Особенно когда под рукой есть только недорогой ноут, а не компьютер с мощной видеокартой. В этом случае на помощь придёт Google Colaboratory, которая предлагает совершенно бесплатно воспользоваться GPU уровня Tesla K80 (подробнее).


В этой статье описан процесс подготовки данных, обучения модели tensorflow в Google Colaboratory и её запуск на android устройстве.


Подготовка данных


В качестве примера попробуем обучить нейросеть распознавать белые игральные кости на черном фоне. Соответственно, для начала, надо создать набор данных, достаточный для обучения (пока остановимся на ~100 фото).


Всего голосов 18: ↑18 и ↓0 +18
Просмотры 17K
Комментарии 3

YOLOv4 – самая точная real-time нейронная сеть на датасете Microsoft COCO

Программирование *Обработка изображений *Машинное обучение *Искусственный интеллект
Darknet YOLOv4 быстрее и точнее, чем real-time нейронные сети Google TensorFlow EfficientDet и FaceBook Pytorch/Detectron RetinaNet/MaskRCNN.

Эта же статья на medium: medium
Код: github.com/AlexeyAB/darknet
Статья: arxiv.org/abs/2004.10934
Обсуждение YOLOv4-tiny 1770 FPS: www.reddit.com/r/MachineLearning/comments/hu7lyt/p_yolov4tiny_speed_1770_fps_tensorrtbatch4
Обсуждение: www.reddit.com/r/MachineLearning/comments/gydxzd/p_yolov4_the_most_accurate_realtime_neural


Мы покажем некоторые нюансы сравнения и использования нейронных сетей для обнаружения объектов.

Нашей целью было разработать алгоритм обнаружения объектов для использования в реальных продуктах, а не только двигать науку вперед. Точность нейросети YOLOv4 (608x608) – 43.5% AP / 65.7% AP50 Microsoft-COCO-testdev.

62 FPS – YOLOv4 (608x608 batch=1) on Tesla V100 – by using Darknet-framework
400 FPS – YOLOv4 (320x320 batch=4) on RTX 2080 Ti – by using TensorRT+tkDNN
32 FPS – YOLOv4 (416x416 batch=1) on Jetson AGX Xavier – by using TensorRT+tkDNN


Читать дальше →
Всего голосов 29: ↑28 и ↓1 +27
Просмотры 58K
Комментарии 37

«Breakout-YOLO»: знакомимся с шустрой object-detection моделью, играя в классический «Арканоид»

JavaScript *Программирование *Обработка изображений *Машинное обучение *
Из песочницы
🔥 Технотекст 2020


Всем привет! Весенний семестр для некоторых студентов 3-го курса ФУПМ МФТИ ознаменовался сдачей проектов по курсу «Методы оптимизации». Каждый должен был выделить интересную для себя тему (или придумать свою) и воплотить её в жизнь в виде кода, научной статьи, численного эксперимента или даже бота в Telegram.


Жёстких ограничений на выбор темы не было, поэтому можно было дать разгуляться фантазии. You Only Live Once! — воскликнул я, и решил использовать эту возможность, чтобы привнести немного огня в бессмертную классику.

Читать дальше →
Всего голосов 26: ↑26 и ↓0 +26
Просмотры 8.7K
Комментарии 7

Как работает Object Tracking на YOLO и DeepSort

Математика *Машинное обучение *Искусственный интеллект
Object Tracking — очень интересное направление, которое изучается и эволюционирует не первый десяток лет. Сейчас многие разработки в этой области построены на глубоком обучении, которое имеет преимущество над стандартными алгоритмами, так как нейронные сети могут аппроксимировать функции зачастую лучше.

Но как именно работает Object Tracking? Есть множество Deep Learning решений для этой задачи, и сегодня я хочу рассказать о распространенном решении и о математике, которая стоит за ним.

Итак, в этой статье я попробую простыми словами и формулами рассказать про:

  • YOLO — отличный object detector
  • Фильтры Калмана
  • Расстояние Махаланобиса
  • Deep SORT
Читать дальше →
Всего голосов 14: ↑14 и ↓0 +14
Просмотры 37K
Комментарии 3

Scaled YOLO v4 самая лучшая нейронная сеть для обнаружения объектов на датасете MS COCO

Программирование *Обработка изображений *Машинное обучение *Искусственный интеллект

Scaled YOLO v4 является самой лучшей нейронной сетью для обнаружения объектов — самой точной нейронной сетью (55.8% AP) на датасете Microsoft COCO среди всех опубликованных нейронных сетей на данный момент. А также является лучшей с точки зрения соотношения скорости к точности во всем диапазоне точности и скорости от 15 FPS до 1774 FPS. На данный момент это Top1 нейронная сеть для обнаружения объектов.

Scaled YOLO v4 обгоняет по точности нейронные сети:

  • Google EfficientDet D7x / DetectoRS or SpineNet-190 (self-trained on extra-data)
  • Amazon Cascade-RCNN ResNest200
  • Microsoft RepPoints v2
  • Facebook RetinaNet SpineNet-190


Мы показываем, что подходы YOLO и Cross-Stage-Partial (CSP) Network являются лучшими с точки зрения, как абсолютной точности, так и соотношения точности к скорости.

График Точности (вертикальная ось) и Задержки (горизонтальная ось) на GPU Tesla V100 (Volta) при batch=1 без использования TensorRT:

Читать дальше →
Всего голосов 25: ↑25 и ↓0 +25
Просмотры 17K
Комментарии 9

Пора избавляться от мышки или Hand Pose Estimation на базе LiDAR за 30 минут

Блог компании Open Data Science Python *Программирование *Машинное обучение *DIY или Сделай сам
Туториал
image

Всем привет! Пока киберпанк еще не настолько вошел в нашу жизнь, и нейроинтерфейсы далеки от идеала, первым этапом на пути к будущему манипуляторов могут стать LiDAR. Поэтому, чтобы не скучать на праздниках, я решил немного пофантазировать на тему средств управления компьютером и, предположительно, любым устройством, вплоть до экскаватора, космического корабля, дрона или кухонной плиты.
Всего голосов 84: ↑84 и ↓0 +84
Просмотры 29K
Комментарии 74

Обнаружение объектов с помощью YOLOv3 на Tensorflow 2.0

Python *Программирование *Машинное обучение *Искусственный интеллект TensorFlow *
Из песочницы
Перевод

До появления YOLO большинство способов обнаружения объектов пытались адаптировать классификаторы для детекции. В YOLO же, обнаружение объектов было сформулировано как задача регрессии на пространственно разделенных ограничивающих рамок (bounding boxes) и связанных с ними вероятностей классов.

В данной статье мы узнаем о системе YOLO Object Detection и как реализовать подобную систему в Tensorflow 2.0.

Читать далее
Всего голосов 8: ↑8 и ↓0 +8
Просмотры 20K
Комментарии 2

Detect it to pop it — используем “взрослые” инструменты Intel для решения “детской” задачи

Блог компании Intel Обработка изображений *Машинное обучение *Учебный процесс в IT Искусственный интеллект

Задачу обнаружения различных объектов сейчас модно решать на основе глубокого обучения. Но для этого нужно собрать и разметить датасет, сконструировать глубокую нейросеть, обучить ее и запустить “в продакшн”. И если недавно для всего этого приходилось самостоятельно писать код, то сейчас можно воспользоваться готовыми инструментами от опытных разработчиков. Мы воспользуемся CVAT для разметки датасета, OpenVINO Training Extensions для обучения модели и OpenVINO Object Detection Demo для ее инференса. И не напишем ни строчки кода (команды консоли не в счет).

Читать далее
Всего голосов 9: ↑8 и ↓1 +7
Просмотры 3.2K
Комментарии 3
1