
Писать про программирование можно не только прозой, но и стихами. Последнее, конечно, случается не часто — скажем, в блоге Intel такое бывало чуть менее, чем никогда. Однако в порядке эксперимента сегодня мы решили позволить себе; как это получилось — решать вам. Итак...
В последнем квартале уходящего года,
А если быть точным, на прошлой неделе,
Разработчики Intel представили новый
Релиз OpenVINO toolkit на software.
Что нового сделано — обратитесь к changelog'ам,
Мне точным в деталях быть не дано,
Я в этом посте расскажу лишь немного:
Про зрение, Intel и малиновое вино.
***
OpenVINO по сути — набор инструментов,
Библиотек и примеров решения
С особым ускорением на железе Интела
Популярных задач компьютерного зрения.
Кто не слышал про computer vision -
Это область компьютерных наук,
Заставляющая понимать машину,
Подобно человеку, мир вокруг.
Источник информации, в основном, изображения,
А проблема — создать алгоритм
Для извлечения полезных признаков
И принятию решений по ним.
***
Первая в нашем мини-обзоре — библиотека OpenCV,
Как часто зовётся, традиционного
Машинного зрения и обучения,
Читающей с камеры и на экране рисующей,
Кросс-платформенной и на GitHub’е живущей,
Набравшая на момент написания 30502 звезды.
В пакете для Raspberry мы так же найдём
Публичную OpenCV, а с ней
NEON оптимизации, обёртки в Python,
GStreamer для камер и для окон GTK.

***
Вот уже лет семь на свете
Для решения наших задач
Применяют глубокие нейронные сети,
Те, что с учителем нужно обучать.
Caffe, PyTorch — всё это про тренинг,
Порой занимающим пару недель.
OpenVINO решает вторую проблему:
Запуск обученных сеток, как можно быстрей.
Из лучших решений для многих платформ,
Для известных сценариев, нужд и ресурсов,
В OpenVINO deep learning — отдельным движком,
С одним интерфейсом на разных устройствах.
***
Для работы у вас инструментария
Установите Raspbian 9 на Raspberry Pi,
Подключите Movidius стик, блок питания,
Проверьте что версия CPU не ниже семи.
Подробнее читайте в соответствующем гайде,
А в качестве демо предлагаю код,
Работающий с камерой и выключающий
По направлению взгляда светодиод.
Скачайте две сети: для лиц нахождения
И предсказаний головы положения,
Используйте USB камеру и обратите внимание,
Что в коде пин номер 2 по умолчанию.
***
Всем тем посвящается, кто увлеченно
Над нашим проектом работал весь год.
Пусть только ускоряется всё в наступающем,
OpenVINO на Raspberry — тот самый IoT!
import cv2 as cv from gpiozero import LED from math import cos, sin, pi winName = 'OpenVINO on Raspberry Pi' cv.namedWindow(winName, cv.WINDOW_NORMAL) faceDetectionNet = cv.dnn.readNet('face-detection-retail-0004.xml', 'face-detection-retail-0004.bin') headPoseNet = cv.dnn.readNet('head-pose-estimation-adas-0001.xml', 'head-pose-estimation-adas-0001.bin') faceDetectionNet.setPreferableTarget(cv.dnn.DNN_TARGET_MYRIAD) headPoseNet.setPreferableTarget(cv.dnn.DNN_TARGET_MYRIAD) cap = cv.VideoCapture(0) led = LED(2) led.on() while cv.waitKey(1) != 27: hasFrame, frame = cap.read() if not hasFrame: break frameHeight, frameWidth = frame.shape[0], frame.shape[1] # Detect faces on the image. blob = cv.dnn.blobFromImage(frame, size=(300, 300), ddepth=cv.CV_8U) faceDetectionNet.setInput(blob) detections = faceDetectionNet.forward() for detection in detections.reshape(-1, 7): confidence = float(detection[2]) if confidence > 0.5: xmin = int(detection[3] * frameWidth) ymin = int(detection[4] * frameHeight) xmax = int(detection[5] * frameWidth) ymax = int(detection[6] * frameHeight) xmax = max(1, min(xmax, frameWidth - 1)) ymax = max(1, min(ymax, frameHeight - 1)) xmin = max(0, min(xmin, xmax - 1)) ymin = max(0, min(ymin, ymax - 1)) # Run head pose estimation network. face = frame[ymin:ymax+1, xmin:xmax+1] blob = cv.dnn.blobFromImage(face, size=(60, 60), ddepth=cv.CV_8U) headPoseNet.setInput(blob) headPose = headPoseNet.forward(['angle_p_fc', 'angle_r_fc', 'angle_y_fc']) p, r, y = headPose[0][0], headPose[1][0], headPose[2][0] cos_r = cos(r * pi / 180) sin_r = sin(r * pi / 180) sin_y = sin(y * pi / 180) cos_y = cos(y * pi / 180) sin_p = sin(p * pi / 180) cos_p = cos(p * pi / 180) x = int((xmin + xmax) / 2) y = int((ymin + ymax) / 2) # center to right cv.line(frame, (x,y), (x+int(50*(cos_r*cos_y+sin_y*sin_p*sin_r)), y+int(50*cos_p*sin_r)), (0, 0, 255), thickness=3) # center to top cv.line(frame, (x, y), (x+int(50*(cos_r*sin_y*sin_p+cos_y*sin_r)), y-int(50*cos_p*cos_r)), (0, 255, 0), thickness=3) # center to forward cv.line(frame, (x, y), (x + int(50*sin_y*cos_p), y + int(50*sin_p)), (255, 0, 0), thickness=3) cv.rectangle(frame, (xmin, ymin), (xmax, ymax), (0, 255, 255)) if abs(cos_y * cos_p) > 0.9: cv.putText(frame, 'FORWARD', (0, 30), cv.FONT_HERSHEY_SIMPLEX, 1.0, (0, 255, 0), thickness=2) led.off() else: led.on() cv.imshow(winName, frame)
- Сеть для детектирования лиц:
- Сеть для оценки положения головы:
