Инженер Amazon создал систему машинного зрения, которая не дает коту проносить в дом трупы животных
На конференции Ignite Seattle Бен Хэмм из компании Amazon развлек и впечатлил аудиторию своим рассказом о самодельном технологическом решении для бытовой проблемы. Спикеру сильно досаждала привычка его кота Метрика приносить с ночных прогулок тушки убитых грызунов и птиц и раскладывать их на видных местах. Чтобы положить этому конец, он усовершенствовал дверцу, через которую Метрик попадает в дом, при помощи замка, камеры и трех моделей искусственного интеллекта, которые определяют, давать ли ему проход.
Автор разработки пояснил, что пришел к этой идее за неимением других вариантов — кот отказывается носить ошейники, а прогулки ему необходимы. Единственным выходом было автоматизировать процесс досмотра, чтобы ситуация оставалась под контролем, даже когда хозяин спит. Для этого требовалось, во-первых, сделать дверь автоматически закрывающейся, во-вторых, создать умную систему наблюдения, которая могла бы анализировать обстановку.
Первое, по словам спикера, не составило большого труда: он использовал плату Arduino и простой замок. Второе обернулось продолжительной работой по сбору данных и обучению алгоритмов машинного зрения. Хэмм установил над кошачьей дверцей камеру AWS DeepLens и за пару месяцев составил коллекцию из около 23 000 фотографий, фиксирующих разные состояния окружающей обстановки. Также, наблюдая за питомцем, он определил, что проход через дверцу занимает около двух секунд — соответственно, система должна была проводить анализ и при необходимости запускать механизм, закрывающий замок, где-то за секунду.
Хэмм разбил процесс анализа на три части; за каждую из них отвечала отдельная модель и для каждой была подобрана соответствующая выборка изображений. Первая модель определяет, есть ли вообще кот на кадрах, которые она получает с камеры в режиме реального времени. Если ответ утвердительный, вторая модель анализирует, в каком направлении он движется — выходит из дома или возвращается внутрь. Наконец, если кот идет по направлении к дверце, подключается третья модель, обученная распознавать, несет ли он добычу в зубах.
Если установлено, что кот пытается пробраться в дом с тушкой, система запирает дверцу и снова открывает проход только через пятнадцать минут — практика показала, что этого времени достаточно, чтобы Метрик пришел к нужным выводам. Одновременно хозяину отсыпается смс-сообщение с кадрами, на которых запечатлены доказательства. Вдобавок Хэмм запрограммировал систему так, что за каждую жертву с его карты переводится небольшая сумма в фонд Национального Одюбоновского общества, которое занимается защитой природой, в том числе и тех птиц, на которых часто охотятся домашние хищники.
На момент выступления система работала уже около пяти недель и проконтролировала более сотни прогулок. В общей сложности она допустила две ошибки: один раз не распознала проноса контрабанды и один раз, напротив, не пропустила Метрика внутрь без оснований. Автор отмечает, что, хотя разработка приспособлена строго для его дома и его ситуации, подготовленная выборка, возможно, в будущем пригодится и другим людям.
Обсуждая историю на интернет-площадках, многие припомнили, что с такой же проблемой двадцать лет назад боролся и другой программист. Спасаясь от щедрости своей кошки Фло, он оснастил ее кошачью дверцу сложным сооружением из прожектора и камеры. Принцип работы системы был очень похож на то, что придумал Хэмм. Благодаря установленному особым образом прожектору, на стену отбрасывалась четкая тень головы кошки в профиль: камера записывала это изображение, а компьютерная программа — сверяла с образцом. Таким образом, хотя развитие искусственного интеллекта делает решения более лаконичными, преемственность между поколениями котовладельцев с технологическим уклоном несомненна.