Pull to refresh
26
0
Send message

Deconvolutional Neural Network

Reading time9 min
Views61K
Использование классических нейронных сетей для распознавания изображений затруднено, как правило, большой размерностью вектора входных значений нейронной сети, большим количеством нейронов в промежуточных слоях и, как следствие, большими затратами вычислительных ресурсов на обучение и вычисление сети. Сверточным нейронным сетям в меньшей степени присущи описанные выше недостатки.

Свёрточная нейронная сеть (англ. convolutional neural network, CNN) — специальная архитектура искусственных нейронных сетей, предложенная Яном Лекуном и нацеленная на эффективное распознавание изображений, входит в состав технологий глубокого обучения (англ. deep leaning). Эта технология построена по аналогии с принципами работы зрительной коры головного мозга, в которой были открыты так называемые простые клетки, реагирующие на прямые линии под разными углами, и сложные клетки, реакция которых связана с активацией определённого набора простых клеток. Таким образом, идея сверточных нейронных сетей заключается в чередовании сверточных слоев (англ. convolution layers) и субдискретизирующих слоев (англ. subsampling layers, слоёв подвыборки).[6]

image
Рис 1. Архитектура сверточной нейронной сети

Ключевым моментом в понимании сверточных нейронных сетей является понятие так называемых «разделяемых» весов, т.е. часть нейронов некоторого рассматриваемого слоя нейронной сети может использовать одни и те же весовые коэффициенты. Нейроны, использующие одни и те же веса, объединяются в карты признаков (feature maps), а каждый нейрон карты признаков связан с частью нейронов предыдущего слоя. При вычислении сети получается, что каждый нейрон выполняет свертку (операцию конволюции) некоторой области предыдущего слоя (определяемой множеством нейронов, связанных с данным нейроном). Слои нейронной сети, построенные описанным образом, называются сверточными слоями. Помимо, сверточных слоев в сверточной нейронной сети могут быть слои субдискретизации (выполняющие функции уменьшения размерности пространства карт признаков) и полносвязные слои (выходной слой, как правило, всегда полносвязный). Все три вида слоев могут чередоваться в произвольном порядке, что позволяет составлять карты признаков из карт признаков, а это на практике означает способность распознавания сложных иерархий признаков [3].

Что же именно влияет на качество распознавания образов при обучении сверточных нейронных сетей? Озадачившись данным вопросом, наткнулись на статью Мэттью Зайлера (Matthew Zeiler).
Читать дальше →
Total votes 20: ↑18 and ↓2+16
Comments0

Система автоматической оценки возраста по изображениям лиц

Reading time21 min
Views20K
Аннотация
Люди — это самые важные объекты слежения в системах видеонаблюдения. Тем не менее, слежение за человеком само по себе не дает достаточной информации об его мотивах, намерениях, желаниях и т.п. В этой работе мы представляем новую и надежную систему для автоматической оценки возраста с помощью технологий компьютерного зрения. Она использует глобальные особенности лица, полученные на основе комбинирования вейвлетов Габора и сохранение ортогональности локальных проекций Orthogonal Locality Preserving Projections, OLPP). Кроме того, система способна оценивать возраст по изображениям в реальном времени. Это означает, что предлагаемая система имеет больший потенциал по сравнению с другими полуавтоматическими системами. Результаты, полученные в процессе применения предлагаемого подхода, могут позволить получить более ясное понимание алгоритмов в области оценки возраста, необходимых для разработки приложений, актуальных для реального применения.
Ключевые слова: вейвлеты Габора, изображение лица, оценка возраста, метод опорных векторов (Support Vector Machine, SVM).
Читать дальше →
Total votes 26: ↑22 and ↓4+18
Comments3

Развертывание IBM Security Network Protection в Open vSwitch

Reading time16 min
Views5.5K
Всем хаброжителям доброго времени суток!

В этой статье вы сможете узнать, как настроить IBM Security Network Protection (XGS5100) в основанной на Open vSwitch программно-конфигурируемой сети(SDN), и защитить-таки все ваши виртуальные активы.

Open vSwitch — это виртуальный коммутатор на основе OpenFlow, широко используемый в облачных средах.

Software-defined Networking (SDN) — это технология для развертывания облака, обеспечивающая масштабируемую и гибкую среду, подходящую для динамического характера этого самого облака.

Вы научитесь разворачивать IBM Security Network Protection (ISNP) в рамках OpenFlow с поддержкой SDN коммутатора — Open vSwitch и увидите как легко ISNP могут быть развернуты в среде SDN.
image
Читать дальше →
Total votes 3: ↑2 and ↓1+1
Comments1

Kúla — 3D для всех камер

Reading time3 min
Views5.6K
Доброго времени суток!

Íris Ólafsdóttir—инженер-электрик из Технического университета Дании основала Kúla в 2011 году, и с тех пор усердно трудилась над превращением обычной камеры в 3D, на радость всем фотографам. В итоге, собранная ею команда разработчиков создала любопытную парочку объективов — Kúla Deeper, который без труда крепится к вашей DSLR камере и Kúla Bebe, для вашего смартфона.


Читать дальше →
Total votes 13: ↑13 and ↓0+13
Comments7

Максимально реалистичная анимация

Reading time2 min
Views90K
Цифровое будущее, виртуальная реальность, анимация объектов, настолько качественная, что недолго и с реальностью спутать.
Еще недавно все это казалось невозможным. Мы сидели дома и рубились в примитивные компьютерные игры с не менее примитивной компьютерной графикой, такие как Mario, Doom, Dune и Lemmings. Да-да, мой юный друг! Были такие игры в 90-х годах, где фон был прорисован из рук вон плохо, а разрешение картинки было настолько мало, что все персонажи и плохо прорисованный фон в том числе, были разбиты, мягко говоря, на без труда видимые человеческому глазу пиксели.


Игра Doom (1993)
Читать дальше →
Total votes 87: ↑84 and ↓3+81
Comments58

Разработан алгоритм, эффективно удаляющий из видео все «скучные» фрагменты

Reading time2 min
Views18K
Приходилось ли вам, перейдя по ссылке на интересный видеоролик на Youtube, обнаруживать, что ради нескольких секунд, где действительно происходит что-то интересное, вы только что потратили нескольк минут на созерцание совершенно бесполезного «мусора» только потому, что автор видео выложил целиком файл с видеорегистратора или смартфона? Количество видеокамер стремительно растёт, а количество людей, способных хотя бы обрезать пару лишних фрагментов, похоже, остаётся постоянным. И проблема не только в нескольких минутах убитого в интернете времени — ведь есть и более серьёзные случаи, например, десятки и сотни часов видео с камер наблюдения, которые иногда приходится просматривать, чтобы раскрыть преступление.

Учёные из университета Карнеги-Меллон разработали эффективный алгоритм выделения наиболее интересных фрагментов видео на основе машинного обучения. Новый алгоритм, названный ими «LiveLight» значительно превосходит аналоги по скорости и качеству работы. LiveLight выделяет характерные фрагменты видео и сотавляет их «словарь», а затем пытается предсказать на их основе следующий кадр. Если это удаётся с достаточной степенью точности, то это значит, что кадр не добавляет практически никакой новой информации и его можно исключить. В отличие от «механических» подходов, реагирующих на любое движение в кадре либо резкое изменение яркости, цвета или контраста, LiveLight достаточно универсален — он хорошо работает и на видео, снятым неподвижной камерой, и на любительской съемке трясущимся смартфоном.


Читать дальше →
Total votes 62: ↑53 and ↓9+44
Comments36

Налобный фонарь, питание которого осуществляется за счет тепла человеческого тела

Reading time3 min
Views13K
Анна Макосински, молодой изобретатель, удостоенная награды за изобретение термоэлектрического фонарика, продемонстрировала новую версию своего изобретения: налобный фонарик, работающий от тепла человеческого тела.


Читать дальше →
Total votes 8: ↑4 and ↓40
Comments22

GPS-навигатор в фонарике

Reading time2 min
Views23K
Изучая тему замены дисплея любой поверхностью наткнулись на одну интересную вещичку, и не найдя ее освещения на Хабре, решили вам ее представить. Знакомьтесь, ваш проводник и верный помощник в путешествии — Maptor.


Читать дальше →
Total votes 33: ↑24 and ↓9+15
Comments28

Билд-светофор: история еще одного внедрения

Reading time6 min
Views18K
Обсуждая реализацию автотестирования в нашей компании, была предложена идея визуализации результатов с помощью светофора. Данный инструмент прост и понятен каждому, да и к тому же производит небольшой вау эффект. Под катом будет история внедрения светофора в нашу систему автотестов.


Читать дальше →
Total votes 41: ↑32 and ↓9+23
Comments8

Соревнования по распознаванию изображений ImageNet 2013

Reading time3 min
Views15K
В декабре 2013 завершились ежегодные соревнования по распознаванию визуальных образов ImageNet Large Scale Visual Recognition Challenge 2013 (ILSVRC2013), спонсируемые проектом ImageNet , который представляет собой огромную базу изображений. В настоящее время в базе имеется более 14 миллионов изображений.
Участники соревнований решали три задачи, описанные под катом.
Читать дальше →
Total votes 20: ↑19 and ↓1+18
Comments8

В MIT разработали недорогую 3D-камеру, способную видеть сквозь полупрозрачные объекты

Reading time2 min
Views14K


Существующие сегодня 3D-сенсоры, основанные на измерении времени прохождения луча света, подобные Kinect, могут довольно неплохо составлять карту глубин изображения, если в сцене нет полупрозрачных и отражающих поверхностей, преломляющих и искажающих путь световых лучей. Дождь, струи воды, туман или предметы из стекла или прозрачного пластика просто заслоняют более далёкие объекты, так как сенсор распознаёт только самое первое отражение сигнала.

На конференции Siggraph Asia, которая прошла в Гонконге на прошлой неделе, учёные из MIT Media Lab представили новую разработку, основанную на том же принципе. В ней используется обычный лазерный диод и недорогой сенсор. Стоимость оборудования составила всего лишь порядка 500 долларов. Единственное существенное отличие прототипа от коммерческих аналогов, таких как Kinect, заключается в прошивке.

Вместо простой периодической модуляции импульсов инфракрасного лазера, прототип MIT использует специально подобранные последовательности импульсов, имеющие автокорреляционную функцию с очень узким единичным пиком (такие сигналы используются в эхолокации и телекоммуникациях для точного измерения времени задержки сигнала. Более подробно о них можно почитать в статье "Основные принципы цифровой беспроводной связи. Ликбез", в разделе «Автокорреляционная функция. Коды Баркера»). Камера хорошо различает первые отражения от поверхности прозрачного предмета и следующие за ними отражения от более далёких объектов. Она даже способна получить чёткое изображение надписи, закрытой матовым экраном.
Читать дальше →
Total votes 19: ↑16 and ↓3+13
Comments16

Технологии становятся ближе к телу

Reading time4 min
Views11K
С тех пор, как Google анонсировала очки дополненной реальности Glass многие производители начали всерьез интересоваться нательными гаджетами.

Как утверждают аналитики компании Markets and Markets нательная электроника станет новым большим прорывом в области вычислительной техники, создав новую волну электронных гаджетов, аналогичную глобальной смартфонной революции.

С чего все начиналось…

Сегменту wearable computers (подстрочник с английского «надеваемые компьютеры») два десятка лет. Отцом нательных компьютеров считается профессор Торонтского университета Стив Манн (Steve Mann). В 1970-х и 80-х годах он создал несколько нательных систем общего пользования, включая устройства считывания, биологической обратной связи и мультимедиа. В 1981 году он разработал мультимедийную компьютерную систему для крепления на спину с наголовным дисплеем для одного глаза. С тех пор Манн каждый день носит какой-нибудь нательный компьютер.
Читать дальше →
Total votes 6: ↑4 and ↓2+2
Comments1

72-мегапиксельная камера-мяч снимает 360-градусные панорамы в полёте

Reading time2 min
Views21K
Камера-мяч, которой можно снимать сферические панорамы, просто подбросив её в воздух, делает снимок в самой верхней точке траектории, ориентируясь на встроенные акселерометры. Прототип такой камеры был представлен ещё два года назад. Теперь она доведена до стадии серийного продукта — кампания по сбору средств идёт на IndieGoGo

Камера, названная Panono, имеет ударопрочный пластиковый корпус, резьбу для крепления на штатив и кнопку спуска — её можно использовать в трёх режимах: бросая вверх, управляя дистанционно со смартфона, установив на штатив или другое крепление, и просто держа в руках, если не нужна 360-градусная панорама.


Читать дальше →
Total votes 29: ↑26 and ↓3+23
Comments35

Погрешности сенсоров позволяют сопоставить с каждым смартфоном индивидуальный «отпечаток»

Reading time2 min
Views15K
Возможности для слежки за пользователями интернета не ограничиваются cookies и логами провайдера или оператора сотовой сети. Любой сайт может легко получить доступ к информации о версиях браузера и ОС клиента, установленных плагинах, разрешении экрана и так далее. Совокупность этой информации даёт возможность узнавать конкретного клиента из миллионов других. Для смартфонов эта проблема стоит ещё острее — характеристики их железа гораздо богаче за счёт большого числа датчиков — микрофонов, камер, акселерометров, гироскопов, магнитометров.

Христо Божинов из Стэнфордского университета продемонстрировал, что микроскопические отличия в показаниях акселерометра смартфона достаточно индивидуальны и позволяют отличить его от тысяч других. Причём эти показания могут быть доступны любому сайту в интернете. Для проверки концепции и сбора статистики Божинов создал сайт sensor-id.com, зайдя на который со смартфона, можно узнать, доступны ли данные вашего акселерометра для JavaScript, и если да, насколько индивидуален ваш смартфон. По словам Божинова, выделить индивидуальный «отпечаток» датчика можно даже из весьма шумного сигнала, например, пока смартфон болтается в кармане.

image
Различия в показаниях акселерометров в состоянии покоя для 16 смартфонов
Читать дальше →
Total votes 49: ↑46 and ↓3+43
Comments14

Один датчик, чтоб править всеми

Reading time2 min
Views16K
Проект интеллектуального датчика Neurio, который за две недели до окончания кампании на Кикстартере уже превысил план на 40 000 долларов, основан на необычном подходе к управлению умным домом. В основе Neurio лежит очень точный и подробный анализ энергопотребления. Умный счётчик похож на обычный электронный счётчик электроэнергии, но фиксирует гораздо больше параметров, и делает это точнее и чаще, чем обычный. Эти данные отправляются в облако и там анализируются алгоритмами искусственного интеллекта, которые достаточно уверенно распознают отдельных потребителей электричества по характерному для них «почерку».



Это возможно благодаря тому, что датчик Neurio измеряет в двух независимых двухсторонних каналах не только активную мощность, но и реактивную мощность, коэффициент мощности, напряжение, ток, и частоту. Данные обновляются один раз в секунду и передаются в домашнюю сеть по WiFi. На случай потери связи есть внутренняя память, которой хватает на год непрерывной записи.
Читать дальше →
Total votes 14: ↑13 and ↓1+12
Comments14

Проблемы с потоками. Эдвард А. Ли

Reading time33 min
Views25K

Аннотация


Потоки являются прямой адаптацией доминирующей сейчас последовательной модели вычислений к параллельным системам. Языки программирования не требуют (или требуют совсем немного) изменений в синтаксисе, чтобы поддерживать потоки, а операционные системы и архитектуры непрерывно развиваются, чтобы повысить эффективность их использования. Многие технологи (инженеры) стремятся интенсивно использовать многопоточность в программном обеспечении и ожидают получить значительное (предсказанное) увеличение производительности. В этой работе я доказываю, что это не очень хорошая идея. Хотя использование потоков кажется небольшим шагом от последовательных вычислений, фактически, это огромный шаг. Использование потоков разрушает такие неотъемлемые свойства последовательных вычислений как: понятность, предсказуемость и определенность (детерминированность). Потоки, как модель вычислений, являются очень недетерминированными, а работа программ также становится неопределенной. Хотя многие исследованные техники улучшают модель вычислений за счет более эффективного сокращения неопределенности, я доказываю, что они не решают проблему полностью. Вместо того, чтобы сокращать неопределенность, мы должны строить модель вычислений исходя из полного детерминизма во взаимодействии программных компонентов. Неопределенность должна явно и аккуратно вводиться туда, где есть в этом необходимость, вместо того, чтобы удаляться там, где нет необходимости. Я доказываю преимущество разработки параллельных языков координации компонентов. Я верю, что такие языки будут гораздо более надежны, а программы будут более распараллеленные.
Читать дальше →
Total votes 43: ↑38 and ↓5+33
Comments7

Open Reflex: зеркальный фотоаппарат, напечатанный на 3D-принтере

Reading time2 min
Views61K


250 грамм пластика ABS для 3D-печати, несколько винтов и гаек, маленькое зеркальце, магниты, кусочки листового пластика, черный герметик, а также 3D-принтер и режущий плоттер, стеклорез, отвёртки и наждачная бумага — вот практически полный набор материалов и инструментов, с помощью которых можно соорудить 35-миллиметровый плёночный зеркальный фотоаппарат Open Reflex.

Чертежи деталей и подробная инструкция по сборке опубликованы на сайте instructables под лицензией Creative Commons — фотоаппарат на 100% Open Source. По словам автора проекта, французского дизайнера и хакера Лео Мариуса, на печать и сборку аппарата уходит около 15 часов. Общая стоимость материалов для создания фотоаппарата — порядка 30 долларов.
Читать дальше →
Total votes 75: ↑68 and ↓7+61
Comments30
1

Information

Rating
Does not participate
Registered
Activity