Все потоки

Обработка изображений *

Работаем с фото и видео

СтатьиПостыНовостиАвторыКомпании

denis-19 23 июл 2019 в 08:35

Туристы помогают ученым оценить численность крупных хищников

3 мин

1.6K

Геоинформационные сервисы * Научно-популярноеОбработка изображений * Экология

Гражданско-добровольный мониторинг животных с помощью выданных путешественникам GPS-трекеров и анализа их фотографий оказался намного дешевле, чем использование фото- и аудио- ловушек.

Читать дальше →

+12

bodqhrohro 18 июл 2019 в 17:42

Безумный конвертер GIF'ок в анимированные стикеры для Telegram

5 мин

56K

Python * Обработка изображений *

Recovery Mode

Вместо тысячи слов...

xZibit тоже рад, ведь здесь GIF вставлены в стикеры, чтобы быть вставлеными в GIF для КДПВ!

А теперь о подробностях реализации.

Читать дальше →

+31

EdT 18 июл 2019 в 15:45

Опыт моделеварения от команды Computer Vision Mail.ru

15 мин

12K

Блог компании VKОбработка изображений * Машинное обучение * Искусственный интеллект

Меня зовут Эдуард Тянтов, я руковожу командой Computer Vision в Mail.ru Group. За несколько лет существования наша команда решила десятки задач компьютерного зрения, и сегодня расскажу вам о том, какие методики мы используем для успешного создания моделей машинного обучения, которые работают на широком спектре задач. Поделюсь трюками, которые могут ускорить получение модели на всех этапах: постановка задачи, подготовка данных, обучение и развертывание в продакшен.

Читать дальше →

+44

ContentAI_Team 17 июл 2019 в 12:09

Издевательски точный, быстрый и легковесный поиск баркодов через семантическую сегментацию

10 мин

11K

Блог компании Content AIОбработка изображений * Машинное обучение * Искусственный интеллект

Поиск объектов на изображениях? Имея обучающую выборку и минимальный набор знаний о нейросетях, любой студент сегодня может получить решение определенной точности. Однако большинство нейросетей, использующихся для решения этой задачи, достаточно глубокие, а соответственно, требуют много данных для обучения, сравнительно медленно работают на этапе inference (особенно если на устройстве отсутствует GPU), много весят и достаточно энергозатратны. Все вышеперечисленное может быть весьма критично в определенных случаях, в первую очередь, для мобильных приложений.

Баркоды — объекты с достаточно простой структурой. В ходе исследований у нас получилось с помощью сравнительно оригинального подхода искать такие простые объекты весьма точно (мы побили state-of-the-art) и достаточно быстро (real-time на среднем CPU). Плюс наш детектор очень легкий, имеющий всего 30к весов. О результатах нашего исследования мы и расскажем в этой статье.

Читать дальше →

+46

build_your_web 17 июл 2019 в 08:49

Нейросеть в стекле. Не требует электропитания, распознаёт цифры

2 мин

39K

Искусственный интеллектМашинное обучение * Научно-популярноеОбработка изображений *

Перевод

Все мы знакомы с такой способностью нейронных сетей, как распознавание рукописного текста. Основы этой технологии существуют уже много лет, но, лишь относительно недавно, скачок в области компьютерных мощностей и параллельной обработки данных позволили сделать из этой технологии очень практичное решение. Тем не менее, это практичное решение, в основе своей, будет представлено в виде цифрового компьютера многократно изменяющего биты, точно так же, как и при выполнении любой другой программы. Но в случае с нейронной сетью, разработанной исследователями из университетов Wisconsin, MIT, и Columbia, дело обстоит по-другому. Они создали стеклянную панель, не требующую собственного электропитания, но при этом способную распознавать рукописные цифры.

Читать дальше →

+117

p0b0rchy 16 июл 2019 в 12:00

Как мы обучили нейронную сеть классифицировать шурупы

10 мин

28K

Блог компании Конференции Олега Бунина (Онтико)Data Mining * Алгоритмы * Машинное обучение * Обработка изображений *

Нейронная сеть может опознать котика на фотографии, найти диван, улучшить видеозапись, нарисовать картинку из щенят или простого наброска. К этому мы уже привыкли. Новости о нейросетях появляются почти каждый день и стали обыденными. Компании Grid Dynamics поставили задачу не обыденную, а сложную — научить нейросеть находить специфический шуруп или болт в огромном каталоге интернет-магазина по одной фотографии. Задачка сложнее, чем найти котика.

Проблема интернет-магазина шурупов — в ассортименте. Тысячи или десятки тысяч моделей. У каждого шурупа свое описание и характеристики, поэтому на фильтры нет надежды. Что делать? Искать вручную или искать в гипермаркете на полках? В обоих случаях это потеря времени. В итоге клиент устанет и пойдет забивать гвоздь. Чтобы помочь ему, воспользуемся нейросетью. Если она может находить котиков или диваны, то пусть занимается чем-то полезным — подбирает шурупы и болты. Как научить нейросеть подбирать для пользователя шурупы быстро и точно, расскажем в расшифровке доклада Марии Мацкевичус, которая в компании Grid Dynamics занимается анализом данных и машинным обучением.

+80

zverolyub 11 июл 2019 в 15:06

Как распознать текст с фото: новые возможности фреймворка Vision

6 мин

9K

Блог компании Dodo EngineeringОбработка изображений * Программирование * Разработка мобильных приложений * iOS *

Перевод

Теперь фреймворк Vision умеет распознавать текст по-настоящему, а не как раньше. С нетерпением ждём, когда сможем применить это в Dodo IS. А пока перевод статьи о распознавании карточек из настольной игры Magic The Gathering и извлечении из них текстовой информации.

Читать дальше →

+18

izakharkin 10 июл 2019 в 12:54

Вижу, значит существую: обзор Deep Learning в Computer Vision (часть 2)

18 мин

43K

Блог компании Московский физико-технический институт (МФТИ)Искусственный интеллектМашинное обучение * Обработка изображений * Программирование *

Продолжаем постигать современную магию (компьютерное зрение). Часть 2 не значит, что нужно сначала читать часть 1. Часть 2 значит, что теперь всё серьёзно — мы хотим понять всю мощь нейросетей в зрении. Детектирование, трекинг, сегментация, оценка позы, распознавание действий… Самые модные и крутые архитектуры, сотни слоёв и десятки гениальных идей уже ждут вас под катом!

Читать дальше →

+27

denis-19 10 июл 2019 в 08:20

Агро-робот с ИИ научился аккуратно собирать с грядки только созревший салат

4 мин

9.1K

Обработка изображений * Научно-популярноеМашинное обучение * Искусственный интеллектРобототехника

Многие виды растений и сельхозкультур до сих пор собираются только вручную.

Инженеры из Кембриджского университета (Великобритания) создали рабочий прототип роботизированного сборщика урожая, способного самостоятельно распознавать готовые к срезанию неповрежденные кочаны салата, а также аккуратно их обрабатывать и собирать.

Читать дальше →

+28

DmitrySpb79 5 июл 2019 в 19:34

Преобразуем изображение в звук — что можно услышать?

5 мин

33K

Python * ЗвукНаучно-популярноеОбработка изображений * Программирование *

Привет Хабр.

В недавней публикации здесь на сайте описывалось устройство, позволяющее незрячим людям «видеть» изображение, преобразуя его с помощью звуковых волн. С технической точки зрения, в той статье не было никаких деталей вообще (~~а вдруг украдут идею за миллион~~), но сама концепция показалась интересной. Имея некоторый опыт обработки сигналов, я решил поэкспериментировать самостоятельно.

Что из этого получилось, подробности и примеры файлов под катом.

Читать дальше →

+20

PatientZero 3 июл 2019 в 07:17

Распознавание источников освещения на картах окружения

6 мин

3.3K

3D-графика * Обработка изображений * Алгоритмы * Python *

Перевод

В этой статье представлена реализация на Python алгоритма распознавания источников освещения на картах окружения (LDR или HDR) при помощи равнопромежуточной проекции (equirectangular projection). Однако после внесения незначительных изменений её также можно использовать с простыми фоновыми изображениями или кубическими картами. Примеры возможного применения алгоритма: программы трассировки лучей, в которых требуется распознавать первичные источники освещения для испускания из них лучей; в растеризованных рендерерах он может применяться для отбрасывания теней, использующих карту окружения; кроме того, алгоритм также можно применять в программах устранения засветов, например в AR.

Алгоритм состоит из следующих этапов:

Снижение разрешения исходного изображения, например, до 1024.
Преобразование изображения в яркость (luminance), при необходимости с размытием изображения.
Применение метода квази-Монте-Карло.
Преобразование из сферических координат в равнопромежуточные.
Фильтрация сэмплов на основании яркости соседа.
Сортировка сэмплов на основании их яркости.
Фильтрация сэмплов на основании евклидовой метрики.
Слияние сэмплов при помощи алгоритма Брезенхэма.
Вычисление позиции кластера освещения на основании его яркости.

Существует множество алгоритмов снижения разрешения изображений. Билинейная фильтрация — самый быстрый или простой в реализации, к тому же он лучше всего подходит в большинстве случаев. Для преобразования яркости и в LDR-, и HDR-изображениях можно использовать стандартную формулу:

  lum = img[:, :, 0] * 0.2126 + img[:, :, 1] * 0.7152 + img[:, :, 2] * 0.0722

Дополнительно можно применить к изображению яркости небольшое размытие, например, в 1-2 пикселя для изображения разрешением 1024, для устранения всех высокочастотных деталей (в частности, вызванных снижением разрешения).

Читать дальше →

+16

AndrewShmig 2 июл 2019 в 19:53

Погружение в свёрточные нейронные сети. Часть 5 / 10 — 18

27 мин

27K

Обработка изображений * Машинное обучение * Искусственный интеллектBig Data *

Полный курс на русском языке можно найти по этой ссылке.
Оригинальный курс на английском доступен по этой ссылке.

Выход новых лекций запланирован каждые 2-3 дня.

Читать дальше →

+9

denis-19 2 июл 2019 в 15:45

Инженер Amazon создал блокирующее устройство с ИИ, которое не пускает в дом кота с уличной добычей

2 мин

36K

DIY или Сделай самИскусственный интеллектМашинное обучение * Научно-популярноеОбработка изображений *

Инженер Amazon Бен Хэмм разработал умный блокиратор, который не дает его коту по кличке Метрик приносить внутрь дома пойманных охотничьими лапками и зубками и по факту уже мертвых птиц и крыс.

Читать дальше →

+78

gregpost 30 июн 2019 в 20:59

Автоматическая сегментация дыхательных органов

8 мин

8.4K

Блог компании InobitecАлгоритмы * Визуализация данных * Обработка изображений * 3D-графика *

Ручная сегментация легких занимает около 10 минут и требуется определенная сноровка, чтобы получить такой же качественный результат, как при автоматической сегментации. Автоматическая сегментация занимает около 15 секунд.

Я предполагал, что без нейронной сети удастся получить точность не выше 70%. Также я предполагал, что морфологические операции – это только подготовка изображения к более сложным алгоритмам. Но в результате обработки тех, хоть и немногочисленных 40 образцов томографических данных, что есть на руках, алгоритм выделил легкие без ошибок, причём после теста на первых пяти случаях алгоритм уже не претерпевал значительных изменений и с первого применения правильно отработал на остальных 35 исследованиях без изменения настроек.

Также нейронные сети имеют минус – для их обучения нужны сотни обучающих образцов лёгких, которые придётся размечать вручную.

Читать дальше →

+20

AndrewShmig 29 июн 2019 в 14:40

Погружение в свёрточные нейронные сети. Часть 5 / 1 — 9

19 мин

34K

Big Data * Искусственный интеллектМашинное обучение * Обработка изображений *

Полный курс на русском языке можно найти по этой ссылке.
Оригинальный курс на английском доступен по этой ссылке.

Выход новых лекций запланирован каждые 2-3 дня.

Читать дальше →

+26

denis-19 29 июн 2019 в 11:40

Ищем астероиды — проект «Hubble Asteroid Hunter»

2 мин

3.9K

АстрономияКосмонавтикаМашинное обучение * Научно-популярноеОбработка изображений *

Центр малых планет (Minor Planet Center, MPC) Смитсоновской астрофизической обсерватории (SAO) и аэрокосмическое агентство NASA запустили проект «Hubble Asteroid Hunter», с помощью которого любой глазастый пользователь компьютера или планшета может помочь астрономам найти треки новых астероидов и внести свой вклад в процесс обучения нейронной сети.

Читать дальше →

+26

MagisterLudi 28 июн 2019 в 21:48

У цветового треугольника не два, а один угол

16 мин

42K

Математика * МозгНаучно-популярноеНенормальное программирование * Обработка изображений *

Как увидеть цвет, которого в природе не бывает?

Четыре года назад на Хабре был пост с интересным и полезным видео «Как устроен цвет». Лектор — Дмитрий Николаев, заведующий сектором зрительных систем ИППИ РАН.

Я сделал расшифровку (в меру своего понимания материала), потому что считаю и тему важной и подачу — отличнейшей. Пока набирал текст, чуть не поменял своё φ(λ). Слово спикеру:

Поговорим о математике и геометрии цвета, о том, какие абстрактные структуры заложены в этом слове.

Что такое «цвет» не знает никто.

Цвет — это что-то, о чем говорит человек, наблюдающий и познающий мир с помощью глаза.

Глаз регистрирует какие-то свойства электромагнитного излучения, называемого светом, попадающего в глаз, преломляющегося на хрусталике, проецируемого на сетчатку. «Колбочки» регистрируют какие-то мощностные свойства. И дальше внезапно человек говорит о каком-то «цвете».

В физике нет цвета, а есть спектральные свойства излучения.

«Цвет» связан с относительным распределением спектральной энергии, мощности или потока излучения. (При прохождении через призму человек видит характерную «радугу».)

Совершенно точно, «цвет» — психологический феномен. Цвет — это ощущение, к объективной физике не имеющий отношения.

Мы можем говорить о цвете вещей — красная рубашка — «краснота» рубашки напрямую никак не связана с тем, какое излучение придет от этой рубашки в глаз.

+89

m1rko 28 июн 2019 в 14:44

Динамическое программирование в реальном мире: вырезание швов

14 мин

8K

Алгоритмы * Обработка изображений *

Перевод

У динамического программирования репутация метода, который вы изучаете в университете, а затем вспоминаете только на собеседованиях. Но на самом деле метод применим во многих ситуациях. По сути, это техника эффективного решения задач, которые можно разбить на множество сильно повторяющихся подзадач.

В статье я покажу интересное реальное применение динамического программирования — задача вырезания швов (seam carving). Задача и методика подробно описаны в работе Авидана и Шамира «Вырезание швов для изменения размеров изображения с учётом контента» (статья в свободном доступе).

Эта одна из серии статей по динамическому программированию. Если хотите освежить в памяти методы, см. иллюстрированное введение в динамическое программирование.

Читать дальше →

+22

p0b0rchy 27 июн 2019 в 15:28

Используем данные на практике

7 мин

3.1K

Блог компании Конференции Олега Бунина (Онтико)Обработка изображений * Машинное обучение * КонференцииАлгоритмы *

Между идеальным алгоритмом машинного обучения в вакууме и его применением на реальных данных часто лежит пропасть. Вроде бы берешь статью: алгоритм есть, сходимость для данных такого-то типа есть — бери и применяй. Но почему-то оказывается, что твоих данных недостаточно для обучения, да и отличаются они от модельных из статьи, потому что настоящие, не синтетические.

Обычное дело в обосновании алгоритма ввести допущения о чистоте данных и их распределении, которых в реальной жизни не найдёшь. Например, автор статьи экспериментирует на фотографиях взрослых знаменитостей, и все у него замечательно распознается и классифицируется, а в нашем реальном примере попадаются еще и дети, и мультяшные персонажи, и на них всё внезапно ломается. Но есть люди, которые умеют с этим справляться, да так, что пропасть между теорией и практикой перестает казаться неприступной, и, стоит показать как, сразу находятся и другие желающие ее преодолеть.

Читать дальше →

+21

Stantin 27 июн 2019 в 04:12

Распознавание дороги посредством семантической сегментации

4 мин

10K

Искусственный интеллектМашинное обучение * Обработка изображений * Raspberry Pi * Робототехника

В предыдущей серии я проводил эксперимент с автономным движением своего домашнего танка. Дорога распознавалась с помощью цветового фильтра, а полученная маска шла на вход специально обученной нейросети-классификатору, которая выбирала ехать вправо, влево или прямо.

Слабым местом было распознавание самого дорожного полотна из-за переменчивости цветовых оттенков, из-за чего нейросеть, принимающая решения, выдавала странные результаты. В комментариях к той статье рекомендовали обратить внимание на семантическую сегментацию. Тема оказалась перспективной и применение сегментирующей нейросети принесло свои плюсы, но и минусы, куда же без них.

Но обо всем по порядку и для начала немного матчасти.

Читать дальше →

+13

1 2 ...

62

63 64 ...