Обработка изображений *

Работаем с фото и видео

СтатьиПостыНовостиАвторыКомпании

KirillMih 22 мар 2023 в 11:09

О работе с персональными данными в «Ситимобил» спустя 2.5 месяца после утечки – взгляд пользователя

Простой

4 мин

4.9K

Информационная безопасность*Облачные сервисы*Обработка изображений*Хранение данных*

Из песочницы

Recovery Mode

В этой статье будет рассмотренно продолжение известной по прошлому году истории о подходе к обработке персданных в «Ситимобил». Напомню, 23 декабря 2022 года стало известно об утечке данных водителей «Ситимобил». Компания признала факт утечки, уведомила Роскомнадзор, принесла извинения водителям и заявила о проведении внутреннего расследования. Среди многочисленных утечек (а всего по данным Роскомнадзора в 2022 было зафиксировано порядка 150 крупных утечек персональных данных) утечка у «Ситимобил» отличалась тем, что в открытый доступ попали не просто персданные, а изображения паспортов водителей.

На сегодняшний день информации о назначении штрафа компании еще нет. Но мне кажется, что при его назначении учтут, что в этой утечке были изображения паспортов и, как показано вот здесь изображения селфи водителей с паспортом одновременно. Не знаю можно ли фото, на котором есть и паспорт, и лицо крупным планом, классифицировать как биометрию, но очевидно, что с таким фото возможностей для нанесения ущерба водителю становится сильно больше.

В этой заметке я хочу показать свой взгляд пользователя на то, как происходит обработка изображений паспортов и персданных водителей в «Ситимобил» через 2.5 месяца после утечки.

+22

ZlodeiBaal 15 сен 2022 в 17:21

Как выбрать плату для Computer Vision в 2022

6 мин

12K

Блог компании RecognitorОбработка изображений*Машинное обучение*Компьютерное железоDIY или Сделай сам

Выбор платформы для работы с Computer Vision on the Edge - непростая задача. На рынке десятки плат. И одна другой краше. Но на практике все оказывается не так хорошо.
Я попробовал сравнить дешевые платы которые есть на рынке. И сделал это не только в по скорости. Я попробовал сравнить платформы по “удобству” их использования. Насколько просто будет портировать сети, насколько хорошая поддержка. И насколько просто работать. И актуализировал это для 2022 года (один и тот же Coral из 2020 и из 2022 - две разные платы).

+22

19blackadder97 8 янв 2022 в 18:13

ViT — на кухне фаворит

15 мин

17K

Обработка изображений*Машинное обучение*

Прошедший 2021-й год ознаменовался настоящей революцией в области компьютерного зрения.

Трансформеры, подобно новым штамма Ковида, вытеснившие конкурентов в области обработки естественного языка (NLP) и задачах, связанных с обработкой звука, добрались и до компьютерного зрения.

Сверточные сети, чье место на Олимпе в различных бенчмарках компьютерного зрения и первые места в топах на PapersWithCode казались незыблемы (в том смысле, что против лома нет приема, если нет другого лома) были сброшены с них рядом архитектур частично или полностью основанных на механизме внимания.

В данном обзоре я хотел бы рассказать о нескольких самых ярких прорывах и идеях в совершенствовании архитектур и обучении ViT-ов (Visual Transformers).

+22

qwertyforce 16 сен 2021 в 12:41

Фотогалерея на максималках

20 мин

11K

Python*JavaScript*Обработка изображений*Машинное обучение*Искусственный интеллект

~1 год назад я начал разрабатывать свою фотогалерею (~~песочницу для теста всяких технологий~~). Данная статья – это описание её архитектуры, а также различные твики/лайфхаки/микрогайды которые я узнал за время разработки + немного про производительность.

+22

Dmitry_Po 20 июл 2021 в 13:11

Алгоритм коррекции геометрических искажений, вносимых объективом «рыбий глаз» в изображения и видео

4 мин

9.3K

Математика*Обработка изображений*Алгоритмы*Работа с видео*

Туториал

Из песочницы

Перевод

Рассматривается новый алгоритм коррекции геометрических искажений, вносимых объективом "рыбий глаз" в изображения и видео. Этот алгоритм позволяет осуществлять более точную коррекцию дисторсии при меньших потерях информации на краях изображений и видеокадров по сравнению с широко распространенным методом Brown-Conrady.

Алгоритм разработан при реализации одного из проектов компании Оксаджайл (Oxagile)

+22

belgraviton 15 июн 2020 в 14:00

Рубрика «Читаем статьи за вас». Май 2020. Часть 1

14 мин

4.8K

Блог компании Open Data ScienceОбработка изображений*Машинное обучение*Математика*Алгоритмы*

Привет, Хабр! Продолжаем публиковать рецензии на научные статьи от членов сообщества Open Data Science из канала #article_essense. Хотите получать их раньше всех — вступайте в сообщество!

Статьи на сегодня:

Efficient Document Re-Ranking for Transformers by Precomputing Term Representations; EARL: Speedup Transformer-based Rankers with Pre-computed Representation (2020)
MakeItTalk: Speaker-Aware Talking Head Animation (Adobe, University of Massachusetts Amherst, Huya, 2020)
Jukebox: A Generative Model for Music (OpenAI, 2020)
Recipes for building an open-domain chatbot (Facebook AI Research, 2020)
One-Shot Object Detection without Fine-Tuning (HKUST, Hong Kong, Tencent, 2020)
f-BRS: Rethinking Backpropagating Refinement for Interactive Segmentation (Samsung AI Center, Moscow, 2020)
Flowtron: an Autoregressive Flow-based Generative Network for Text-to-Speech Synthesis (NVIDIA, 2020)

Читать дальше →

+22

ErmIg 6 ноя 2019 в 12:13

Сверточный слой: методы оптимизации основанные на матричном умножении

9 мин

14K

C++*Алгоритмы*Машинное обучение*Обработка изображений*

Введение

Данная статья является продолжением серии статей описывающей алгоритмы лежащие в основе
Synet — фреймворка для запуска предварительно обученных нейронных сетей на CPU.

Если смотреть на распределение процессорного времени, которое тратится на прямое распространение сигнала в нейронных сетях, то окажется что зачастую более 90% всего времени тратится в свёрточных слоях. Поэтому если мы хотим получить быстрый алгоритм для нейронной сети – нам нужен, прежде всего, быстрый алгоритм для свёрточного слоя. В настоящей статье я хочу описать методы оптимизации прямого распространения сигнала в свёрточном слое. Причем начать хочется с наиболее широко распространенных методов, основанных на матричном умножении. Изложение я буду стараться вести в максимально доступной форме, чтобы статья была интересна не только специалистам (они и так про это все знают), но и более широкому кругу читателей. Я не претендую на полноту обзора, так что любые замечания и дополнения только приветствуются.

Читать дальше →

+22

arttom 5 сен 2019 в 10:20

Мунк в эквидистантной развертке и Мейерхольд, разрушивший Красную площадь — Денис Семенов о VR-искусстве

11 мин

AR и VRОбработка изображений*Работа с видео*Развитие стартапаРазработка под AR и VR*

Первые американские горки в VR многим делят жизнь на до и после. Тяжелая неудобная штуковина на голове, низкое разрешения и ужасная графика — нагло обманывают мозг и выбивают пол из под ног. Страшно представить, что будет, когда VR станет фотореалистичным. Но пока индустрия развивается не так быстро, как ей пророчили на старте. Многим кажется, что VR это только аттракционы.

На самом деле это площадка даже для современного искусства.

Художник Денис Семенов работает с виртуальной реальностью уже пять лет и иногда проводит в ней по 8 часов несколько дней подряд, перенося в VR картины Мунка, Петрова-Водкина и других художников. Его работы участвуют в фестивалях в Каннах, Висбадене, Берлине, Стокгольме и Нью-Йорке.

В рамках подготовки к фестивалю современного искусства ARTLIFE FEST Денис рассказал мне, как создаются VR-экспириенсы без мыши, клавиатуры и 3D-редакторов, как связаны технологии и искусство и что общего между художниками и стартаперами.

+22

mkrentovskiy 27 авг 2019 в 13:48

Распознавание лиц на коленно-прикладном уровне

7 мин

16K

DIY или Сделай самОбработка изображений*Работа с видео*

В общем и целом, распознавание лиц и идентификация людей по их результатам выглядит для аксакалов как подростковый секс — все о нем много говорят, но мало кто практикует. Понятно, что мы уже не удивляемся, что после загрузки фоточки с дружеских посиделок Facebook/VK предлагает отметить обнаруженных на снимке персон, но тут мы интуитивно знаем, что у соцсетей есть хорошее подспорье в виде графа связей персоны. А если такого графа нет? Впрочем, начнем по порядку.

Какой-то черт прется в дверь с коробкой

Читать дальше →

+22

m1rko 28 июн 2019 в 17:44

Динамическое программирование в реальном мире: вырезание швов

14 мин

7.9K

Обработка изображений*Алгоритмы*

Перевод

У динамического программирования репутация метода, который вы изучаете в университете, а затем вспоминаете только на собеседованиях. Но на самом деле метод применим во многих ситуациях. По сути, это техника эффективного решения задач, которые можно разбить на множество сильно повторяющихся подзадач.

В статье я покажу интересное реальное применение динамического программирования — задача вырезания швов (seam carving). Задача и методика подробно описаны в работе Авидана и Шамира «Вырезание швов для изменения размеров изображения с учётом контента» (статья в свободном доступе).

Эта одна из серии статей по динамическому программированию. Если хотите освежить в памяти методы, см. иллюстрированное введение в динамическое программирование.

Читать дальше →

+22

alex_minochkina 18 дек 2018 в 19:47

Верификация фотографий в ритейле с помощью Computer vision

4 мин

7.8K

Блог компании Т-БанкМашинное обучение*Обработка изображений*

Вступление

В рамках программы кредитования банк сотрудничает со многими розничными магазинами.
Одним из ключевых элементов заявки на кредит является фотография заемщика – агент магазина-партнера фотографирует покупателя; такая фотография попадает в «личное дело» клиента и используется в дальнейшем как один из способов подтверждения его присутствия на точке в момент подачи заявки на кредит.

К сожалению, всегда существует риск недобросовестного поведения агента, который может передавать в банк недостоверные фотографии – например, снимки клиентов из социальных сетей или паспорта.

Обычно банки решают эту задачу с помощью верификации фотографии – сотрудники офиса просматривают фотографии и пытаются выявить недостоверные изображения.
Мы захотели попробовать автоматизировать процесс и решить задачу с помощью нейросетей.

Читать дальше →

+22

RVera 13 сен 2018 в 12:04

Улучшенные эффекты с режимом смешивания фоновых слоев в CSS

7 мин

15K

Блог компании Поиск VPSОбработка изображений*Веб-дизайн*БраузерыВеб-разработка*

Перевод

Если одна картина заслуживает тысячи слов, то смешение двух картин заслуживает гораздо большего. Точно так же, возможности дизайна, которые открываются с появлением возможности смешивания слоев в CSS гораздо больше, чем вы думаете.

Когда вы слышите обсуждение функций CSS Blend Modes, то обычно речь идет о трех новых свойствах CSS, которые получили хорошую поддержку в современных браузерах.

Вот эти свойства:

background-blend-mode — для смешивания фоновых изображений, градиентов и цветов фона элементов;
mix-blend-mode — для смешивания элементов с другими элементами;
isolation – менее используемое свойство, которое применяется вместе с mix-blend-mode для предотвращения смешивания элементов.

Как бы то ни было, эта статья будет посвящена background-blend-mode, свойству, которое пользуется наиболее широкой поддержкой, и возможностям его использования для создания на своем сайте привлекательных фонов и фотоэффектов, которые когда-то были возможны только в Photoshop.

Читать дальше →

+22

ArXen42 22 апр 2018 в 17:06

Простой фильтр для автоматического удаления фона с изображений

8 мин

35K

Обработка изображений*C#*.NET*

Существует множество способов удалить фон с изображения какого-либо объекта, сделав его прозрачным (в графических редакторах, специальных сервисах). Но иногда может возникнуть необходимость удаления фона у множества фотографий с минимальным участием человека.

Хочу поделиться способом, основанном на создании маски прозрачности с помощью оператора Собеля и некоторых других преобразований. Основная идея совершенно не нова, но применение некоторых дополнительных техник в правильном порядке позволило улучшить результаты, о чем и будет эта заметка.

Реализация стала возможной благодаря OpenCV и C# обертке OpenCVSharp.

Читать дальше →

+22

alexeykurov 19 мар 2018 в 10:12

Можно ли научить искусственный интеллект шутить?

11 мин

12K

Блог компании FUNCORPОбработка изображений*Машинное обучение*Алгоритмы*Big Data*

В последнее время машины одержали ряд убедительных побед над людьми: они уже лучше играют в го, шахматы и даже в Dota 2. Алгоритмы сочиняют музыку и пишут стихи. Учёные и предприниматели всего мира дают прогнозы по поводу будущего, в котором искусственный интеллект сильно превзойдёт человека. С большой вероятностью через несколько десятков лет мы будем жить в мире, в котором роботы не только водят автомобили и работают на заводах, но и развлекают нас. Одна из важных составляющих нашей жизни — юмор. Принято считать, что только человек может придумывать шутки. Несмотря на это, многие ученые, инженеры и даже простые обыватели задаются вопросом: можно ли научить компьютер шутить?

Компания Gentleminds, разработчик систем машинного обучения и компьютерного зрения, совместно с FunCorp попробовали создать генератор весёлых подписей к картинкам, используя базу мемов iFunny. Поскольку приложение англоязычное и используется преимущественно в США, подписи будут на английском. Подробности под катом.

Читать дальше →

+22

third112 8 сен 2017 в 05:23

Бот в муравейнике

27 мин

19K

Разработка игр*Обработка изображений*Машинное обучение*Алгоритмы*Delphi*

Еще один игровой бот для «Космических рейнджеров HD» (издатель 1С) наводит на интересные мысли о путях развития искусственного интеллекта (ИИ).

Читать дальше →

+22

ELEKTRO_YAR 11 фев 2017 в 08:00

Детектор движения на основе биоинспирированного модуля OpenCV

7 мин

18K

Обработка изображений*

Данная статья будет полезна новичкам, которые только начали использовать библиотеку OpenCV и еще не знают все её возможности. В частности, на основе биоинспирированного модуля библиотеки OpenCV можно сделать адаптивный к освещению детектор движения. Данный детектор движения будет работать в полумраке лучше, чем обычное вычитание двух кадров.

Читать дальше →

+22

sim0nsays 14 июн 2016 в 10:17

Эволюция нейросетей для распознавания изображений в Google: Inception-ResNet

5 мин

46K

Машинное обучение*Обработка изображений*

Буду потихоньку дорассказывать про Inception.
Предыдущая часть здесь — https://habrahabr.ru/post/302242/.
Мы остановились на том, Inception-v3 не выиграл Imagenet Recognition Challange в 2015-м, потому что появились ResNets (Residual Networks).

Что такое вообще ResNets?

Читать дальше →

+22

Monnoroch 16 фев 2016 в 16:03

Глубокое обучение в гараже — Две сети

10 мин

19K

Data Mining*Python*Алгоритмы*Обработка изображений*Программирование*

Это вторая статья из серии про определение смайла по выражению лица.

Глубокое обучение в гараже — Братство данных
Глубокое обучение в гараже — Две сети
Глубокое обучение в гараже — Возвращение смайлов

Калибрация

Итак, с классификатором, разобрались, но вы наверняка уже заметили, что заоблачные 99% как-то не очень впечатляюще выглядят во время боевого теста на детекцию. Вот и я заметил. Дополнительно видно, что в последних двух примерах очень мелкий шаг движения окон, так в жизни работать не будет. В настоящем, реальном запуске шаг ожидается больше похожим на картинку для первой сети, а там хорошо видно неприятный факт: как бы хорошо сеть не искала лица, окна будут плохо выровнены к лицам. И уменьшение шага — явно не подходящее решение этой проблемы для продакшена.

Как быть?

+22

CooperMaster 29 янв 2016 в 15:01

Сжатие текстур в Android: сравнение форматов и примеры кода

11 мин

39K

Блог компании IntelОбработка изображений*Программирование*Разработка под Android*

Перевод

Назовите самый лучший формат сжатия текстур. Может это PNG, ETC, PVRTC, S3TC, или ещё какой-нибудь? Вопрос непростой, но очень важный. От ответа зависят качество визуального оформления, скорость работы и размеры Android-приложений. Дело осложняется тем, что универсального «самого лучшего формата» попросту не существует. Всё зависит от потребностей разработчика.

Технология наложения текстур на двумерные или трёхмерные модели широко применяется в компьютерной графике. Делается это для того, чтобы улучшить детализацию объектов, которые представлены моделями. Android поддерживает множество форматов сжатия текстур, каждый из них обладает собственными преимуществами и недостатками.

Читать дальше →

+22

alizar 26 янв 2016 в 04:01

Microsoft выложила на Github инструментарий CNTK для глубинного обучения

2 мин

16K

GPGPU*Open source*Машинное обучение*Обработка изображений*

Microsoft выложила в открытый доступ исходный код инструментов, которые используются в компании для ускорения разработок в области искусственного интеллекта: набор Computational Network Toolkit опубликован на Github.

Читать дальше →

+22

1 2 ...

53 54

56 57 ...

112 113