Все потоки

Обработка изображений *

Работаем с фото и видео

СтатьиПостыНовостиАвторыКомпании

aibrain 10 июл 2023 в 12:18

Генерируй, дискриминируй. Как мы ускорили доменную адаптацию GAN для генерации лиц в пять тысяч раз

Сложный

5 мин

2.7K

Блог компании AIRIАлгоритмы * Обработка изображений * Машинное обучение * Искусственный интеллект

Кейс

Всем привет! Меня зовут Айбек Аланов. Я — аспирант факультета компьютерных наук ВШЭ, а также научный сотрудник группы «Вероятностные методы машинного обучения» AIRI. Сегодня мне хотелось бы поделиться с вами успехами, которые добилась наша научная группа в вопросе адаптации генеративно-состязательных сетей на новые домены.

Читать далее

+13

SmartEngines 7 июл 2023 в 12:24

Международная конференция по машинному зрению – добро пожаловать в Армению

4 мин

1K

Блог компании Smart EnginesКонференцииОбработка изображений *

Научные конференции – фрукт особенный и крайне разнообразный. Они варьируются от узконаправленных воркшопов с парой десятков участников до монстров вроде CVPR, где количество участников достигает нескольких тысяч. Некоторые из них совсем молодые, а некоторые имеют 50-летнюю историю.

В этой заметке мы хотим чуть-чуть рассказать уважаемому Хабру про одну из наших любимых конференций – международную конференцию по машинному зрению (International Conference on Machine Vision), которая в этом году состоится уже в 16-й раз, и на этот раз – в солнечном Ереване.

Читать далее

+2

Turbo 7 июл 2023 в 10:38

VOT Challenge: как мы поучаствовали в соревнованиях по компьютерному зрению

8 мин

1K

Машинное обучение * Обработка изображений *

Обзор

Привет, хабристы. В этой короткой заметке мы хотим рассказать о нашем опыте участия в конкурсе по компьютерному зрению - VOT Challenge 2023, посвященном трекингу объектов на видео. Порефлексируем об ошибках, которые мы допустили и зачем вообще участвовать в этих конкурсах. Это вольный перевод нашей заметки на ACM, если Вам понравится, сходите и на оригинал. Нам будет приятно.

Читать далее

0

MaxRokatansky 5 июл 2023 в 10:46

Преобразование Хафа

Простой

3 мин

10K

Блог компании OTUSАлгоритмы * Обработка изображений *

Туториал

Автор статьи: Рустем Галиев

Сегодня мы рассмотрим преобразование Хафа — популярный метод обнаружения фигур среди граней и границ. Поговорим про использование преобразования Хафа для обнаружения линий и кругов.

Читать далее

+4

Or1onn 3 июл 2023 в 10:04

Распознавание лиц для чайников

Простой

8 мин

14K

Обработка изображений *

FAQ

Система распознавания лиц - очень распространенная система на сегодняшний день. Она широко используется в различных областях, таких как безопасность, развлечения, социальные сети и т.д. Данная технология развивается каждый год с невероятными темпами. В этой статье будет по полочкам разложено то, как работает система распознавания лиц, очень простыми словами.

Читать далее

+6

SmartEngines 3 июл 2023 в 07:07

Зачем промышленности томографы?

Простой

7 мин

3.2K

Блог компании Smart EnginesОбработка изображений * Производство и разработка электроники * Искусственный интеллект

Когда речь заходит о рентгеновской томографии, которая позволяет заглянуть внутрь чего-то без разрушения этого чего-то, то кажется, что дальше будут говорить о медицине. Это не всегда так, и в данной статье мы попытаемся ответить на вопрос: зачем компьютерная томография (КТ) нужна промышленности?

Читать далее

+8

SergeiGozalov 2 июл 2023 в 21:24

Распознаем лючки бензобаков

Средний

12 мин

11K

Обработка изображений * Машинное обучение * Робототехника

Из песочницы

Привет, Хабр! Однажды, я решил создать автоматическую автозаправочную станцию. Один из ее компонентов - роботизированная "рука", для автоматической заправки транспортных средств, независимо от марки/модели. Данная рука последовательно открывает лючок бензобака, отвинчивает крышку горловины бензобака, вставляет заправочный пистолет, осуществляет заправку автомобиля и возвращает все на место. В данной статье я хочу рассказать о том, как осуществлялось распознавание лючка бензобака для корректного позиционирования "руки" в пространстве и определения места присоединения присоски. Давайте посмотрим - как эта задача была решена.

Читать далее

+26

Ilya12c 29 июн 2023 в 09:26

Как подготовить PreLabeled-датасет при помощи CVAT, YOLO и FiftyOne

Простой

7 мин

6.7K

Блог компании Magnus TechOpen source * Обработка изображений * Машинное обучение *

Туториал

Представьте ситуацию: подходит к концу спринт, во время которого вы с командой планировали разметить десятки тысяч картинок для обучения новой нейросети (допустим, детектора). Откладывать задачи — не про вас! И вы обязались придумать способ как успеть в срок!

Сегодня я подробно расскажу:

• как развернуть CVAT — популярный сервис для разметки данных;

• как быстро и удобно предразметить датасет с помощью YOLO и FiftyOne;

• как загрузить полученный датасет на CVAT для переразметки;

• как выгрузить предразмеченный датасет обратно.

Читать далее

+16

SmartEngines 28 июн 2023 в 06:54

Каково расстояние между «Будапештом» и «Бухарестом» или об отождествлении слов с помощью расстояния Левенштейна

Средний

6 мин

3.7K

Блог компании Smart EnginesАлгоритмы * Обработка изображений * Математика *

Каждый из нас из школы помнит определение Евклидова расстояния между двумя точками на плоскости. С помощью расстояния Евклида можно вычислить расстояние между двумя точками на карте, например, между вашим местоположением и станцией метро. Но для пешехода в Нью-Йорке расстояние между двумя точками в городе будет отличаться от расстояния Евклида между двумя точками из-за невозможности передвигаться иначе, как по проезжим улицам, пересекающимся под прямыми углами. Такое расстояние так и называется: "расстояние городских кварталов" или манхэттенское расстояние. При любом способе расстояние характеризует меру близости точек. В сегодняшней статье мы расскажем о способах вычисления расстояния между двумя словами.

Читать далее

+3

AnPosy 26 июн 2023 в 11:04

Шумные разработчики, или Какие виды шума бывают?

4 мин

7.2K

3D-графика * Разработка игр * Алгоритмы * Обработка изображений * Дизайн игр *

Из песочницы

Играясь с генерацией карт высот в unity, я заметил одну неприятную тенденцию: большинство статей и материалов рассказывают либо о Value Noise, либо о Perlin Noise, либо о Voronoi Noise. Возможно я плохо искал, но это не отменяет того факта, что я сел писать эту статью, поэтому для всех нуждающихся я сделал шпаргалку.

Продолжение следует

+7

GlobalSign_admin 25 июн 2023 в 13:46

Восстановление криптоключей по яркости LED-индикатора питания

4 мин

9.4K

Блог компании GlobalSignРабота с видео * Обработка изображений * Криптография * Информационная безопасность *

Экспериментальная установка. Камера наблюдения (слева) снимает индикатор питания на смарт-ридере (справа) с расстояния 16 м

Известный эксперт в области криптоанализа Бен Насси (Ben Nassi) с коллегами из университета им. Бен-Гуриона опубликовали результаты уникальных экспериментов по восстановлению криптографических ключей с помощью видеозаписи светодиода питания устройства, на котором хранится/используется этот ключ.

Для извлечения секретного ключа достаточно нескольких секунд видеозаписи с камеры наблюдения (издали) или со смартфона (вблизи, с роллинг-шаттером).

Читать дальше →

+24

SmartEngines 23 июн 2023 в 08:12

Нейросеть распознает 15 документов за 1 секунду. А так можно было?

Простой

4 мин

27K

Блог компании Smart EnginesОбработка изображений * Машинное обучение * Искусственный интеллект

Ковер-самолет, меч-кладенец, скатерть-самобранка, шапка-невидимка, молодильные яблоки, волшебный клубочек и… ? Правильно, решение для распознавания полнотекстовых документов от Smart Engines. Оно, как и все упомянутые предметы, совершенно уникально, неповторимо и обладает самым что ни на есть волшебным функционалом. Например, распознает текстовые данные со скоростью 15 страниц в секунду. А еще распознает текст на мятых листках. А еще распознает текст в темноте. А еще распознает текст на арабском. А еще на японском. А еще на иврите. И при этом всем существует не в сказках, не в 2030 году, а наяву. Рассказываем и показываем, как выглядит OCR без слабых мест.

Читать далее

-8

befozg 20 июн 2023 в 08:12

Матирование изображений, или как получить фотореалистичный передний план

7 мин

4.2K

Блог компании SberDevicesОбработка изображений * Математика * Машинное обучение * Искусственный интеллект

В последнее время в области компьютерного зрения произошло много революционных событий, но есть ряд классических задач, решение которых остается актуальным. Одна из них — матирование, которое применяется для редактирования изображений и видео через извлечение нужных объектов с субпиксельной точностью. Решения этой задачи вы можете видеть в программах для кинопроизводства и фоторедакторах. В этой статье мы хотим познакомить вас с нашим новым подходом к матированию изображений. Изначально мы в SberDevices стремились решить задачу для портретов, но обобщающая способность модели позволяет использовать её и для изображений, выполненных в полный рост, для картинок с животными и так далее.

Читать далее

+7

aleksiej-ostrowski 18 июн 2023 в 12:25

Стеганографические эксперименты с видеофайлами и Youtube. Продолжение

Простой

12 мин

5.1K

DIY или Сделай самGo * Обработка изображений * Работа с видео *

Кейс

С момента публикации первой части статьи появились интересные инструменты, демонстрирующие побочные возможности Youtube для хранения цифровой информации. Например, утилита Infinite-Storage-Glitch. Автор утилиты DvorakDwarf, пользуясь рациональным размещением цифровой информации в черно-белом формате CV_8UC3, успешно использовал Youtube если не в качестве полноценного дропбокса, то в качестве прототипа альтернативного файлового хранилища, что вызвало массу различных инспираций и породило бурную реакцию пользователей, в том числе этического характера.

Перейти к экспериментам

+15

SmartEngines 15 июн 2023 в 11:38

Шум в компьютерной томографии: правда ли он нам мешает?

Сложный

7 мин

3.7K

Блог компании Smart EnginesНаучно-популярноеМатематика * Обработка изображений * Алгоритмы *

Здравствуй, Хабр! На связи отдел компьютерной томографии Smart Engines.

Как уже, наверное, известно нашему читателю, мы занимаемся разработкой томографического программного обеспечения. Мы работаем над совершенствованием алгоритмов реконструкции внутренней структуры объектов, боремся с артефактами реконструкции и различного рода шумами в измеренных данных. Наша основная задача - повысить качество реконструкции, увидеть чуть больше и чуть четче то, что когда-то было недоступно человеческому глазу.

Каждый пиксель детектора "живет своей жизнью и ошибается по своему". Ошибки связаны с шумом, который в каждом пикселе распределен уникальным образом и часто зависит от самого зарегистрированного значения. Такой шум называют гетероскедастичным.

Гетероскедастичность порождает на восстановленных изображениях искажения, которые мешают правильной интерпретации получаемых результатов. Наш отдел имеет опыт в противостоянии подобным зашумленностям данных, и сегодня мы хотели бы рассказать о придуманном нами методе фильтрации гетероскедастичного шума.

Читать далее

+8

SmartEngines 13 июн 2023 в 09:33

Распознавание документов на Steam Deck. А нужен ли мне мой ноутбук?

Средний

4 мин

9.1K

Блог компании Smart EnginesИгры и игровые консолиИскусственный интеллектМашинное обучение * Обработка изображений *

Привет, Хабр! Как вы знаете, мы в Smart Engines не только любим распознавать документы, но и распознавать очень разные документы на очень разных устройствах, от Odroid до Эльбруса. Недавно у нас в руках оказалась игровая консоль Steam Deck, и мы решили проверить, насколько шустро она справляется с распознаванием в сравнении с обычным ноутбуком. Если вам интересно посмотреть на результаты бенчмарка Steam Deck в не совсем обычной для нее задаче, добро пожаловать под кат!

Читать далее

+10

gorodex 12 июн 2023 в 20:15

cv3 — делаем OpenCV питоничным

Простой

14 мин

12K

Работа с видео * Python * Обработка изображений * Машинное обучение * Искусственный интеллект

Из песочницы

cv3 - это более питоничный интерфейс к OpenCV. Он упрощает работу с этой библиотекой, расширяет его синтаксические возможности, а также ускоряет исследования в области компьютерного зрения и выполнение задач по обработке изображений, при этом сохраняя гибкость и функциональность OpenCV.

Читать далее

+34

SmartEngines 9 июн 2023 в 14:20

Как нейросети помогают паломникам совершать хадж?

Простой

4 мин

2.1K

Блог компании Smart EnginesОбработка изображений * Искусственный интеллект

Кейс

Привет, Хабр!

Мы не раз писали о том, как банки, сотовые операторы и ретейлеры применяют системы распознавания Smart Engines. Сегодня делимся еще одним крайне любопытным кейсом. Рассказываем, как наше решение на базе искусственного интеллекта используется для оформления поездок российских паломников на хадж в Саудовскую Аравию.

Спойлер: Smart Engines помогла хадж-оператору "Муслим Тур" ускорить бронирование поездок в 7 раз.

Читать далее

+1

Gonchar_POTT 9 июн 2023 в 09:42

Максимальное Потребление Кислорода. Как там наши сердце и легкие?

Простой

5 мин

9K

Обработка изображений * Программирование *

Из песочницы

Recovery Mode

Банальность №1: чтобы достичь цели, ее нужно выразить в измеряемых единицах.

Банальность №2: лучше быть богатым и здоровым.

В сумме эти два перла философской мысли приводят к выводу: чтобы достичь богатства и здоровья, и то, и то другое нужно измерять.

Собственное (или чужое) богатство без особых сложностей можно измерить, выразив в числах (в деньгах). С измерением здоровья есть проблемы. Я, по крайней мере, не знаю, как численно выразить свое здоровье в целом. Но сложную, на первый взгляд нерешаемую, задачу часто можно разбить на части и справиться с нею поэтапно.

Мы попробовали так же поступить и с задачей «измерение здоровья», начав с относительно легко измеряемой составляющей - кардиореспираторной, выразив ее через Максимальное Потребление Кислорода.

Читать далее

+10

PatientZero 8 июн 2023 в 11:34

Создание модов для Age of Empires II с помощью нейросети

Простой

4 мин

5.2K

Игры и игровые консолиМашинное обучение * Обработка изображений * Разработка игр *

Обзор

Перевод

В прошлом месяце я занялся придумыванием способа создания собственных спрайтов цивилизаций для наших с друзьями игр в Age of Empires II.

В этой статье рассказывается о процессе создания гибкого генератора изображений на основе промтов. Для начинающих я посоветую Alpaca, а тем, кто умеет кодить — Stable Diffusion Web UI и Python.

Выражаю особую благодарность сообществам моддеров AoEII OpenAge, SLX Studio и Age of Kings Heaven.

Читать далее

+28

1 2 ...

23

24 25 ...