Все потоки
Поиск
Написать публикацию
Обновить
51.7

Обработка изображений *

Работаем с фото и видео

Сначала показывать
Порог рейтинга
Уровень сложности

Генерируй, дискриминируй. Как мы ускорили доменную адаптацию GAN для генерации лиц в пять тысяч раз

Уровень сложностиСложный
Время на прочтение5 мин
Количество просмотров2.7K

Всем привет! Меня зовут Айбек Аланов. Я — аспирант факультета компьютерных наук ВШЭ, а также научный сотрудник группы «Вероятностные методы машинного обучения» AIRI. Сегодня мне хотелось бы поделиться с вами успехами, которые добилась наша научная группа в вопросе адаптации генеративно-состязательных сетей на новые домены.

Читать далее

Международная конференция по машинному зрению – добро пожаловать в Армению

Время на прочтение4 мин
Количество просмотров1K

Научные конференции – фрукт особенный и крайне разнообразный. Они варьируются от узконаправленных воркшопов с парой десятков участников до монстров вроде CVPR, где количество участников достигает нескольких тысяч. Некоторые из них совсем молодые, а некоторые имеют 50-летнюю историю.

В этой заметке мы хотим чуть-чуть рассказать уважаемому Хабру про одну из наших любимых конференций – международную конференцию по машинному зрению (International Conference on Machine Vision), которая в этом году состоится уже в 16-й раз, и на этот раз – в солнечном Ереване.

Читать далее

VOT Challenge: как мы поучаствовали в соревнованиях по компьютерному зрению

Время на прочтение8 мин
Количество просмотров1K

Привет, хабристы. В этой короткой заметке мы хотим рассказать о нашем опыте участия в конкурсе по компьютерному зрению - VOT Challenge 2023, посвященном трекингу объектов на видео. Порефлексируем об ошибках, которые мы допустили и зачем вообще участвовать в этих конкурсах. Это вольный перевод нашей заметки на ACM, если Вам понравится, сходите и на оригинал. Нам будет приятно.

Читать далее

Преобразование Хафа

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров10K

Автор статьи: Рустем Галиев

Сегодня мы рассмотрим преобразование Хафа — популярный метод обнаружения фигур среди граней и границ. Поговорим про использование преобразования Хафа для обнаружения линий и кругов.

Читать далее

Распознавание лиц для чайников

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров14K

Система распознавания лиц - очень распространенная система на сегодняшний день. Она широко используется в различных областях, таких как безопасность, развлечения, социальные сети и т.д. Данная технология развивается каждый год с невероятными темпами. В этой статье будет по полочкам разложено то, как работает система распознавания лиц, очень простыми словами.

Читать далее

Зачем промышленности томографы?

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров3.2K

Когда речь заходит о рентгеновской томографии, которая позволяет заглянуть внутрь чего-то без разрушения этого чего-то, то кажется, что дальше будут говорить о медицине. Это не всегда так, и в данной статье мы попытаемся ответить на вопрос: зачем компьютерная томография (КТ) нужна промышленности? 

Читать далее

Распознаем лючки бензобаков

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров11K

Привет, Хабр! Однажды, я решил создать автоматическую автозаправочную станцию. Один из ее компонентов - роботизированная "рука", для автоматической заправки транспортных средств, независимо от марки/модели. Данная рука последовательно открывает лючок бензобака, отвинчивает крышку горловины бензобака, вставляет заправочный пистолет, осуществляет заправку автомобиля и возвращает все на место. В данной статье я хочу рассказать о том, как осуществлялось распознавание лючка бензобака для корректного позиционирования "руки" в пространстве и определения места присоединения присоски. Давайте посмотрим - как эта задача была решена.

Читать далее

Как подготовить PreLabeled-датасет при помощи CVAT, YOLO и FiftyOne

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров6.7K

Представьте ситуацию: подходит к концу спринт, во время которого вы с командой планировали разметить десятки тысяч картинок для обучения новой нейросети (допустим, детектора). Откладывать задачи — не про вас! И вы обязались придумать способ как успеть в срок!

Сегодня я подробно расскажу:

как развернуть CVAT — популярный сервис для разметки данных;

как быстро и удобно предразметить датасет с помощью YOLO и FiftyOne;

как загрузить полученный датасет на CVAT для переразметки;

как выгрузить предразмеченный датасет обратно.

Читать далее

Каково расстояние между «Будапештом» и «Бухарестом» или об отождествлении слов с помощью расстояния Левенштейна

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров3.7K

Каждый из нас из школы помнит определение Евклидова расстояния между двумя точками на плоскости. С помощью расстояния Евклида можно вычислить расстояние между двумя точками на карте, например, между вашим местоположением и станцией метро. Но для пешехода в Нью-Йорке расстояние между двумя точками в городе будет отличаться от расстояния Евклида между двумя точками из-за невозможности передвигаться иначе, как по проезжим улицам, пересекающимся под прямыми углами. Такое расстояние так и называется: "расстояние городских кварталов" или манхэттенское расстояние. При любом способе расстояние характеризует меру близости точек. В сегодняшней статье мы расскажем о способах вычисления расстояния между двумя словами.

Читать далее

Шумные разработчики, или Какие виды шума бывают?

Время на прочтение4 мин
Количество просмотров7.2K

Играясь с генерацией карт высот в unity, я заметил одну неприятную тенденцию: большинство статей и материалов рассказывают либо о Value Noise, либо о Perlin Noise, либо о Voronoi Noise. Возможно я плохо искал, но это не отменяет того факта, что я сел писать эту статью, поэтому для всех нуждающихся я сделал шпаргалку.

Продолжение следует

Восстановление криптоключей по яркости LED-индикатора питания

Время на прочтение4 мин
Количество просмотров9.4K

Экспериментальная установка. Камера наблюдения (слева) снимает индикатор питания на смарт-ридере (справа) с расстояния 16 м

Известный эксперт в области криптоанализа Бен Насси (Ben Nassi) с коллегами из университета им. Бен-Гуриона опубликовали результаты уникальных экспериментов по восстановлению криптографических ключей с помощью видеозаписи светодиода питания устройства, на котором хранится/используется этот ключ.

Для извлечения секретного ключа достаточно нескольких секунд видеозаписи с камеры наблюдения (издали) или со смартфона (вблизи, с роллинг-шаттером).
Читать дальше →

Нейросеть распознает 15 документов за 1 секунду. А так можно было?

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров27K

Ковер-самолет, меч-кладенец, скатерть-самобранка, шапка-невидимка, молодильные яблоки, волшебный клубочек и… ? Правильно, решение для распознавания полнотекстовых документов от Smart Engines. Оно, как и все упомянутые предметы, совершенно уникально, неповторимо и обладает самым что ни на есть волшебным функционалом. Например, распознает текстовые данные со скоростью 15 страниц в секунду. А еще распознает текст на мятых листках. А еще распознает текст в темноте. А еще распознает текст на арабском. А еще на японском. А еще на иврите. И при этом всем существует не в сказках, не в 2030 году, а наяву. Рассказываем и показываем, как выглядит OCR без слабых мест.

Читать далее

Матирование изображений, или как получить фотореалистичный передний план

Время на прочтение7 мин
Количество просмотров4.2K

В последнее время в области компьютерного зрения произошло много революционных событий, но есть ряд классических задач, решение которых остается актуальным. Одна из них —  матирование, которое применяется для редактирования изображений и видео через извлечение нужных объектов с субпиксельной точностью. Решения этой задачи вы можете видеть в программах для кинопроизводства и фоторедакторах. В этой статье мы хотим познакомить вас с нашим новым подходом к матированию изображений. Изначально мы в SberDevices стремились решить задачу для портретов, но обобщающая способность модели позволяет использовать её и для изображений, выполненных в полный рост, для картинок с животными и так далее.

Читать далее

Ближайшие события

Стеганографические эксперименты с видеофайлами и Youtube. Продолжение

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров5.1K

С момента публикации первой части статьи появились интересные инструменты, демонстрирующие побочные возможности Youtube для хранения цифровой информации. Например, утилита Infinite-Storage-Glitch. Автор утилиты DvorakDwarf, пользуясь рациональным размещением цифровой информации в черно-белом формате CV_8UC3, успешно использовал Youtube если не в качестве полноценного дропбокса, то в качестве прототипа альтернативного файлового хранилища, что вызвало массу различных инспираций и породило бурную реакцию пользователей, в том числе этического характера.

Перейти к экспериментам

Шум в компьютерной томографии: правда ли он нам мешает?

Уровень сложностиСложный
Время на прочтение7 мин
Количество просмотров3.7K

Здравствуй, Хабр! На связи отдел компьютерной томографии Smart Engines. 

Как уже, наверное, известно нашему читателю, мы занимаемся разработкой томографического программного обеспечения. Мы работаем над совершенствованием алгоритмов реконструкции внутренней структуры объектов, боремся с артефактами реконструкции и различного рода шумами в измеренных данных. Наша основная задача - повысить качество реконструкции, увидеть чуть больше и чуть четче то, что когда-то было недоступно человеческому глазу.

Каждый пиксель детектора "живет своей жизнью и ошибается по своему". Ошибки связаны с шумом, который в каждом пикселе распределен уникальным образом и часто зависит от самого зарегистрированного значения. Такой шум называют гетероскедастичным.

Гетероскедастичность порождает на восстановленных изображениях искажения, которые мешают правильной интерпретации получаемых результатов. Наш отдел имеет опыт в противостоянии подобным зашумленностям данных, и сегодня мы хотели бы рассказать о придуманном нами методе фильтрации гетероскедастичного шума.

Читать далее

Распознавание документов на Steam Deck. А нужен ли мне мой ноутбук?

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров9.1K

Привет, Хабр! Как вы знаете, мы в Smart Engines не только любим распознавать документы, но и распознавать очень разные документы на очень разных устройствах, от Odroid до Эльбруса. Недавно у нас в руках оказалась игровая консоль Steam Deck, и мы решили проверить, насколько шустро она справляется с распознаванием в сравнении с обычным ноутбуком. Если вам интересно посмотреть на результаты бенчмарка Steam Deck в не совсем обычной для нее задаче, добро пожаловать под кат!

Читать далее

cv3 — делаем OpenCV питоничным

Уровень сложностиПростой
Время на прочтение14 мин
Количество просмотров12K

cv3 - это более питоничный интерфейс к OpenCV. Он упрощает работу с этой библиотекой, расширяет его синтаксические возможности, а также ускоряет исследования в области компьютерного зрения и выполнение задач по обработке изображений, при этом сохраняя гибкость и функциональность OpenCV.

Читать далее

Как нейросети помогают паломникам совершать хадж?

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров2.1K

Привет, Хабр!

Мы не раз писали о том, как банки, сотовые операторы и ретейлеры применяют системы распознавания Smart Engines. Сегодня делимся еще одним крайне любопытным кейсом. Рассказываем, как наше решение на базе искусственного интеллекта используется для оформления поездок российских паломников на хадж в Саудовскую Аравию. 

Спойлер: Smart Engines помогла хадж-оператору "Муслим Тур" ускорить бронирование поездок в 7 раз. 

Читать далее

Максимальное Потребление Кислорода. Как там наши сердце и легкие?

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров9K

Банальность №1: чтобы достичь цели, ее нужно выразить в измеряемых единицах.

Банальность №2: лучше быть богатым и здоровым.

В сумме эти два перла философской мысли приводят к выводу: чтобы достичь богатства и здоровья, и то, и то другое нужно измерять.

Собственное (или чужое) богатство без особых сложностей можно измерить, выразив в числах (в деньгах). С измерением здоровья есть проблемы. Я, по крайней мере, не знаю, как численно выразить свое здоровье в целом. Но сложную, на первый взгляд нерешаемую, задачу часто  можно разбить на части и справиться с нею поэтапно. 

Мы попробовали так же поступить и с задачей «измерение здоровья», начав с относительно легко измеряемой составляющей - кардиореспираторной, выразив ее через Максимальное Потребление Кислорода.

Читать далее

Создание модов для Age of Empires II с помощью нейросети

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров5.2K

В прошлом месяце я занялся придумыванием способа создания собственных спрайтов цивилизаций для наших с друзьями игр в Age of Empires II.

В этой статье рассказывается о процессе создания гибкого генератора изображений на основе промтов. Для начинающих я посоветую Alpaca, а тем, кто умеет кодить — Stable Diffusion Web UI и Python.

Выражаю особую благодарность сообществам моддеров AoEII OpenAgeSLX Studio и Age of Kings Heaven.

Читать далее

Вклад авторов