Все потоки

Обработка изображений *

Работаем с фото и видео

СтатьиПостыНовостиАвторыКомпании

@zhiwago 27 июн в 17:15

NAVIS — многоцелевой быстросборный беспилотный катамаран

Простой

2 мин

2.9K

Обработка изображений * Развитие стартапаНаучно-популярноеБудущее здесьРобототехника

Из песочницы

Создание быстросборного маломерного беспилотного судна с возможностью быстрой интеграции различных полезных нагрузок для решения задач на воде и под водой в автономном режиме.

Читать далее

+6

@ContentAI_Team 26 июн в 16:00

Как мы создавали технологию валидации печатей

3 мин

671

Блог компании Content AIИскусственный интеллектNatural Language Processing * Обработка изображений *

На рынке можно найти разные технологии по поиску печатей и подписей на документах. Мы в Content AI решили на этом не останавливаться и пошли дальше — помимо распознавания подписей и печатей, мы научились их валидировать. Обе технологии станут частью нашей универсальной платформы для интеллектуальной обработки информации ContentCapture и помогут пользователям еще быстрее обрабатывать большой поток документов.

О том, как верифицировать подписи, мы поделились в предыдущем посте, а про технологию валидации печатей рассказываем под катом.

Читать далее

+2

@LukichevaPolina 26 июн в 11:48

Режим ночной съемки: три алгоритма улучшения мобильных фотографий

Средний

14 мин

2.7K

Блог компании YADROИскусственный интеллектМашинное обучение * Обработка изображений *

Привет, Хабр! Меня зовут Полина Лукичева, я инженер команды AI ML Kit в YADRO. Наша задача — улучшить ночной режим камеры в планшете KVADRA_T. В статье я расскажу об основных ограничениях камеры мобильного устройства при съемке в условиях низкой освещенности, а также поделюсь алгоритмами, с помощью которых можно получить качественный снимок даже в темноте.

Читать далее

+39

@MaratUss 25 июн в 13:26

Заставляем компьютер видеть цвета без нейросетей: сегментация изображений по старинке

Средний

9 мин

1.8K

Блог компании ЦИТМ ЭкспонентаОбработка изображений * Алгоритмы * Matlab * Julia *

Туториал

Привет, Хабр! В предыдущей части мы рассматривали базовые методы цифровой обработки изображений для задачи сегментации спутникового снимка.

В этой статье рассмотрим ещё парочку методов решения этой задачи, всё ещё «классических», то есть без применения машинного обучения или нейросетей. Помогут нам во всём разобраться, как и в прошлый раз, язык программирования Julia и среда технических расчётов Engee!

Читать далее

+9

@Andrey_Biryukov 25 июн в 12:39

Компьютерное зрение для начинающих

7 мин

7.5K

Блог компании OTUSМашинное обучение * Искусственный интеллектОбработка изображений * Python *

Тема компьютерного зрения наряду с искусственным интеллектом в последние годы стала очень популярной. Сегодня компьютерное зрение — это динамичная и быстро развивающаяся область, постоянно расширяющая границы того, что могут видеть и понимать машины.

Однако, зачастую многие публикации посвященные computer vision являются достаточно сложными для тех, кто только погружается в данную тему.

В этой статье мы поговорим о том, как все это работает и какие основные технологии и алгоритмы используются. Мы не будем глубоко погружаться в вопросы, связанные с реализацией методов компьютерного зрения, так как задача этой статьи объяснить основные принципы.

Читать далее

+7

@YaphetS7 25 июн в 09:40

Это камень? Это ветка? Это нос! Разбираем подходы, помогающие ИИ распознавать лица на картинках с низким разрешением

Средний

8 мин

1K

Блог компании TevianМашинное обучение * Обработка изображений * Искусственный интеллектАлгоритмы *

Обзор

Привет, Хабр! Мы – Даниил Соловьев и Михаил Никитин из команды направления распознавания лиц. Сегодня фокусируемся на задаче распознавания лиц на изображениях низкого разрешения (low resolution face recognition, low-res FR). Она актуальна в первую очередь при анализе данных видеонаблюдения, так что если перед вами сейчас стоит подобная задача (или просто интересно, как она решается) — статья для вас. Расскажем про проблемы и сложности распознавания лиц низкого разрешения, подходы к решению задачи, в том числе свежий PETALface с конференции WACV 2025. Также поделимся ссылками на исследования, которые подробнее освещают каждый подход.

Читать далее

+8

@fartoviy109 25 июн в 07:26

Часть 1: ResNet-18 — Архитектура, покорившая глубину

Простой

4 мин

1.5K

Python * Big Data * Искусственный интеллектМашинное обучение * Обработка изображений *

Из песочницы

Разбор "на пальцах": Как из изображения получается предсказание? Разберем как устроена классическая сеть ResNet.

Читать далее

+3

@engine9 24 июн в 13:01

Цифровая чёрно-белая фотография

Простой

8 мин

4.8K

Блог компании RUVDS.comОбработка изображений * Фототехника

Мнение

Привет! Я хочу поделиться опытом чёрно-белой фотосъёмки на цифровые камеры, рассказать о некоторых особенностях восприятия монохромной фотографии. Постараюсь не акцентировать рассказ на конкретной программе, а объяснить в общих чертах принципы.

Я довольно давно увлекаюсь фотографией, мой интерес был привит от отца, который был фотолюбителем. Он много снимал для себя и на заказ. Печатал ночи напролёт целые стопки отпечатков, которые сушились по всему дому на прищепках. У нас было несколько фотоаппаратов, фотоувеличитель и множество книг о фотографии и целая стопка замечательного журнала «Советское фото», который в конце восьмидесятых был прям огонь. Я с завистью смотрел на чарующие пейзажи с глубоким контрастным светом и чёрным небом с яркими облаками.

Читать и смотреть

+94

@TOOF4CK 24 июн в 12:30

HandReader и Znaki — лучшая архитектура и самый большой набор данных для распознавания русского дактиля

Средний

10 мин

721

Блог компании СберМашинное обучение * Обработка изображений * Искусственный интеллект

Всем привет! Ранее мы уже писали о нашем наборе данных Bukva — первом наборе данных для распознавания русского дактильного языка в изоляции, который содержит более 3 700 видеороликов, разделённых на 33 класса, каждый из которых соответствует одной букве русского алфавита.

Эта статья посвящена распознаванию непрерывного дактильного языка. Мы расскажем о наших моделях, которые добиваются наилучших результатов на наборах данных непрерывного американского дактильного языка ChicagoFSWild и ChicagoFSWild+, а также о нашем новом наборе данных Znaki — первом открытом наборе данных непрерывного русского дактильного языка, содержащем более 37 000 видео.

Читать далее

+22

@ZonD80 22 июн в 10:48

Я сделал это за Google

7 мин

8.7K

Google ChromeMicrosoft EdgeРасширения для браузеровОбработка изображений *

Кейс

Google Photos — отличный сервис для хранения фотографий, но у него есть одна проблема: он не умеет находить дубликаты. Вернее может, но 100% одинаковые - даже разные EXIF данные - и все - давай, до свидания! За годы использования в моей библиотеке накопились тысячи похожих фотографий, и удалять их вручную — задача на десятки часов.

Особенно, когда тебя предупреждают, что 80% места занято - купи еще!

Я решил создать расширение для Chrome, которое автоматически найдет дубликаты. Казалось бы, простая задача: скачать фотографии, сравнить их с помощью нейросети, готово! Но оказалось, что браузерные расширения — это совершенно особый мир со своими ограничениями, и привычные подходы здесь не работают.

Читать далее

+10

@RulenBagdasis 22 июн в 05:42

Установка Stable Diffusion + ComfyUI

Простой

4 мин

6.5K

Обработка изображений * Искусственный интеллект

Из песочницы

В этом материале я бы хотел поделиться инструкцией по установке Stable Diffusion и ComfyUI.

Изначально я писал это как туториал для себя (на случай, если придётся переустанавливать), но друзья просили поделиться туториалом и я подумал, что материал может быть интересен ещё кому-нибудь. Все это, конечно же, можно нагуглить, но только что уже это сделал, погуглил, початогепетил и собрал результаты в виде одной инструкции.

Читать далее

+11

@iovodov 19 июн в 11:06

Жестовый язык: похожее в непохожем и наоборот

Средний

9 мин

1.3K

Блог компании СберМашинное обучение * Обработка изображений * Искусственный интеллект

Привет, Хабр! Наша команда RnD CV продолжает приближать момент, когда компьютер по видео сможет распознавать жестовый язык (ЖЯ) глухих так же качественно, как речь.

Сегодня мы расскажем, как собрали один из самых больших в мире датасетов изолированного русского жестового языка Logos, чем различаются визуально одинаковые жесты, как мы с помощью нашего датасета обучили универсальную модель-энкодер и попутно заняли первую строчку в бенчмарке распознавания американского жестового языка. По итогам этой работы мы опубликовали препринт.

Читать далее

+29

@kirilllapi 17 июн в 08:10

Способы цветовой сегментации в задачах детектирования дорожных знаков

Средний

9 мин

645

Обработка изображений * Алгоритмы *

Из песочницы

Распознавание дорожных знаков основывается на анализе изображений, полученных с камер, установленных на автомобиле. Эффективность работы такой системы зависит от корректной предварительной обработки изображений, в частности – от точного выделения области, содержащей дорожный знак. Основой этой процедуры выступает цветовая сегментация, поскольку большинство дорожных знаков обладают характерной цветовой окраской (например, красный, синий, жёлтый), позволяющей отличить их от фона.

На практике задача сегментации усложняется различиями в освещении, погодных условиях, наличием теней, бликов, а также загрязнением камеры. Это делает использование стандартного цветового пространства RGB неэффективным, поскольку оно неразрывно связано с яркостью. В связи с этим актуальной становится задача выбора более устойчивого цветового пространства – например, HSV, LAB или IHSL – для выделения дорожных знаков при помощи цветовой сегментации [1].

Читать далее

+2

@ContentAI_Team 6 июн в 14:00

Как мы делали технологию, которая умеет верифицировать подписи в документах

4 мин

725

Блог компании Content AIОбработка изображений * Искусственный интеллектIT-компанииNatural Language Processing *

Верификация подписи — новая полезная фича для работы с документами, которая войдет в наш кросс-платформенный продукт ContentCapture для интеллектуальной обработки информации.

Задача технологии — помогать пользователям проверять подлинность подписи на документах в автоматическом режиме, тем самым упрощая ежедневные бизнес-процессы и обеспечивая более высокий уровень безопасности.

Ниже рассказываем, как мы создавали эту технологию.

Читать далее

+4

@createcolor 6 июн в 11:27

Цветовая вычислительная фотография. Часть 2: Стандарты CIE 1931

Простой

11 мин

1.2K

Блог компании AIRIОбработка изображений * ФототехникаФизикаАлгоритмы *

FAQ

Всем привет! На связи снова Егор Ершов, руководитель группы «Цветовая вычислительная фотография» в AIRI и заведующий сектором репродукции и синтеза цвета ИППИ РАН. Это вторая статья из длинного цикла, которая, фактически, является конспектом лекций курса по алгоритмам вычислительной фотографии, которые я читаю для студентов МФТИ и ВШЭ.

В первой статье я ввёл читателя в проблему воспроизведения цвета, а также рассказал про первую математическую модель формирования изображения. На этот раз мы поговорим про формализацию цвета с технической точки зрения и связанные с этим стандарты.

Читать далее

+10

@nikgerasimenko 5 июн в 08:49

Kandinsky 4.1 Image – новый генератор изображений от Сбера

Средний

4 мин

6K

Блог компании SberDevicesБлог компании СберОбработка изображений * Машинное обучение * Искусственный интеллект

В декабре прошлого года на конференции AI Journey наша команда представила диффузионную генеративную модель Kandinsky 4.0 Video. Теперь мы рады представить новую версию нашей модели генерации изображений Kandinsky 4.1 Image!

Читать далее

+23

@kliment_01 4 июн в 08:23

3D-сканер из датчика Kinect Xbox 360

6 мин

4.5K

Блог компании МТСКомпьютерное железоОбработка изображений * AR и VR

2009 год. На конференции E3 Стивен Спилберг (да, да — тот самый) вместе с старшим вице-президентом Microsoft Доном Мэттриком (Don Mattrick) презентуют Project Nata. Именно его весь мир узнает как Kinect, сокращение от слов kinetic и connection. Старт продаж был оглушительным, даже в Книгу рекордов Гиннесса попали. Аксессуар для Xbox 360 обещал подарить новый игровой опыт и поэтому многие, не задумываясь, выкладывали за него 149,99 $.

С тех пор много воды утекло. Две реинкарнации в виде Kinect for Xbox One и Kinect for Windows в итоге были переведены в статус discontinued. В феврале 2019 года Microsoft представила Azure Kinect уже не как игровой аксессуар, а как продвинутый датчик для разработки приложений всего за 399 $. Спустя четыре года производство было свернуто и корпорация вновь похоронила проект. Но там, где закончилась эта история, пока что есть множество энтузиастов (включая меня), которые по-прежнему используют значительно подешевевшие датчики в своих проектах.

В свой очередной поход на барахолку я как раз наткнулся на замечательный экземпляр Kinect Xbox 360, который обошелся мне в смешную сумму 10 €. Я давно хотел пощупать такой девайс, поэтому решил попробовать сделать из него 3D-сканер. Тогда я еще не представлял, насколько этот путь непрост.

Читать далее

+54

@PatientZero 3 июн в 06:52

Симуляция жизни частиц в браузере на WebGPU

Средний

18 мин

2.9K

ФизикаМатематика * Разработка игр * Обработка изображений *

Туториал

Перевод

Я люблю физические симуляции, а в особенности симуляции частиц. Обычно я реализую что-то на основе традиционной физики, но недавно наткнулся на забавную нефизическую модель, которая может демонстрировать поведение, напоминающее жизнь.

Я написал на C++ прототип для собственного движка, а потом решил, что будет интересно попробовать запустить его в браузере при помощи WebGPU API. Он заработал на удивление хорошо, позволяя создавать подобные симуляции.

В посте я расскажу, как он устроен внутри.

Читать далее

+30

@unalacuna 1 июн в 07:50

AntiqGPT. Неожиданное применение этих ваших LLM

Простой

7 мин

13K

Обработка изображений * Научно-популярноеИскусственный интеллект

Во время отпуска в Турции я наткнулся на древнегреческую надпись в руинах Фаселиса и использовал ChatGPT для расшифровки и реконструкции текста. Статья про то, как нейросети позволяют поиграть в археологические исследования, которые ранее требовали работы узких специалистов.

Читать далее

+89

@ContentAI_Team 29 мая в 15:15

Автоматизация без кода: как FastML справляется с документами за несколько кликов

Простой

5 мин

701

Блог компании Content AIОбработка изображений * Машинное обучение * Искусственный интеллектNatural Language Processing *

Привет, Хабр!

В этом посте хотим рассказать, как технология FastML (о самой разработке уже рассказывали здесь) начала работать на российских документах разного типа в контуре нашего продукта ContentCapture и что из этого вышло.

Вкратце введем в курс дела. Многие компании сталкиваются с необходимостью обрабатывать большое количество однотипных (не одинаковых) документов, извлекать из них нужную информацию и экспортировать. Естественно, это долго, мучительно, а иногда еще и с ошибками. Для автоматизации такой рутины и используется ContentCapture, а точнее, встроенные в него две технологии — гибкие описания и теперь еще и FastML.

Гибкие описания — это универсальный подход к извлечению данных, особенно если речь идет о сложных документах. Однако для их создания нужно время и навыки работы со специальным инструментом — Content AI Layout Studio. Для тех, у кого таких скиллов нет, и был создан FastML, с которым сможет справиться любой пользователь, независимо от техподготовки. С помощью FastML модели для новых типов документов создаются в несколько кликов на основе нескольких примеров, что значительно сокращает время их внедрения в контур компании и бизнес-процессы.

Под катом рассказываем и показываем, какие теперь документы могут автоматически обрабатывать пользователи ContentCapture с помощью встроенного в него FastML, а также делимся данными тестирования и объясняем, в чем могут возникнуть сложности.

Читать далее

+3

6

7 8 ...