Обработка изображений *

Работаем с фото и видео

СтатьиПостыНовостиАвторыКомпании

victor30608 5 дек 2022 в 09:47

Поиск пропавших людей на снимках лесного массива, полученных с помощью БПЛА или ещё один разбор задачи Цифрового Прорыва

13 мин

7.6K

Искусственный интеллектМашинное обучение * ХакатоныОбработка изображений * Open source *

Туториал

Привет, Хабр!
Это статья является продолжением цикла материалов по разбору задач Всероссийского чемпионата "Цифровой Прорыв", связанных с Computer Vision. Решение, предлагаемое в статье, позволяет получить место в топ-10 лидерборда, при это реализация самого подхода у автора статьи заняла ~ 3-4 часа. В конце даются советы по улучшению решения, а также идеи, которые могут привести к победе.

Под катом вас ждут: Focal Loss, RetinaNet и причём тут YOLOv5.

+16

netsvetaev 2 дек 2022 в 14:48

Релиз InvokeAI 2.2: универсальный холст, удобные установщики, автозагрузка моделей и DPM++

3 мин

7.4K

Python * Обработка изображений * Машинное обучение * Графический дизайн * Искусственный интеллект

Привет! InvokeAI 2.2 теперь доступен для всех. В этом обновлении добавлены UI Outpainting, Embedding Management и другие функции. Ознакомьтесь с выделенными обновлениями ниже, а также с полным описанием всех функций, включенных в релиз.

Что нового?

+23

NapoleonIT 1 дек 2022 в 07:33

Выявление незаконных построек по спутниковым снимкам с помощью CV

6 мин

5.7K

Python * Обработка изображений * ХакатоныМашинное обучение *

Привет, Хабр! Я Вова, Lead Data Scientist. Заметил, что вам очень нравится вместе с нами разбирать решения задач с хакатонов. Сегодня расскажу, как я занял 4 место в соревновании по выявлению незаконных построек по спутниковым снимкам и что мне не хватило, чтобы попасть в топ-3 на Цифровом прорыве.

omyhosts 30 ноя 2022 в 16:17

Дорогие художники: вам не стоит бояться ИИ-генераторов изображений

6 мин

4.6K

Блог компании ISPsystemОбработка изображений * Машинное обучение * Искусственный интеллект

Перевод

В 1992 году поэтесса Энн Карсон опубликовала небольшую книжку под названием «Короткие беседы». Это серия микроэссе, каждое длиной от предложения до абзаца, на, казалось бы, несвязанные темы: орхидеи, дождь, мифическая андская викунья. Например, в ней есть «Краткое измышление об ощущениях при взлёте самолёта». И, вы удивитесь, повествует оно ровно о том, что написано в заголовке. А «Короткая беседа о форели» рассказывает нам главным образом о разновидностях форели, которые встречаются в японских хайку. В предисловии к книге Карсон пишет с присущей всем канадцам суховатой непосредственностью: «Я пойду на все, чтобы не поддаваться скуке. Это цель всей моей жизни».

С тех пор минуло уже 30 лет. Я тоже сознательно борюсь со скукой и праздностью. Вот, например, один из моих способов скрасить досуг: мне нравится засиживаться допоздна и возиться с генерацией изображений при помощи искусственного интеллекта. Таким инструментам, как DALL-E 2, Midjourney и Stable Diffusion, можно дать короткую текстовую инструкцию, а они в свою очередь изучат ее и произведут на свет безвкусную картину маслом в стиле Тициана, изображающую собак в милых шляпках.

Позволю себе еще одну небольшую ремарку: книга Карсон вышла в то время, когда Интернет только-только начал набирать обороты.

+15

ternaus 29 ноя 2022 в 00:07

Ternaus: Chrome Extension

3 мин

1.5K

Обработка изображений * Машинное обучение * Искусственный интеллектРасширения для браузеров

Я добавил Chrome extension, которое позволяет по тексту и по картинкам в интернете искать похожие в базе данных на Ternaus.com.

* ссылка на Extension

* ссылка на GitHub

Gorislav 24 ноя 2022 в 12:42

Давайте запретим нейронные сети

6 мин

18K

Искусственный интеллектМашинное обучение * Обработка изображений *

Технотекст 2022

Тема нейронных сетей волнует сейчас почти всех, кто рисует. За последние пол года прогресс выглядит для кого-то головокружительным, а для кого-то пугающим. В этой статье я хочу рассмотреть основные страхи, претензии и впечатления в целом по отношению к нейронным сетям среди творческих людей, профессия или хобби которых создание визуальной эстетики.

+30

103

Razant 23 ноя 2022 в 14:30

Kandinsky 2.0 — первая мультиязычная диффузия для генерации изображений по тексту

7 мин

49K

Блог компании СберОбработка изображений * Машинное обучение * Научно-популярноеИскусственный интеллект

Диффузия всё увереннее вытесняет GANы и авторегрессионные модели в ряде задач цифровой обработки изображений. Это не удивительно, ведь диффузия обучается проще, не требует сложного подбора гиперпараметров, min-max оптимизации и не страдает нестабильностью обучения. А главное, диффузионные модели демонстрируют state-of-the-art результаты почти на всех генеративных задачах — генерации картинок по тексту, генерация звуков, видео и даже 3D!

К сожалению, большинство работ в области text-to-something сосредоточены только на английском и китайском языках. Чтобы исправить эту несправедливость, мы решили создать мультиязычную text-to-image диффузионную модель Kandinsky 2.0, которая понимает запросы более чем на 100 языках! И главное, на русском ;) Подробности — под катом.

+33

NewTechAudit 23 ноя 2022 в 06:11

SciPy — интегрирование и дифференцирование, обработка изображений и сигналов

4 мин

26K

Python * Программирование * Обработка изображений *

Туториал

Думаю, ни для кого не секрет, что Python может все или почти все. Например, для построения графиков можно использовать matplotlib, для анализа и манипуляции данными можно использовать библиотеку pandas, а для работы с массивами была разработана библиотека numpy. А есть ли библиотека, которая может выполнять различные математические операции, например, интегрирование и дифференцирование, обработка изображений и сигналов, расчет статистических распределений и функций? Конечно есть, это библиотека SciPy.

VaShche 21 ноя 2022 в 13:00

Видеоаналитика на взрывоопасном заводе площадью в 700 футбольных полей

10 мин

8.1K

Блог компании Цифровой СИБУРМашинное обучение * Обработка изображений * Алгоритмы * Анализ и проектирование систем *

Технотекст 2022

Есть распространённый стереотип, будто на заводах надо каски детектировать или даже огонь. Но ведь идея в том, чтобы стремиться не допустить огня и всяких происшествий, а не фотографировать их. Поэтому на практике мы стараемся детектировать то, что происходит до того, как что-то подтечёт, задымится, загорится или пойдёт не по плану.

Меня зовут Щемелинин Вадим, я четыре года работаю в сфере цифровизации промышленности в компании «СИБУР Диджитал». Моя основная задача — развитие Индустрии 4.0 в холдинге. Одним из продуктов моего направления является видеоаналитика. Сегодня я расскажу про сложности, с которым сталкиваются Python-разработчики, внедряя машинное зрение в нефтехимическую индустрию.

+35

ternaus 14 ноя 2022 в 16:05

Ternaus: сводим поиск по картинкам и по тексту

3 мин

2.4K

Обработка изображений * Машинное обучение * Искусственный интеллект

В прошлом посте я рассказывал о том, что планирую добавить сгенерированные картинки в поиск.

Сказано - сделано. Добавил 8.5M картинок, под лицензией CC0, то есть "Free of copyright". Используйте как душе угодно.

Более того, я убрал те, что не позволяют коммерческое использование, то есть все 18 миллионов, что у меня были, а именно ImageNet21k, Open Images и Places365.

При этом движении, целевая аудитория сместилась с тех, кто тренирует модели машинного обучения на тех, кто использует картинки как reference при создании 3D моделей для фильмов или игр.

Пообщался с творцами прекрасного, ребята рассказали, много интересного. Один из запросов - можно ли скомбинировать в одном запросе поиск по картинке и по тексту?

Да, можно, и технически это не сложно.

Для тех, кто не знает, что происходит под капотом в сервисах, вроде моего ternaus.com напомню.

netsvetaev 12 ноя 2022 в 22:50

Я обучил нейросеть на своих рисунках и отдаю модель бесплатно (и научу вас делать это)

2 мин

26K

Python * Обработка изображений * Машинное обучение * Графический дизайн * Искусственный интеллект

Туториал

Модель подходит для создания бесшовных узоров, абстрактных рисунков и стилизованных под акварель образов. Как использовать модель и как обучить нейросеть на своих картинках?

Хочу всё знать!

+30

astrowander 12 ноя 2022 в 21:48

Астрофото: совмещаем одиночные кадры

11 мин

C++ * АстрономияОбработка изображений *

Технотекст 2022

Из песочницы

Одной из главных проблем при съёмке астрофотографий являются разнообразные шумы. Не буду подробно останавливаться на том, откуда они берутся и какие компоненты в них присутствуют. Об этом уже есть хорошая серия статей на Хабре, за подробностями рекомендую обратиться к ней. Здесь я только резюмирую основной способ борьбы с шумом: нужно снять несколько кадров одной и той же области неба (чем больше, тем лучше) и усреднить сигнал с соответствующих пикселей.

Но какие пиксели на разных кадрах считать соответствующими? Если бы можно было гарантировать, что объекты между кадрами не сдвинутся ни на пиксель, то всё было бы предельно ясно: просто суммируем одни и те же пиксели на матрице. Но что делать, когда слежение неидеально, или съёмка вовсе ведётся с неподвижного штатива? Тогда звёзды и другие небесные тела будут смещаться, и перед сложением кадры нужно будет правильно наложить друг на друга. Эта статья посвящена тому, как это сделать.

+42

honyaki 10 ноя 2022 в 22:41

Что Chrome сделал с JPEG XL и почему делать этого не стоило

12 мин

10K

Блог компании SkillfactoryGoogle ChromeОбработка изображений * Сжатие данных *

Перевод

Аргументы в защиту формата в лонгриде под катом — к старту курса по Fullstack-разработке на Python.

Разработчики Chrome недавно анонсировали своё решение о прекращении поддержки формата JPEG XL, который ранее был «убран за флажок». Это решение объясняется так:

Читать дальше →

+12

Gorislav 10 ноя 2022 в 10:24

Илон Маск кисти Ван Гога, или специализированные модели Stable Diffusion

3 мин

5.9K

Будущее здесьИскусственный интеллектМашинное обучение * Обработка изображений *

Благодаря сообществу, stable diffusion развивается стремительнее, чем можно было предположить. Как я писал в предыдущей статье, вскоре мы должны получить много специализированных моделей под конкретные задачи.

Уже сейчас помимо основной модели весов у stable diffusion есть модели для получения артов в строго определенном стиле.

В этой статье я покажу как это работает на практике и дам небольшую инструкцию для начинающих по добавлению специализированных моделей.

+13

Gorislav 9 ноя 2022 в 10:01

Нейросети убьют 2d художников

4 мин

12K

Разработка игр * Обработка изображений * Машинное обучение * Искусственный интеллектБудущее здесь

Никого они, конечно, не убьют, но рынок труда в ближайшие пять лет поменяют точно. Произойдёт это постепенно, плавно и заметно будет только на значительной дистанции, в моменте глядя вперед или оглядываясь назад, мы не увидим каких-то значительных сдвигов как и при любом эволюционном процессе.

109

kucev 8 ноя 2022 в 23:21

Большой объём данных для машинного обучения — не панацея

3 мин

5.6K

Big Data * Data Mining * Искусственный интеллектМашинное обучение * Обработка изображений *

Перевод

Модели глубокого обучения обладают потрясающим свойством — они становятся лучше с увеличением объёма данных, и кажется, что этот процесс практически неограничен. Чтобы получить качественно работающую модель, недостаточно больших объёмов данных, нужны ещё и точные аннотации. Хотя большие объёмы данных помогают модели решать проблему несогласованности данных в разных аннотациях, люди всё равно могут совершать повторные ошибки, укореняющиеся в модели.

Например, когда человеку нужно нарисовать вокруг объекта прямоугольник, он обычно стремится, чтобы объект точно попал в этот прямоугольник, то есть склонен ошибаться в сторону увеличения прямоугольника. Использование такой модели для избегания столкновений приведёт к ложноположительным результатам, из-за чего беспилотный транспорт будет останавливаться без причины.

Превышение размера ограничивающих прямоугольников — пример систематической ошибки, а бывают ещё и случайные. Случайные и систематические ошибки влияют на обученную модель по-разному.

Читать дальше →

goshkalinin 6 ноя 2022 в 03:47

OpenCV — быстрый старт: аннотирование изображений

3 мин

8.5K

Python * Обработка изображений *

Туториал

Перевод

В этом выпуске примитивы: круги, линии, прямоугольники и текст.

В прошлых сериях:

OpenCV — быстрый старт: начало работы с изображениями.

OpenCV — быстрый старт: базовые операции с изображениями.

Айда разбираться

netsvetaev 4 ноя 2022 в 08:17

Релиз InvokeAI 2.1: теперь с inpainting и Cross Attention

2 мин

3.3K

Искусственный интеллектМашинное обучение * Обработка изображений * Python *

Команда InvokeAI рада поделиться нашим последним релизом с набором новых функций, улучшений графического интерфейса и возможностей командной строки.

Что нового?

NapoleonIT 31 окт 2022 в 10:05

Как компьютерное зрение помогает определить координаты спутниковых снимков

7 мин

7.6K

Машинное обучение * Python * ХакатоныОбработка изображений *

Привет, Хабр!

Меня зовут Андрей, и я data scientist. В этой статье расскажу о том, как я занял второе место в конкурсе «Цифровой прорыв» с решением по автоматизации привязки фотографии к географическому положению. Главный инсайт — базовые решения не всегда хороши и проверены. Спойлер — самодеятельность и использование современных подходов помогают победить :) Расскажу на своем опыте, как не сделать свое решение хуже базового и проанализирую подходы других участников.

GlobalSign_admin 29 окт 2022 в 14:11

Съём пароля с клавиатуры ПК через 0–60 секунд по тепловому следу

4 мин

Блог компании GlobalSignИнтернет вещейИнформационная безопасность * Машинное обучение * Обработка изображений *

Современные тепловизоры подключаются к компьютеру и записывают температуру каждого пикселя в CSV. Эти данные отлично подходят для обучения нейросети. Несколько месяцев назад учёные из университета Глазго провели эксперимент и разработали реально эффективную модель ThermoSecure для распознавания нажатых клавиш по тепловому следу.

Учёные пришли к выводу, что с клавиатуры можно относительно надёжно снимать введённые пароли через 0–60 секунд после ввода символов. Давайте посмотрим, как работает система машинного зрения пошагово.

Читать дальше →

+16

1 2 ...

28 29

31 32 ...

120 121

Обработка изображений *

Поиск пропавших людей на снимках лесного массива, полученных с помощью БПЛА или ещё один разбор задачи Цифрового Прорыва

Релиз InvokeAI 2.2: универсальный холст, удобные установщики, автозагрузка моделей и DPM++

Выявление незаконных построек по спутниковым снимкам с помощью CV

Дорогие художники: вам не стоит бояться ИИ-генераторов изображений

Ternaus: Chrome Extension

Давайте запретим нейронные сети

Kandinsky 2.0 — первая мультиязычная диффузия для генерации изображений по тексту

SciPy — интегрирование и дифференцирование, обработка изображений и сигналов

Видеоаналитика на взрывоопасном заводе площадью в 700 футбольных полей

Ternaus: сводим поиск по картинкам и по тексту

Я обучил нейросеть на своих рисунках и отдаю модель бесплатно (и научу вас делать это)

Астрофото: совмещаем одиночные кадры

Что Chrome сделал с JPEG XL и почему делать этого не стоило

Ближайшие события

Илон Маск кисти Ван Гога, или специализированные модели Stable Diffusion

Нейросети убьют 2d художников

Большой объём данных для машинного обучения — не панацея

OpenCV — быстрый старт: аннотирование изображений

Релиз InvokeAI 2.1: теперь с inpainting и Cross Attention

Как компьютерное зрение помогает определить координаты спутниковых снимков

Съём пароля с клавиатуры ПК через 0–60 секунд по тепловому следу

Вклад авторов