Обработка изображений *

Работаем с фото и видео

СтатьиПостыНовостиАвторыКомпании

0x7o 3 мая 2023 в 12:45

IF: нейросеть, которая умеет в руки и текст

2 мин

3.7K

Искусственный интеллектМашинное обучение * Обработка изображений *

Синтез изображений из текста прошел долгий путь от появления DALL-E до Stable Diffusion. Несколько дней назад был открыт код большой (4.3 млрд параметров) модели для генерации изображений, которая привлекла внимание своим новым подходом к генерации - DeepFloyd IF. В этой статье я кратко рассмотрю архитектуру модели, ее возможности и приведу примеры ее работы. Кроме того, я поделюсь ссылками на онлайн-демо на платформе Replicate для лёгкого запуска без нужды устанавливать нейросеть на свой компьютер.

SmartEngines 1 мая 2023 в 08:29

Фруктография: взгляд изнутри

Простой

2 мин

3.6K

Блог компании Smart EnginesОбработка изображений * Софт

Всем привет!

На носу майские праздники, и некоторые из нас отправятся в добровольно-принудительном порядке на дачи открывать огородный сезон, чтобы через несколько месяцев собрать урожай. Для того чтобы скрасить процесс ожидания урожая мы хотим показать нашу коллекцию томограмм овощей и фруктов, которую мы собрали в этом году.

В детстве многие из нас пытались понять, что внутри различных предметов с помощью лупы. Некоторым повезло больше, и у них был микроскоп, в который рассматривали жучков, паучков и чешуйки лука. Но нам повезло еще больше, и у нас появилась возможность посмотреть внутрь различных предметов с помощью микротомографа.

Часто так получается, что в томограф первым делом засовывают микросхему или насекомое. Об этом мы тоже рассказывали на примере исследования CPU Pentium 4 и майского жука.

Но однажды во время обеденного перерыва один из наших исследователей засунул в томограф яблоко, которое принёс с собой на перекус, реконструировал и отрисовал в нашем новом визуализаторе, часть программы STE 2.0, и получилось красиво.

А потом понеслось. Народ стал приносить овощи/фрукты и просил посмотреть, что там внутри. Конечно, можно просто порезать ножом, но это же не технологично и скучно. А тут ещё и повод протестировать реконструктор и визуализатор. Результатами полученных трехмерных реконструкций мы и хотим поделиться с вами.

+22

SmartEngines 27 апр 2023 в 09:57

Распознавание банковских карт в видеопотоке в браузере с помощью SmartEngines и WebAssembly

Средний

5 мин

3.3K

Блог компании Smart EnginesОбработка изображений * Искусственный интеллектWebAssembly * Веб-разработка *

Туториал

С активным развитием и распространением технологии WebAssembly (сокращённо WASM) появилась возможность создавать веб-модули, которые можно загружать с сервера и исполнять их прямо в браузере! Мы не смогли пройти мимо такой возможности, и, после долгих оптимизаций, представили свой модуль, умеющий распознавать банковские карты, баркоды, машиночитаемые зоны, номера телефонов и документы прямо в браузере.

Дальше мы расскажем о том, как с помощью wasm-модуля от Smart Engines распознать номер банковской карты, просто поднеся её к веб-камере ноутбука.

hukenovs 27 апр 2023 в 07:49

EasyPortrait — портретная сегментация и анализ лиц

Средний

9 мин

4.3K

Блог компании SberDevicesИскусственный интеллектМашинное обучение * Обработка изображений * Data Mining *

Всем привет! Наверняка, кто-то из вас уже пользовался сервисом видеоконференций SberJazz. Мы в нашей RnD команде решили помочь ребятам с задачей замены фона, для чего создали подходящий датасет и провели ряд исследований в направлении удаления фона (background removal). На этом мы не остановились и разметили данные для задачи анализа лица (face parsing). Это позволит пользователям применять эффекты бьютификации: сглаживание кожи, изменение размера и цвета губ или глаз, отбеливание зубов и т. д.

В данной статье мы расскажем о новом наборе данных EasyPortrait, опишем процесс его создания от идеи до разметки, и представим обученные на нем нейронные сети. Датасет и веса моделей мы выложили в открытый доступ — ссылки лежат в конце статьи и в нашем репозитории.

+17

alexprozoroff 27 апр 2023 в 06:50

Ещё один взгляд компьютерным зрением на работу коммунальных служб

3 мин

2.1K

Обработка изображений * Работа с видео * Инженерные системы * Визуализация данных * Машинное обучение *

В прошлой статье Взгляд компьютерным зрением на работу коммунальных служб удалось выявить некоторые закономерности в передвижении пешеходов в зависимости от состояния тротуаров в зимний период. Сейчас снег растаял, лужи высохли, и наконец можно запустить алгоритмы аналитики на идеальных данных — видео с уличных камер в сухой солнечный весенний день. Эта статья будет значительно короче, в ней просто сравним результаты с идеальными условиями и добавим еще одну метрику — прямолинейность движения.

AntonPolyakov 25 апр 2023 в 14:32

Иллюстрации для блогов: немного о принципах, инструментах и авторском праве

Простой

16 мин

3.1K

Обработка изображений * Искусственный интеллектКонтент и копирайтинг * Копирайт

Немного советов по подбору и обработке фото – чтобы кадры не выглядели как «в альбоме у соседа», про маркетинговую бессмыслицу на Хабре, а также про авторское право и полезные онлайновые сервисы.

+25

18 апр 2023 в 13:33

Masterpiece as a service: итоги недели нейроарта

9 мин

16K

Блог компании СберHabrИскусственный интеллектДизайнОбработка изображений *

Не так давно завершились сезоны Kubernetes и Machine Learning, подарившие Хабру множество качественных технических статей. В межсезонье мы решили отвлечься от технохардкора и предложили вместо того, чтобы писать о технологии, использовать технологию и показать её результат с точки зрения пользователей. С 4 по 14 апреля мы провели на Хабре Неделю Нейроарта. Всё это время хабраюзеры неустанно публиковали статьи с тегом Kandinsky art, сопровождая их иллюстрациями, сгенерированными нейросетью Kandinsky 2.1.

Сегодня расскажем, как жилось авторам в симбиозе с искусственным интеллектом, и по результатам недели посмотрим, смогут ли генеративные модели составить конкуренцию художникам и иллюстраторам. А заодно объявим, кто те трое счастливчиков, что благодаря этому симбиозу получат по новенькому iPhone 14 Pro.

Узнать результаты

+17

Gorislav 18 апр 2023 в 13:00

«Процедурное рисование» в ComfyUI

7 мин

79K

Искусственный интеллектМашинное обучение * Обработка изображений * Интерфейсы *

Туториал

Кто интересуется темой рисующих нейросетей знают, что сейчас самый продвинутый и часто используемый интерфейс для Stable Diffusion (далее SD) это Automatic1111. Он позволяет использовать, вероятно, все существующие возможности SD на сегодня. Множество расширений, регулярные обновления и поддержка сообщества делают его мощным и удобным инструментом для генерации изображений. Но есть и альтернативные решения, одно из которых я сегодня рассмотрю.

Статья подойдет как тем кто уже пользуется Automatic1111, так и тем кто только планирует более глубоко погрузиться в мир "процедурного рисования".

+70

dmitriizolotov 17 апр 2023 в 12:59

Тестирование python3-расширения для GIMP

Простой

4 мин

2.5K

Блог компании OTUSОбработка изображений * Python *

Туториал

Графический редактор GIMP предоставляет широкие возможности для создания расширений на языках программирования Scheme (функциональный язык, сходный с LISP) или Python. Для доступа к системным операциям и регистрации собственных действий используется общий реестр Procedural Database (PDB), через который можно выполнять любые действия со встроенными механизмами GIMP (например, создание изображения). В этой статье мы рассмотрим основы создания расширений на Python 3 и возможные подходы к тестированию расширений через PDB.

+14

Antra 16 апр 2023 в 11:23

Windows 10 с Tesla T4 в Azure на примере Stable Diffusion и Automatic1111. Недорого

Средний

7 мин

5.7K

Обработка изображений * Машинное обучение * Искусственный интеллект

Кейс

Краткое содержание:

Если хочется погонять Stable Diffusion или еще как поиграть с AI, а бесплатного Colab не хватает или есть специфические потребности, не обязательно покупать супер видеокарту. Вполне возможно, что spot instance в Azure даст вам желаемое и при этом обойдется дешевле.

И даже если видеокарта вам действительно нужна, это хороший способ понять, какой производительности карта необходима, сколько памяти требуется под ваши задачи...

(осторожно, очень много скриншотов внутри)

<Почему и Как>

Valenta_design 15 апр 2023 в 06:45

Обмануть меня не трудно... Я сам обманываться рад

Простой

2 мин

5.7K

ДизайнИскусственный интеллектМашинное обучение * Обработка изображений * Векторная графика *

Из песочницы

Начало положено.

Как человек связавший свою жизнь с искусством, и шесть лет проработав за холстом реальным, прежде чем перейти к виртуальному, мне было интересно понять как искусственный интеллект может соперничать с креативным мышлением человека.

Информационный шум и паника вокруг этой темы еще больше нагнетали и даже будоражили сознание. Ожидалось, что картинка меня поразит и заставит почувствовать себя никчемным созданием в своей нише.

Очень мне хотелось, чтобы меня удивили, чтобы я с таким же таинственным взглядом как Вилли Вонка перестала быть скептиком и уверовала.

Но уже после первой пробы мне стало ясно, что волшебной палочки не существует и «не так страшен чёрт, как его малюют». Простые запросы выдавали банальные сюжеты - в буквальном смысле визуальный мусор.

Я стала усложнять запросы и давать более точное описание, но с каждым разом становилось словно хуже. Хоть и более конкретные и неважно на русском или английском, они не давали желаемого результата и на каких-то моментах сюжеты заносило откровенно не туда. Все это омрачилось артефактами в виде вторых челюстей или ног растущих из ног персонажа. Смазанные планы, отсутствие базовой анатомии, стеклянные расфокусированные взгляды и каменные лица, статичные позы и очень скудная композиция.

В моих экспериментах было сложно выдавить хоть какие-то эмоции у персонажа. И после многочисленных попыток я ментально устала играть в эту рулетку.

Откровенно говоря, стало легче, появилось понимание, что это инструмент, а не соперник и придется затратить немало усилий для формирования запроса, а далее постобработки, чтобы воплотить свою задумку.

+10

shushpanov_official 14 апр 2023 в 11:00

«DEEPFAKE» как программа для ЭВМ — искажения реальной информации: развитие и правомерность

Простой

6 мин

1.4K

Обработка изображений * Информационная безопасность *

Обзор

Recovery Mode

Новая цифровая реальность последних лет, в большинстве технологических решений которой ядром выступает искусственный интеллект (ИИ), существенно исказила восприятие человеком разницы между реальностью и вымыслом. Один из главных «стирателей» такой грани — дипфейк‑технологии, которые можно охарактеризовать как методику автоматизированного, т. е. машинного синтезирования аудиовизуального цифрового контента (изображений, аудио, видео и даже текста) с целью создания видоизмененного и при этом максимально реалистичного контента.

Как бы то ни было, технические подделки, которые, как казалось, делают глубокие изменения внешности в тех же самых фильмах, со временем еще больше развивались и совершенствовались. А ведь несколько лет назад артикуляционная экспрессия и другие элементы синтезированного видео задавались программно‑ по большей части это была «ручная» задача, причем в режиме реального времени.

Продолжить

-5

UprightMan 14 апр 2023 в 08:01

«Глаза» беспилотных автомобилей: LiDAR и компьютерное зрение

13 мин

22K

Блог компании FirstVDSОбработка изображений * Искусственный интеллектТранспортБудущее здесь

Самоуправляемое транспортное средство может «видеть» разными способами. Человеческое зрение ему заменяют радары, камеры, лазеры, радиоволны и ультразвук. В этом обзоре поговорим о лидарах и компьютерном зрении (CV) — двух основных инструментах, на которых основано автономное восприятие окружающего мира беспилотными автомобилями. Мы коротко опишем принцип работы технологий, расскажем, кто производит и внедряет подобные устройства, а также сравним их основные достоинства и недостатки.

rudkoks 13 апр 2023 в 21:08

Стартап хочет обучить ИИ генерировать арт на лицензионных картинках

Простой

6 мин

1.5K

Обработка изображений * Научно-популярноеМашинное обучение * Искусственный интеллектIT-компании

Из песочницы

Перевод

Генеративный Интеллект, особенно ИИ преобразования текста в изображение, привлекает столько же судебных исков, сколько и венчурных долларов.

Две компании, разрабатывающие популярные художественные инструменты искусственного интеллекта, Midjourney и Stability AI, вовлечены в судебный процесс, в котором утверждается, что они нарушили права миллионов художников, обучая свои инструменты на изображениях из Интернета. Кроме того, поставщик стоковых изображений Getty Images подал в суд на Stability AI за использование изображений со своего сайта без разрешения для обучения Stable Diffusion, искусственного интеллекта, генерирующего искусство.

Недостатки ИИ - склонность к повторению данных, на которых он обучался, и, соответственно, состав обучающих данных продолжает ставить его под прицел закона. Однако новый стартап Bria утверждает, что минимизирует риск, обучая ИИ, генерирующий изображения, а вскоре и видео, "этическим" способом.

Dmittry_B 13 апр 2023 в 09:45

Разговор с Kandinsky 2.1 или не очевидный prompt

Простой

3 мин

8.9K

Обработка изображений * Научно-популярноеМашинное обучение * Искусственный интеллект

Из песочницы

Этот пост не попал бы в сеть, но астрологи объявили неделю нейроарта на Хабре. А полотно в конце поста сложно не назвать нейроартом. Kandinsky art.

nin-jin 13 апр 2023 в 09:34

Искусственный Художник — Google от мира Text-To-Img

Средний

11 мин

2.9K

$mol * Искусственный интеллектПроектирование API * Обработка изображений * Веб-разработка *

Туториал

Здравствуйте, меня зовут Дмитрий Карловский и я люблю рисовать шедевры, но у меня совсем не хватает терпения довести хоть один из них до конца.

Ранее я уже показывал вам самописного убийцу Гугл Поиска. Пользуюсь им до сих пор и доволен чистотой выдачи. Теперь же мы сделаем убийцу Artstation для творческих личностей, у которых терпения хватает лишь на несколько минут, за которые надо успеть создать настоящую красоту. И в этом нам помогут нейронные сети.

Далее вас ждёт реверс-инжениринг HuggingFace API для использования модели Kandinsky, поддержка запросов на 100 языках мира благодаря модели Small100, проектирование бесконечной виртуальной ленты в несколько строк на $mol и, конечно, примеры творчества Искусственного Художника.

Вскрыть пациента

+10

Maslukhin 13 апр 2023 в 07:45

Раскраски — лучшее применение генеративных сетей :)

Простой

2 мин

6.5K

Обработка изображений * Машинное обучение * Искусственный интеллект

Кейс

Мне кажется, я нашел самое правильное применение генеративных сетей, рисующих по описанию. Это генерация раскрасок!

У меня есть дети. Дети равно раскраски. Раскраски - это постоянный поиск всякой фигни, типа “хочу чтобы был единорог, а рядом его малыш панда, и чтобы малыш был похож на маму”. Интересно, что нейросети неплохо справляются с такими задачами. Причем, забавный момент - результаты начинающих нейросетей, типа того же Кандинского, принимаются более благосклонно, потому что рисуют они пока плохо. Но! эта “плохость” и ошибки в изображениях очень похожи на рисунки ребенка и воспринимается за творение собрата по детсаду/школе.

+13

mr_1va 13 апр 2023 в 06:39

Путь в поисках мастерства: IT-практика в промышленном гиганте

Простой

8 мин

2.6K

Блог компании «Норникель»Обработка изображений * Машинное обучение * Карьера в IT-индустрииИскусственный интеллект

Обзор

Всем привет! Продолжим погружение в тему, и сегодня я бы хотел поделиться реальными задачами и кейсами из практики в Норникеле по направлениям Industrial AI и Computer Vision. Ни для кого не секрет, что еще несколько лет назад машинное обучение в промышленности уступало в развитии таким прикладным направлениям, как ML в ИТ / телекоме, банковской сфере, ритейле и т.п. Часто при общении с коллегами из других исследовательских институтов, R&D отделов крупных компаний разговоры о промышленных кейсах в машинном обучении напоминали байки о рыбалке. Или, скорее, рассказы авантюристов-золотоискателей, бросивших стабильность и уют хорошо изведанных земель ИТ и машинного обучения и ушедших в дикие пустынные края в поисках скрытого от всех сокровища. Все быстро меняется и стараниями флагманских отраслевых компаний, крупных исследовательских коллективов работа над кейсами Industrial AI шагнула далеко вперед - от редких и робких хакатонов к полномасштабной разработке, внедрению и эксплуатации моделей в производственные процессы.

kucev 12 апр 2023 в 15:47

Пять примеров успешного использования ИИ на производстве

Простой

11 мин

30K

Обработка изображений * Машинное обучение * Искусственный интеллектData Mining * Big Data *

Обзор

Перевод

В октябре 2019 года компания Microsoft заявила о том, что искусственный интеллект помогает производственным компаниям обгонять по показателям конкурентов: использующие ИИ производители показывают результаты на 12% лучше, чем их соперники. Поэтому мы скорее всего увидим всплеск применения технологий ИИ на производстве, а также рост новых высокооплачиваемых должностей в этой области.

В статье мы расскажем о пяти примерах использования ИИ-технологий на производстве. Также мы поделимся историями успеха современных промышленных компаний, проанализировав, как внедрение ИИ помогло их бизнесу.

Читать дальше →

Vital_Soorano 12 апр 2023 в 15:07

Чем отличаются ChatGPT3 и ChatGPT4?

Простой

4 мин

13K

Обработка изображений * Научно-популярноеМашинное обучение * Искусственный интеллект

Из песочницы

Перевод

Начнем с обзора.

ChatGPT 4 был запущен 4 марта и стал предметом активного обсуждения. Одним из аспектов обсуждения был вопрос о том, чем он отличается от своего предшественника ChatGPT 3. Присяжные еще не определились, потому что ChatGPT 4 всё еще не полностью доступен публично и является платной версией, в отличие от своего предшественника, что препятствует широкому распространению. Но в открытом доступе уже достаточно информации, чтобы провести предварительное сравнение между двумя версиями. В индустрии программных технологий переход с третьей версии на четвертую означает значительное обновление, и это действительно произошло с новой версией ChatGPT 4. Конечно, она не получила всех тех обновлений, которые ожидали эксперты, но все же она обладает большим потенциалом. Она превосходит свою предшественницу по многим параметрам, таким как способность обрабатывать информацию, понимание контекста подсказок и обработка как текста, так и изображений. В этой статье проводится сравнение двух версий по следующим разделам.

1 2 ...

23 24

26 27 ...

120 121

Обработка изображений *

IF: нейросеть, которая умеет в руки и текст

Фруктография: взгляд изнутри

Распознавание банковских карт в видеопотоке в браузере с помощью SmartEngines и WebAssembly

EasyPortrait — портретная сегментация и анализ лиц

Ещё один взгляд компьютерным зрением на работу коммунальных служб

Иллюстрации для блогов: немного о принципах, инструментах и авторском праве

Masterpiece as a service: итоги недели нейроарта

«Процедурное рисование» в ComfyUI

Тестирование python3-расширения для GIMP

Windows 10 с Tesla T4 в Azure на примере Stable Diffusion и Automatic1111. Недорого

Обмануть меня не трудно... Я сам обманываться рад

«DEEPFAKE» как программа для ЭВМ — искажения реальной информации: развитие и правомерность

«Глаза» беспилотных автомобилей: LiDAR и компьютерное зрение

Ближайшие события

Стартап хочет обучить ИИ генерировать арт на лицензионных картинках

Разговор с Kandinsky 2.1 или не очевидный prompt

Искусственный Художник — Google от мира Text-To-Img

Раскраски — лучшее применение генеративных сетей :)

Путь в поисках мастерства: IT-практика в промышленном гиганте

Пять примеров успешного использования ИИ на производстве

Чем отличаются ChatGPT3 и ChatGPT4?

Вклад авторов