Как стать автором
Поиск
Написать публикацию
Обновить
164.82

Обработка изображений *

Работаем с фото и видео

Сначала показывать
Порог рейтинга
Уровень сложности

DLSS 4 делает 240 fps в 4К: Как и на каких видеокартах работает новый апскейлер от NVIDIA

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров43K

Компьютерные инновации — явление весьма относительное и зависящее от угла восприятия. Потому что чаще всего за громкими анонсами скрываются минорные улучшения существующих решений, которые маркетологи пытаются выдать за революционные прорывы. Тем не менее, Deep Learning Super Sampling версии 4 от NVIDIA действительно претендует на звание серьезного технологического скачка в области рендеринга графики. Сегодня поcмотрим, что особенного в этой технологии и почему она вызывает такой ажиотаж.

Читать далее

Лентикулярная печать, интегральные изображения, дисплеи светового поля и немного ещё

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров9.4K
Картинка Youtube-канал «Howseography»

Что вспоминается в первую очередь, когда думаешь о детских годах? Лично для меня — это переливающиеся 3D-открытки, которые раньше продавались почти в каждом киоске.

Помните такие? Поворачиваешь под разными углами — и появляются разные изображения.

В детстве мы даже не задумывались о том, что их можно сделать самостоятельно. Казалось, что это что-то слишком сложное.

Но, как выяснилось, такие картинки вполне реально создать самому, и результат практически не отличается от заводского!
Читать дальше →

Распознавание снимков — почему нейросеть не лучший выбор, и как мне помог сервис распознаваний капчи — личный опыт

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров1.7K

До определенного момента я свято верил в то, что в современном мире ручное распознавание капчи постепенно становится анахронизмом, особенно, когда речь идет о таких простых капчах - как капча картинка (где необходимо просто распознать текст на фотографии и ввести его в текстовом формате). Но знаете, оказалось все не так однозначно (как бы это ни звучало). 

Читать далее

В один клик — как я тестировал фильтры для фото

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров1.4K

Похоже, моя кузина становится для меня музой. В прошлый раз она мне подсказала тему для статьи про видео. А на днях мы с ней болтали, и сестренка спросила: мол, вот ты — фотограф, а скажи, какие ты знаешь интересные фильтры для обработки фото, и вообще, что сейчас в моде. 

Признаться, вопрос меня поставил в тупик. Я, конечно, пользуюсь пресетами при обработке. В свое время написал для себя несколько сценариев в Adobe Lightroom и ранних версиях Photoshop. Однако сейчас я больше предпочитаю штучную обработку в Фотошопе, а стилизация снимков зависит от сюжета, цели, в конце концов, от настроения. Но никак не от моды.

Тем не менее вопрос заставил задуматься. И вот как-то сложилось, что работу я закончил, планов не было, а времени свободного оказалось внезапно много. И решил пошерстить интернет на предмет поиска тенденций в фильтрах. Информации вылезло много, но я обратил внимание вот на этот материал.

По совпадению, я в свое время, тестировал редактор, фильтры из которой здесь описываются — как альтернативу Photoshop для одной из статей. Чтобы изучить все возможности, я приобрел платную версию, а лицензия у нее — бессрочная. Так что прога по-прежнему стоит на моем старом ноутбуке, благо системные требования у софта очень гуманные.

Кстати, надо заметить, что ФотоМАСТЕР — программа необычайно удобная для новичков и любителей. Так, она сильно приглянулась моей сестренке. В редакторе она делает коллажи или создает мемы и открытки со стикерами и надписями. Но больше всего кузине нравится функция «Идеальный портрет» и возможность AI-пластики лица и фигуры. С ними она превращает свою и без того симпатичную мордашку в эталон красоты, или делает талию еще тоньше.

Читать далее

Фильтр Гаусса на стероидах: секреты ускорения вычислений

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров5.8K

Привет, Хабр! Представьте, что вы пытаетесь обработать фотографию высокого разрешения на вашем смартфоне — добавить размытие, убрать шум или улучшить качество изображения. Кажется, задача проста, но за кулисами работает алгоритм, требующий немало вычислительных ресурсов. Речь идет о фильтре Гаусса – одной из самых популярных операций в области компьютерной обработки изображений.

Для каждого пикселя нужно выполнить множество операций сложения и умножения, особенно если размер фильтра велик. Это становится серьёзным препятствием, когда есть требования к работе в режиме реального времени, например, при обработке видео, адаптации для беспилотных летательных аппаратов и пр. Но что, если сказать, что такие вычисления можно ускорить в десятки раз с незначительной потерей качества?

Читать далее

Синтез и восстановление голограмм-проекторов. Часть 1

Время на прочтение5 мин
Количество просмотров1K

Всё началось в далёком 2004 году, когда я учился в СПб ГУ ИТМО на кафедре Прикладной и компьютерной оптики (ПиКО). Однажды на лекции по "Основам оптики" преподаватель рассказал о голографии. Эта тема меня сразу увлекла, и, несмотря на то, что многое тогда было непонятно, проявленный интерес не угас до сих пор. Помню, как лектор объяснял свойства голограмм, а так же привел схему связывающую параметры записи с типом получаемых голограмм: Габора, Лейта и Упатниекса, Денисюка и другие (рис. 1). Это был тот не редкий момент, когда: «Очень интересно и ничего не понятно»

Читать далее

Стереокамера машинного зрения c поддержкой ИИ на базе FPGA и Arduino Portenta H7

Время на прочтение10 мин
Количество просмотров8.7K

В статье рассмотрен процесс проектирования модуля стереокамеры на базе двух монохромных сенсоров MT9V034. Для управления матрицами и сшивания картинки с двух видеопотоков используется FPGA Gowin GW2AR. Использование FPGA и сенсоров с глобальным затвором позволило точно синхронизировать время экспозиции, таким образом сшитое изображение содержит два кадра, которые снимают объект в одно и то же время с наносекундной точностью. Модуль подключается в качестве «шилда» к промышленной отладочной плате Arduino Portenta H7. Комбинированный видеопоток обрабатывается библиотекой машинного зрения OpenMV на Arduino. Разработка проекта ведется в специализированной IDE от OpenMV на MicroPython, что позволяет быстро прототипировать устройства с использованием алгоритмов машинного зрения. После отладки камера работает автономно, весь код исполняется микроконтроллером на Arduino. В библиотеке OpenMV реализовано большое количество функций обработки изображений, от базовых преобразований и фильтров, до машинного обучения. Поддержка TensorFlow Lite позволяет обнаруживать объекты на стереопаре, сопоставлять их и рассчитывать расстояние до этих объектов. Так же в библиотеке реализованы функции построения карты глубин, что позволяет использовать разработанную камеру для реализации алгоритмов автономной навигации.  

Читать далее

Xiaohongshu: новая замена TikTok и  запрещенного Instagram, которая уже порвала американский App Store

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров9.5K

Пока пользователи из России досматривали в TikTok ролики, опубликованные до 2022 года, западный мир не стал дожидаться его полной блокировки и взял, да и нашел ему альтернативу. Им стало китайское приложение под названием Xiaohongshu (Сяохуншу). И это несмотря на то, что у сервиса нет ни англоязычного названия, ни адаптированного интерфейса, ни даже функции перевода, что не помешало ему возглавить топ загрузок американского App Store. А если разобрались американцы, почему бы не попробовать и нам? Тем более, что помимо ТикТока нам надо найти, чем заменить еще и запрещенный в России Инстаграм.

Читать далее

Смотрим «под капот» бэкенда изображений в ОК

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров4.3K

Ни одна современная соцсеть не обходится без картинок и фото. ОК — не исключение. Но чтобы пользователи соцсети могли загружать свои фото, ставить аватарки и иначе использовать свои изображения, нужны отлаженные механизмы и целый стек обработки на стороне бэкенда.

Меня зовут Руслан Измайлов. Я ведущий Java‑разработчик в ОК. В этой статье я хочу показать на конкретном юзкейсе весь путь изображения в соцсети ОК: от его загрузки на портал до скачивания с узлов CDN.

Читать далее

Как роботы забрали скучную работу у бухгалтеров

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров12K

В 2016 году Минфин заявил, что потребность в бухгалтерах в ближайшие годы будет стремиться к нулю. Однако через два года прогноз скорректировали: оказалось, что без бухгалтеров невозможно обойтись. Вместе с тем автоматизация отдельных сфер их деятельности может быть оправданной и весьма эффективной.

Всем привет! Меня зовут Мирза Абдулмеджидов, я руководитель проектов ROBIN компании SL Soft. Сегодня расскажу про интеллектуальную автоматизацию и поделюсь своим опытом внедрения платформы ROBIN для трансформации бухгалтерских процессов на примере одного проекта, реализованного для крупного продуктового ритейлера.

Читать далее

Сжатие медиа для экономии места

Уровень сложностиПростой
Время на прочтение51 мин
Количество просмотров5.8K

Вы наверняка имеете медиа файлы закодированные не самым эффективным кодеком (H.264, JPEG, MP3). И вы можете сократить их размер вплоть до 75% перекодировав медиа современными альтернативами (H.265, AVIF, OPUS).

Использовать для этого можно консольные утилиты ffmpeg и magick.

Рассмотреть альтернативы

6 внутренних факторов, влияющих на эффективность распознавания лиц с видеокамер

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров3.2K

Всем привет! В предыдущей статье я уже рассказывал о том, как внешние факторы могут влиять на скорость и точность работы систем распознавания лиц на видеопотоках. Сегодня речь пойдет о не менее важных внутренних аспектах — архитектуре системы и правильном выборе и настройке оборудования.

Читать далее

В гостях у классиков. Модели для генерации фото с русскими писателями (FLUX + LoRA)

Время на прочтение4 мин
Количество просмотров7K

В ходе новогодних экспериментов с дообучением FLUX, у меня появилось несколько моделей которыми я хотел бы поделиться с сообществом и рассказать про их особенности. Про то, как сделать такую модель самому, я написал в предыдущей статье.

Дообучать можно на чем угодно, а не только на лицах. Можете взять несколько картинок (хватит 15-30, если они не очень разнообразны) одного стиля или класса с ресурса типа Pinterest или просто нагуглить.

Запускать будем через ComfyUI. Это приложение само по себе очень гибкое и мощное (интерфейс видно на картинке), так что, если поразбираетесь в нём, то сможете автоматизировать трудоёмкие процессы при работе с нейросетями. Например, оцветнение старых изображений с последующим их масштабированием.

К тому же, есть тысячи моделей от других пользователей, которые вы сможете запускать подобным образом. Обычно, правда, это перенос аниме или что-то пикантное.

Читать далее

Ближайшие события

Увеличение растровых изображений – какой максимальной схожести с оригиналом мы можем добиться и как? А можно побыстрее?

Уровень сложностиСредний
Время на прочтение25 мин
Количество просмотров4.3K

В этой статье Вы узнаете как теоретические аспекты апскейла сочетаются с практической реализацией, уделяя особое внимание оптимизации алгоритмов на C# для достижения высокой производительности. Рассмотрим сравнительный анализ классических и новых методов, включая нейросетевые подходы, и предложим несколько интересных идей для будущих исследователей. Надеюсь, эта статья станет ценным ресурсом, если вас интересует обработка изображений и повышение эффективности программного кода.

Апскейл на пределе: вперёд!

Оцифровываем музыку из XIX века

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров3.5K

Всем привет! На связи школьный кванториум лицея современных технологий управления №2 г. Пензы. Недавно мы загорелись идеей создать лицейский технический музей, так как в нашем городе не осталось ни одного школьного музея с таким направлением. Одна из целей задумки — проследить за эволюцией информационных технологий и дать возможность детям потрогать, послушать, посмотреть и поиграться с ними.

Онлайн-стриминг музыки сегодня для современных детей — это технология, с которой они родились. Музыка по сети кажется им органичной и естественной. Всё ещё сохраняется понимание того, что музыкальные файлы можно скачать, поместить на карту памяти или получить аудио на каком-то легендарном носителе CD (который некуда вставить в окружающей их технической действительности). LaserDisc своим видом (хоть и огромным) выдаёт своё предназначение, и догадки всё ещё верны. Дети находятся на грани понимания совместимости карандаша с аудиокассетой, и этот вопрос становится чуть ли не олимпиадным, за который можно стать почётным агонистом в телепередаче Юрия Вяземского. Винил — хайп, круто, лампово, аудифильство, но какое-то волшебное и без подробностей. Магнитная лента для аудиозаписи (например, Свема) — коричневая мишура на новогоднюю ёлку в бобине. Далее опрашивать бесполезно — видимая детьми вселенная технологий заканчивается. Валик (цилиндр) для фонографа выглядит как артефакт для фильма «Пятый элемент» и своим видом даже не намекает ни на что современное. Что же ещё дальше от сегодня?

Ну-ка, удивите!

Как добавить надпись на картинку

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров4K

Я люблю работу с изображениями. Не очень разбираюсь, но люблю. Всегда с интересом читаю статьи про методы триангуляции, детектирования границ, фильтры, перцептивные хэши, форматы изображений. Лет 10 назад даже пилил по вечерам конвертер из растра в вектор, но тот проект так и остался незаконченным.

А теперь мы с командой разрабатываем PIM-систему, это инструмент по управлению информацией о товарах. Среди задач в беклоге я нашел задачу себе по душе: попробовать реализовать массовую генерацию инфографики для маркетплейсов. А в этой статье я хочу рассказать о подходе, который я использовал.

Читать далее

Создаем воспоминания. Осваиваем FLUX, LoRA и ComfyUI

Время на прочтение7 мин
Количество просмотров26K

Разбираюсь на праздниках с дообучением моделей для генерации изображений. Было интересно, насколько сложно дообучить модель для генерации изображений по тексту в домашних условиях, сколько нужно обучающих данных и как затем генерировать качественные фотографии и иллюстрации.

Чтобы через время не забыть про особенности процесса и как-то его зафиксировать, решил поделиться наработками. Под катом подробности и еще немного фотографий АБССС.

Читать

Обзор на разнообразные интерфейсы Stable Diffusion. Automatic1111 — не одинок

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров15K

Для многих пользователей, занимающихся генерацией изображений с помощью ИИ у себя дома, интерфейс Automatic1111 стал стандартным. Однако мир ИИ-технологий не стоит на месте, и появляются новые инструменты и интерфейсы, которые могут предложить ещё больше возможностей и удобства. В этой статье я рассмотрю, какие альтернативы существуют для Automatic1111 и ComfyUI и почему вам стоит обратить на них внимание.

Вы ведь наверняка не слышали о такой штуке, как программа, позволяющая использовать Stable Diffusion для создания и редактирования текстур 3D-моделей с полной UV-разверткой? Или о полноценной бесплатной замене ИИ-инструментария Photoshop, которая доступна совершенно бесплатно и без всяких «но»? Однако статья — не просто подборка случайных программ. Сначала мы изучим основы и немного историю, а затем перейдём к самому интересному.
Читать дальше →

Эволюция архитектур нейросетей в компьютерном зрении: детекция объектов

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров4.7K

Всем привет! Это завершающая статья в серии по эволюции архитектур нейронных сетей в компьютерном зрении. Она будет полезна тем, кто только погружается в сферу и пробует систематизировать свои знания, поэтому я осознанно не погружаю читателей в глубокие расчеты и вычисления. Посмотрим на R-CNN, Fast R-CNN, Faster R-CNN, Mask R-CNN, SSD, RetinaNet, EfficientDet, YOLO.

Детекция объектов

Илон Маск сделал бесплатным чат-бот Grok от xAI. Что он умеет и почему это круто

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров28K

Если вы только что вылезли из-под камня или вернулись с Марса, то вам нужно срочно знать: Grok, чат-бот Илона Маска, теперь стал доступен бесплатно. Это не просто новость, а настоящий прорыв в мире техники и общения с искусственным интеллектом. Давайте разберёмся, почему Grok – это ваш новый лучший друг и как вы можете использовать его на полную катушку.

Читать далее

Вклад авторов