Все потоки

Обработка изображений *

Работаем с фото и видео

СтатьиПостыНовостиАвторыКомпании

gov0run 2 мая 2024 в 08:40

История технологий отображения: от камеры-обскуры до OLED-дисплея

22 мин

5.6K

Блог компании FirstVDSОбработка изображений * Научно-популярноеМониторы и ТВ

Ретроспектива

Сотни лет назад методы отображения графики и текста были далеки от современных разработок. Как правило, использовались простые устройства с механическим принципом действия. Впоследствии вывод графики претерпевал изменения и эволюционировал. Механические детали, крутящиеся и трущиеся, заменялись электронными компонентами — тихими, точными и относительно долговечными.

Дисплеи, возникшие на заре технологий XX века и представлявшие собой не иначе как инженерную эвристику, превратились в сложные системы с просчитанной до «нулей и единиц» логикой. Поэтому довольствуясь яркостью и точностью OLED-дисплеев сегодня, можно повспоминать бледность и смазанность ЭЛТ-дисплеев, бывших еще «вчера».

А можно пойти дальше и узнать, как люди из XX века смотрели передачи на вращающемся диске с дюжиной дырок. А может, и еще чего страшнее...

Читать далее

+15

pokrovsk 2 мая 2024 в 08:37

Как я тестировал российские фоторедакторы, полжизни проработав в Фотошопе

Простой

9 мин

56K

Обработка изображений * Софт

Обзор

Оказывается, пока мы решаем вопросы с продлением подписки через зарубежных друзей или вспоминаем опыт пиратства, наши разработчики вовсю занимаются импортозамещением. Я решил узнать, а какие вообще сегодня есть российские фоторедакторы, способные стать если не полной заменой, то хотя бы достойной альтернативой Фотошопу.

Почитав отзывы и посоветовавшись с друзьями и коллегами, выбрал 3 программы, которые мне показались наиболее интересными и решил их протестировать. Для проверки взял вот такой портрет кота. Фото сделано случайно — я еще не успел выставить свет, да и снимать пришлось без долгой пристрелки. Так что тут понадобится продвинутая техническая ретушь.

Читать далее

+103

pokrovsk 28 апр 2024 в 10:16

Паразитные оттенки в фотографии: причины и способы удаления

Средний

11 мин

11K

Обработка изображений *

Из песочницы

В свое время мне часто приходилось сталкиваться с такими проблемами, как некорректная цветопередача, цветовые шумы и артефакты, портящие кадр. Поэтому решил, что начинающим фотографам будет полезно знать, в чем причина появления паразитных оттенков в фотографии и как с ними можно бороться — в процессе съемки и при постобработке.

Читать далее

+12

maksim_sitnikov 27 апр 2024 в 04:30

Решение проблемы дымки на изображениях с использованием .NET: Простой и эффективный подход

Средний

3 мин

3.1K

Математика * Обработка изображений * Алгоритмы * .NET *

Туториал

Простое .NET решение для четких фото: избавьтесь от дымки или тумана на изображениях всего за несколько шагов!

Читать далее

+11

The-Founder-1 26 апр 2024 в 15:44

ViT для новичков: как нейросети научились определять зависимости в изображениях

Простой

8 мин

7.8K

Математика * Python * Машинное обучение * Обработка изображений *

Обзор

В этой статье мы попытаемся рассказать про трансформерную архитектуру VIT и предысторию его формирования. Сегодня не совсем понятно, почему этот "формат" нейронок настолько эффективен. Некоторые говорят механизм внимания, но некоторые практики делают больше ставок в области Computer Vision на MetaFormer. https://github.com/sail-sg/poolformer

Нейросети остаются для нас “теневым” процессом, подобным черному ящику. И изучение Deep Learning уже напоминает больше не математику, а биологию, где мы следим за поведением нашего детища.

Читать далее

+10

SmartEngines 26 апр 2024 в 08:19

Локальная REST-служба, или как за 5 минут интегрировать Smart ID Engine

7 мин

1.2K

Блог компании Smart EnginesПроектирование API * Обработка изображений * Искусственный интеллект

Сегодня мы расскажем, как встроить нашу систему распознавания документов, удостоверяющих личность, Smart ID Engine в виде локально работающей службы с интерфейсом REST API.

Читать далее

+5

eshono 25 апр 2024 в 10:20

Векторизация амебы

Простой

25 мин

1.5K

Обработка изображений *

Туториал

Этот текст написан для владеющих минимальными навыками работы в Матлаб. Из математики нам потребуются некоторые материалы из учебников по Информатике для 10 и 11 классов. Мы попытаемся совместно написать программу векторизации некоторых изображений.

/

1. Предварительная обработка.

Мы будем векторизовать вот это изображение амебы:

Читать далее

+5

SSul 25 апр 2024 в 08:00

Как я написал свой первый классификатор эмоций

Средний

24 мин

4.6K

Блог компании SimbirSoftПрограммирование * Обработка изображений * Машинное обучение *

Туториал

Всем привет! Немного о себе. Меня зовут Максим, я работаю специалистом по Machine Learning в компании SimbirSoft. Последние два года я углубленно изучал область машинного обучения и компьютерного зрения и сегодня с удовольствием поделюсь с вами опытом разработки личного пет-проекта.

В этой статье я расскажу о своем пути от идеи до реализации своего первого классификатора эмоций. Мы обсудим с вами методы, инструменты и техники, которые я применял в процессе создания своего проекта. Анализ данных, выбор модели, обучение и оценка результатов – каждый этап разработки имеет свои особенности и трудности, о чем я с удовольствием поделюсь с вами.

Почему меня привлекла именно эта тема? Во-первых, я уже решал аналогичную задачу на коммерческом проекте, которая включала распознавание и идентификацию лиц. Кроме того, меня заинтересовала эта задача тем, что она состоит из двух этапов: сначала детекция лица на изображении, а затем классификация эмоций, которые испытывает человек.

Статья будет полезна начинающим разработчикам в области Computer Vision, а также всем, кому интересна тема машинного обучения. Вы узнаете, с какой стороны подходить к решению задач с распознаванием лиц и что можно для этого использовать (подходы, инструменты и технологии).

Читать далее 😎

+5

turchan 24 апр 2024 в 06:31

Невероятный уровень «галлюцинирования» и проявление эмпатии от ChatGPT

Простой

2 мин

9.2K

Обработка изображений *

Кейс

Recovery Mode

Я много раз слышал о том, что ChatGPT галлюцинирует, то есть придумывает то, чего в реальности нет, но никогда с этим не сталкивался. Были какие-то неточности, но я их списывал на неактуальность базы данных или не замечал.
Или как-то попросил его исправить грамматические ошибки, он их исправил, только зачем-то еще и текст в 2 раза сократил.
На днях дочке задали выучить слова. Текст был написан от руки, и ей было трудно читать. Я подумал, что надо бы сделать печатные быквы и распечатать, переписывать не хотелось, решил использовать ChatGPT.

Читать далее

-14

Odin_Himself 21 апр 2024 в 21:27

«Строка бога» и «лакмусовая бумажка» для ИИ-генераторов изображений

Простой

6 мин

8K

Интерфейсы * Искусственный интеллектМашинное обучение * Научно-популярноеОбработка изображений *

Мнение

Здравствуйте, уважаемые читатели!

В этой статье я хотел бы привести простой пример методологии, которую использую лично я для оценки возможностей нейросетей-художников, а также для работы с ними.

Кроме того, хотелось бы ввести в обиход промт-инженеров два новых термина.

Читать далее

+2

ErmIg 11 апр 2024 в 12:08

Теоретическая и реальная производительность Intel AMX

Сложный

11 мин

6K

Искусственный интеллектОбработка изображений * Алгоритмы * C++ * Высоконагруженные системы *

Туториал

AMX (Advanced Matrix Extension) - это модуль аппаратного ускорения умножения матриц, который появился в серверных процессорах Intel Xeon Scalable, начиная с 4 поколения (архитектура Sapphire Rapids).

В начале этого года ко мне в руки наконец попал сервер, с данным типом процессора.

Конкретно модель Xeon(R) Gold 5412U - это 24 ядерный процессор с тактовой частотой в 2.1 GHz. При этом 8 приоритетных ядер могут разгонятся до 2.3 GHz, а 1 ядро до 3.9 GHz в Turbo Boost). Кроме того данный процессор поддерживает 8 канальную DDR-5 4400 MT/s.

Мне как человеку, достаточно долгое время посвятившему оптимизации алгоритмов компьютерного зрения и запуска нейронный сетей на CPU (библиотеки Simd и Synet), было интересно: на сколько AMX позволяет реально ускорить вычисления и как извлечь из него максимальную производительность.

Далее я постараюсь максимально подробно ответить на данные вопросы. Прежде все я буду касаться вопросов однопоточной производительности (многопоточную рассмотрю позже).

Далее много кода на С++...

+30

kuznetsoff87 10 апр 2024 в 09:12

OmniFusion 1.1: мультимодальность теперь и на русском

Сложный

7 мин

11K

Блог компании AIRINatural Language Processing * Искусственный интеллектОбработка изображений * Алгоритмы *

В прошлом году на конференции AIJ 2023 мы представили первую версию OmniFusion — мультимодальной языковой модели (LLM), способной поддерживать визуальный диалог и отвечать на вопросы по картинкам. Спустя несколько месяцев мы готовы представить обновление — OmniFusion 1.1 — SoTA на ряде бенчмарков (среди моделей схожего размера) и, более того, модель хорошо справляется со сложными задачами и понимает русский язык! Самое главное — всё выкладываем в открытый доступ: веса и даже код обучения.

Ниже расскажем об особенностях модели, процессе обучения и примерах использования. В первую очередь остановимся на архитектуре, а потом отдельно расскажем о проделанных экспериментах как в части архитектурных трюков, так и о работе с данными. Ну а несколько интересных кейсов на англ и русском языках можно посмотреть на палитре ниже.

Читать далее

+20

snk4tr 9 апр 2024 в 07:15

Открываем YandexART API и рассказываем, как мы учили нейросеть создавать картинки, которые понравятся людям

16 мин

21K

Блог компании ЯндексБлог компании Yandex Cloud & Yandex InfrastructureОбработка изображений * Машинное обучение * Искусственный интеллект

✏️ Технотекст 7

В Yandex Cloud с сегодняшнего дня открыт доступ к тестированию API YandexART — нейросети для генерации изображений и анимаций, которая лежит в основе приложения Шедеврум. Протестировать API можно в сервисе Foundation Models, в котором доступно несколько моделей машинного обучения, включая YandexGPT для генерации текстов и эмбеддинги для задач семантического поиска.

Читать далее

+38

t3chnowolf 8 апр 2024 в 14:48

Google пытается оптимизировать формат JPEG, увеличив компрессию на 35%. Что это за технология?

4 мин

15K

Блог компании МТСOpen source * Обработка изображений *

Формат изображений JPEG появился ещё в конце прошлого века, причём актуальность он не теряет, а, наоборот, набирает. Казалось бы, что можно изменить в технологии, которой столько лет? В Google посчитали, что сейчас самое время для оптимизации формата, а именно повышения эффективности компрессии. Что предложили в Google и как работает новая технология?

Читать далее

+31

Xcom-shop 5 апр 2024 в 06:43

Топ-11 МФУ из разных сегментов — на любой вкус и кошелек

Простой

9 мин

19K

Блог компании Группа компаний X-ComПериферияОбработка изображений *

Дайджест

Многофункциональные устройства включают в себя 3, а иногда даже 4 аппарата сразу, и иногда такая универсальность может показаться излишней. Но часто их приобретение в таком комплекте является единственно верным выбором — из-за требований к месту размещения или особенностей работы. Сегодня мы рассмотрим наиболее популярные МФУ, которые продолжают поставляться в Россию и доступны (по крайней мере в нашем интернет-магазине).

Читать далее

+4

ddimitrov 4 апр 2024 в 09:54

Kandinsky 3.1 — новая быстрая модель генерации изображений по тексту

Средний

15 мин

34K

Блог компании SberDevicesБлог компании СберNatural Language Processing * Машинное обучение * Обработка изображений *

Обзор

Прошёл ровно год с момента релиза модели Kandinsky 2.1 — именно эта модель принесла известность нашей исследовательской группе Sber AI Research и дала толчок развитию всей линейки моделей Kandinsky. В честь этой даты мы выпускаем новую версию модели Kandinsky 3.1, о которой я расскажу подробнее в этой статье.

Читать далее

+72

Mixiw 4 апр 2024 в 06:32

Рисуем с нейросетями: Есть ли у ИИ-художника свой стиль?

Простой

2 мин

2.1K

Блог компании X5 TechИскусственный интеллектДизайнГрафический дизайн * Обработка изображений *

Мнение

Привет, Хабр! Я – Михаил Суворов, ведущий дизайнер коммуникаций в X5 Tech. В статье я ставлю эксперименты над ИИ, пока у них нет возможности “дать сдачи” человеку. Если серьёзно, то проверим гипотезу, может ли нейросеть, генерирующая изображения, иметь собственный “авторский стиль”.

Читать далее

+9

SmartEngines 20 мар 2024 в 08:27

Что дороже, томограф или драгоценный камень в нём?

Простой

3 мин

3.5K

Блог компании Smart EnginesОбработка изображений * Искусственный интеллект

Кейс

Привет, Хабр!

Идея этого поста родилась при работе с геммологами, которые занимаются оценкой качества драгоценных изделий и драгоценных камней, оценкой стоимости и выявлением подделок. Исследования были направлены на то, чтобы выяснить, что может рассказать о внутренней структуре драгоценностей наша программа Smart Tomo Engine (ознакомиться с которой можно у нас на сайте Smart Engines).

Читать далее

+23

Neurohudozhnik 16 мар 2024 в 12:30

Художественные приемы и профессиональные термины для создания изображений с ИИ. Всё, что нужно знать

7 мин

20K

Искусственный интеллектОбработка изображений *

Из песочницы

В этой статье собраны все основные понятия для написания текстовой подсказки для генерации изображений с помощью нейросети.

Если вы хотите создавать качественные изображения, нужно понимать (или просто запомнить) некоторые профессиональные термины и приемы, используемые художниками и фотографами.

В этой статье мы разберем такие ключевые факторы, как высокая детализация, освещение, стиль изображения и другое.

Читать далее

+25

mr-pickles 11 мар 2024 в 09:47

Трансформеры, группы преобразований и self-attention

Сложный

10 мин

5.2K

Блог компании Wunder FundПрограммирование * Алгоритмы * Обработка изображений * Искусственный интеллект

Перевод

В подвижном мире развивающихся нейросетевых архитектур главную роль играет эффективность работы моделей. Тонкая настройка сетей под конкретные задачи предусматривает интеграцию в них априорных знаний. Делается это посредством стратегических корректировок архитектур сетей. Это — процедура, выходящая за рамки подстройки параметров. Речь идёт о внедрении в нейросеть информации, которая позволит сети понять то, что нужно её создателю. Один из способов это сделать заключается в использовании априорных знаний геометрического характера. Именно этому и посвящена данная статья.

Читать далее

+14

1 2 ...

14

15 16 ...