Обработка изображений *

Работаем с фото и видео

57,86

Рейтинг

2 авг 2024 в 05:0960

Обработка изображений * Машинное обучение * Облачные сервисы * Искусственный интеллектБудущее здесь

Представлен бесплатный нейроапскейлер AuraSR-v2 с бустом разрешения любых изображений в восемь раз. Заливаете шакал — получаете качество профессионального фотоаппарата.

Проект работает из браузера, в нём нет рекламы, нет водяных знаков и не требуется кредитов на апскейл.

atomlib

29 июл 2024 в 07:5647

Обработка изображений * Сжатие данных * Научно-популярное

Акиёси Китаока — японский специалист в области экспериментальной психологии, который изучает чужие и создаёт собственные зрительные иллюзиии. В личном микроблоге он публикует примеры подобных изображений и анимаций.

Вчера Китаока опубликовал загадку, чем отличаются две с виду полностью одинаковые картинки. Сегодня микроблогер раскрыл ответ. Верхняя картинка состоит из множества различных оттенков, нижняя — всего из шести цветов различной насыщенности.

Всего шести цветов было достаточно, чтобы передать всю красочность оригинальной картинки

Впрочем, сжимать файл это никак не помогло. Файловый размер изображения сверху составил 2,11 МиБ, нижнего — вырос до 2,21 МиБ. Китаока не указывает формат данных и размер в пикселях оригинальных фотографий.

denis-19

23 июл 2024 в 09:0128

Open source * Обработка изображений * GitHub * Машинное обучение * Искусственный интеллект

На GitHub представлен открытый проект Album AI для управления с помощью ИИ фотографиями на домашнем ПК.

Бесплатный инструмент организует все фото, альбомы и добавляет необходимую метаинформацию. Под капотом у проекта нейросеть ChatGPT-4o-mini.

Для сортировки изображений Album AI использует распознавание лиц. Из всех фотографий на ПК создаётся локальная база данных PgSQL без доступа извне.

maybe_elf

18 июл 2024 в 08:4721

Обработка изображений * Машинное обучение * Развитие стартапаИскусственный интеллект

«Крёстная мать искусственного интеллекта» Фей-Фей Ли основала новый стартап-«единорог» World Labs. Его стоимость превысила $1 млрд.

В World Labs намерены использовать человеческую обработку визуальных данных, чтобы сделать ИИ способным к продвинутым рассуждениям.

Ли занималась вопросами компьютерного зрения и возглавила разработку ImageNet, обширной визуальной базы данных. В настоящее время она консультирует рабочую группу Белого дома по ИИ.

«World Labs разрабатывает модель, которая понимает трёхмерный физический мир; по сути, она видит размеры объектов, где находятся вещи и что они делают», — рассказал анонимный венчурный капиталист, знакомый с работой Ли.

В апрельском выступлении на Ted Ли объяснила, что её стартап работает над алгоритмами, способными реалистично экстраполировать изображения и текст в трёхмерную среду и действовать на основе этих прогнозов. Она назвала это «пространственным интеллектом». Подобные алгоритмы могут применяться в робототехнике, приложениях AR и VR, а также компьютерного зрения.

У стартапа прошло два раунда финансирования, а в ходе последнего привлекли около $100 млн. World Labs поддерживают фонды Andreessen Horowitz и Radical Ventures.

maybe_elf

17 июл 2024 в 12:4723

Обработка изображений * Искусственный интеллектСоциальные сети

Tinder предложил опцию умного выбора фото профиля. Функция Photo Selector на базе искусственного интеллекта будет создавать готовые подборки из лучших снимков пользователя.

Чтобы использовать Photo Selector, нужно сделать селфи в Tinder и предоставить приложению доступ к фото на устройстве. Опция будет локально использовать распознавание лиц для формирования подборок.

Цель Photo Selector — помочь пользователям сосредоточиться на «установлении значимых связей», экономя время при составлении профилей знакомств. По данным Tinder, в ходе исследования среди 7000 молодых людей выяснилось, что они тратят в среднем 33 минуты на выбор подходящей фотографии профиля.

Photo Selector доступна для устройств под управлением iOS и Android, а внедрение в США планируется начать в июле. В других странах опция заработает позднее летом.

denis-19

13 июл 2024 в 16:5361

Обработка изображений * СмартфоныВидеотехникаБудущее здесь

Apple представила короткометражный фильм под названием ¡Suerte!, который полностью снят на iPhone 15 Pro Max. Оператор использовал все преимущества смартфона, такие как 5-кратный оптический зум, киноэффекты и экшн‑режим. В самом фильме рассказана история молодого музыканта Ивана Корнехо, который отправляется в Мексику, чтобы найти вдохновение, а также показаны приключения исполнителя в разных локациях.

В качестве дополнительных материалов Apple показала на отдельном видео, как проходила съёмка этого фильма.

denis-19

11 июл 2024 в 04:3170

Обработка изображений * Управление персоналом * Искусственный интеллект

Пользователи приняли кандидата на парламентских выборах в Великобритании от партии Reform UK за генеративный образ, созданный ИИ. Оказалось, что политика неудачно сфотографировали.

Комментаторы в постах с изображениями Марка Мэтлока задавали вопрос, реальный ли это человек или снимки созданы с помощью генеративного ИИ. Многие обращали внимание на слишком гладкую, глянцевую кожу политика на фотографиях.

Для выборов в Великобритании это не единственный случай: руководитель ИИ‑компании использовал генеративный образ, чтобы баллотироваться в парламент. Тот проиграл, набрав всего 179 голосов.

Мэтлок заявил в интервью СМИ, что он всё-таки существует, а подозрительный внешний вид связан с его здоровьем. «За три дня до выборов я заболел пневмонией, я занимался спортом и принимал витамины, чтобы участвовать в выборах, но это было невозможно. В ночь выборов я даже не мог стоять», — рассказал он.

Также Мэтлок показал изданию оригинальную фотографию, которая привлекла внимание пользователей. Фон на снимке был удалён, а цвет его галстука изменили. «Это, по-видимому, хороший урок для всех выборных лиц: не редактируйте свои фотографии таким образом, чтобы они были похожи на результаты Midjourney по запросу «молодой, не угрожающе выглядящий политик», — посоветовал Мэтлок.

anazarta

7 июн 2024 в 08:307.3K

Блог компании ЯндексПоисковые технологии * Обработка изображений * Машинное обучение * Исследования и прогнозы в IT *

Небольшая, но полезная новость для тех, кто интересуется историей. Мы добавили в Поиск по архивам новый тип документов — справочники XIX–XX веков из фондов Национальной электронной библиотеки и Российской государственной библиотеки.

Историки, социологи и журналисты смогут получить доступ к новым сведениям об исторических событиях и личностях, а обычные пользователи — ещё больше узнать о своих предках. В новых источниках можно найти биографические факты, которые раньше были доступны только в бумажном виде. Например, памятные книжки содержат списки ключевых персон губерний с их должностями. Из адресных книг можно узнать, где они жили, а из торгово-промышленных справочников — каким делом занимались.

Для этого нейросеть Яндекса расшифровала почти 600 книг или 275 тысяч страниц. Причём она узнаёт даже утратившие актуальность знаки (например, исчезнувшие из алфавита буквы) и учитывает особенности почерка. А для работы с вёрсткой газетных страниц нейросеть специально адаптировали: она научилась распознавать текст на огромных полосах, набранный мелким шрифтом на бумаге низкой плотности. Кстати, более подробно о нашей технологии мы рассказывали на Хабре в отдельной статье.

zhogar

29 мая 2024 в 11:5621

Обработка изображений * Схемотехника *

Automated Stitching of Chip Images

This is non-destructively inspecting chips with the IRIS (Infra-Red, in-situ) technique.

Нашел тут весьма забавный блог, по получению топологии микросхем без скальпирования.

A goal of mine is to give everyday people tangible reasons to trust their hardware. Betrusted is a multi-year project of mine to deliver a full-stack verifiable “from logic gates to Rust crates” supply chain for security-critical applications such as password managers. At this point, many parts of the project have come together: Precursor is an FPGA-based open hardware implementation, and it runs Xous, our Rust-based microkernel message-passing OS.

Так что кому интересна данная тема, советую посетить и обязательно оставить положительный отзыв автору, он делает по настоящему хорошую работу..

Сам блог: https://www.bunniestudios.com/blog/

Всем удачи!

denis-19

18 мая 2024 в 16:23431

Обработка изображений * Машинное обучение * КиберпанкИскусственный интеллектБудущее здесь

Соучредитель и технический директор OpenAI Грег Брокман опубликовал изображение, созданное недавно представленной GPT–4o.

«Изображение, сгенерированное GPT-4o — так много всего, что можно изучить, используя только возможности создания изображений GPT-4o. Команда усердно работает, чтобы представить их миру», — пояснил Брокман.

GPT-4o может воспринимать и генерировать звук, изображение и текст и будет доступна всем пользователям бесплатно.

denis-19

10 мая 2024 в 16:17204

Обработка изображений * Умный домБудущее здесь

В официальном магазине Lego в Нью-Йорке установлен специальный сканер, который показывает пошаговую сборку моделей из элементов конструктора и финальный вид игрушек. Нужно поднести к устройству коробку и через несколько секунд система покажет на мониторе сборку конструктора в реальном времени.

Odin_Himself

4 мая 2024 в 16:1380

Обработка изображений * Искусственный интеллектПериферияУмный домУрбанизм

Новый уровень домашней безопасности с AI-системой PaintCam Eve

Камера системы безопасности Eve (PaintCam)

Компания из Словении, PaintCam, представила новый гаджет в области безопасности - PaintCam Eve. Это не просто еще одна камера слежения. PaintCam Eve оснащена системой отстрела шариков с краской и слезоточивым газом; она может устроить незваным гостям сюрприз, который они не скоро забудут.

? Как это работает?

Сердцем системы Eve является современная технология компьютерного зрения. Она может идентифицировать лица людей и животных даже при слабом освещении, различая друзей и врагов. Система предлагает три модели: Eve, Eve + и Eve Pro. Они позволяют владельцам домов видеть посетителей через интерфейс приложения.

? Контроль и ответственность пользователя

PaintCam предлагает пользователям значительную степень контроля. Система оповещает владельца дома, когда обнаруживает неизвестного человека в компании известного, спрашивая, следует ли “сделать выстрел” или нет.

⚖️ Этические и юридические вопросы

Использование силы, даже несмертельной, автономной системой может привести к непредвиденным последствиям. Например, что произойдет, если система ошибочно определит соседа или ребенка, забирающего потерянную игрушку, как угрозу? Юридические последствия таких сценариев остаются неясными.

? Потенциал и вызовы рынка

Ёмкость глобального рынка домашней безопасности оценивается в $106.3 миллиарда к 2030 году. Успех Eve на рынке будет зависеть не только от интереса потребителей, но и от преодоления юридических препятствий и вызовов.

denis-19

25 апр 2024 в 15:56185

Обработка изображений * Машинное обучение * Искусственный интеллектБудущее здесь

«Сбер» совместно с нейросетью Kandinsky спасает утерянные картины великих художников, включая Илью Репина.

Проект Kandinsky в рамках выставки «Возрождённая коллекция» сумел воссоздать 9 полотен из Сталинградской картинной галереи, которые пропали в годы Великой Отечественной войны.

В Kandinsky залили чёрно-белые снимки и архивные описания полотен — так ИИ смог восстановить работы Репина, Сурикова, Иванова и других авторов почти в первозданном виде.

Увидеть их все можно на выставке «Возрождённая коллекция» в Волгограде — как офлайн, так и онлайн.

maybe_elf

4 апр 2024 в 09:4212

Обработка изображений * Искусственный интеллект

Генератор изображений DALL-E от OpenAI получил несколько обновлений, которые помогут редактировать изображения с помощью ChatGPT как в Интернете, так и на мобильных устройствах. Кроме того, в DALL-E 3 появились предустановленные варианты стилей, которые помогут вдохновить на создание изображений.

Интеграция с ChatGPT избавляет пользователя от необходимости писать новые промты — достаточно задать команду, как при диалоге с ChatGPT.

Также стали доступны готовые подсказки (гравюра на дереве, готика, рисование от руки). При наведении на них курсора появляются визуальные примеры.

denis-19

4 апр 2024 в 09:2853

Веб-дизайн * Open source * Алгоритмы * Обработка изображений *

Google представила открытую библиотеку jpegli с реализацией кодировщика и декодировщика изображений в формате JPEG.

Библиотека включает дополнительные оптимизации для повышения эффективности кодирования, позволяющие на 35% увеличить степень сжатия высококачественных изображений, по сравнению с традиционными кодеками JPEG.

В сравнении с libjpeg-turbo проект jpegli позволяет добиться аналогичного уровня качества при снижении битрейта на 32%. На уровне API и ABI библиотека полностью совместима с libjpeg62 и может применяться для её прозрачной замены. Код jpegli написан на языке С++ и распространяется под лицензией BSD.

Библиотека jpegli позволяет кодировать изображения с выделением 10 и более битов на цветовой компонент. При этом результат работы алгоритмов кодирования адаптируется для традиционной для формата JPEG модели, допускающей использование только 8 бит на цветовой компонент. Подобная особенность позволяет сохранить совместимость с уже существующими декодировщиками, рассчитанными на 8-битовое представление цветовых составляющих.

Кодируемые при помощи jpegli изображения полностью соответствуют стандарту JPEG, не требуют специфичных декодировщиков и могут просматриваться в существующих просмотрщиках JPEG и веб‑браузерах. Применение для распаковки изображений, сжатых при помощи jpegli, собственного декодировщика позволяет добиться дополнительного снижения артефактов. Скорость кодирования при помощи jpegli сопоставима с библиотеками libjpeg‑turbo и MozJPEG.

Источник: OpenNET.

Doctor_IT

26 мар 2024 в 16:307.3K

Блог компании SelectelСетевые технологии * Обработка изображений *

Хотите ускорить доставку контента? ?

Представляем вам новую возможность CDN

Услуга Image stack сконвертирует изображения из форматов JPG и PNG в WebP или AVIF. Страницы, на которых много медиа-контента, станут загружаться быстрее. При этом изображения не поменяют свои URL и расширение.

Сжатие изображений — лишь одна из возможностей CDN. Это сеть кэширующих серверов, которые ускоряют доставку контента. Серверы расположены по всему миру, чтобы сокращать время ответа ресурса на запрос пользователя.

Выгоды использования CDN:

повышение позиции сайта в поисковой выдаче,
экономия на инфраструктуре,
постоянная доступность сервиса,
защита от DDoS-атак.

Подробнее про работу и подключение CDN рассказываем по ссылке →

denis-19

21 мар 2024 в 18:18313

Обработка изображений * Социальные сети

Департамент полиции Калифорнии придумал новый способ защитить личности подозреваемых и теперь публикует фотографии преступников, скрывая их лица за головами из Lego. Причём полицейские стараются подбирать голову Lego-человечка для точного описания эмоции преступника.

В департаменте объяснили, что новый закон Калифорнии от 1 января запрещает им делиться фотографиями и фотографиями подозреваемых в ненасильственных преступлениях, что вынуждает их медиа-команду проявлять творческий подход.

maybe_elf

22 фев 2024 в 14:3099

Обработка изображений * Машинное обучение * Искусственный интеллект

Google временно закрыла опцию генерации изображений людей в Gemini. Ранее выяснилось, что ИИ создаёт неточные исторические изображения.

«Мы уже работаем над решением недавних проблем с функцией генерации изображений Gemini», — говорится в заявлении компании.

Теперь модель реагирует на соответствующие запросы так: «Мы работаем над улучшением способности Gemini создавать изображения людей. Ожидается, что эта функция скоро вернётся, мы сообщим вам об этом в обновлениях выпуска».

El_Gato_Grande

21 фев 2024 в 14:197.6K

Блог компании SelectelОбработка изображений * Графический дизайн * Искусственный интеллект

Чего ждать от шестой версии Midjourney

С 15 февраля 2024 шестая версия Midjourney является моделью по умолчанию, хотя сами разработчики говорят, что она все еще находится в «раннем доступе».

Что стало действительно лучше

✔ Корректное написание слов. Больше никаких «WEILD WELLOLLD» вместо нужного «HELLO WORLD» (правда, с кириллицей и иероглифами еще не все гладко, да и длинные тексты пока даются нейросети с трудом);

✔ Поддержка консистентных стилей. Теперь можно сгенерировать одну картинку в стиле другой, не учитывая при этом текстовый запрос;

Что еще требует доработок

✔ Генерация пальцев. Если центральным объектом изображения будут кисти рук, которые что-то держат, вы можете разочароваться;

✔ Midjourney все еще не умеет считать. Попросите ее нарисовать 12 котов, и она не только изобразит другое количество, но и с высокой вероятностью сделает коллаж из отдельных картинок с котиками.

Если хотите узнать больше и погрузиться в детали нашего знакомства с Midjourney v6, добро пожаловать в статью. Здесь мы подробно рассказываем о первом взгляде на новую версию популярной нейросети.

denis-19

12 фев 2024 в 15:16101

Обработка изображений * СмартфоныИскусственный интеллект

Производитель готовит для Samsung Galaxy S24 Ultra обновление прошивки, чтобы смартфон стал лучше снимать Солнце. В частности, там будет улучшено качество снимков, когда в объектив попадает солнечный диск. Сейчас вокруг этого элемента возникает заметное затемнение. После обновления такая структура будет убрана.

В марте 2023 года пользователь обнаружил, что смартфоны Samsung S20 Ultra и новее улучшают детализацию Луны на любых фото с помощью ИИ. Он выяснил, что технология Space Zoom это маркетинговый ход, а не способ красиво снять ночью Луну, так как она делает любое фото Луны с низким разрешением красивой картинкой.

1 2 3