Ricoh выпустит свою компактную камеру GR IV в середине сентября по цене $1500. Она будет комплектоваться новой миниатюрной вспышкой GF-2 за $120.

Обработка изображений *
Работаем с фото и видео
Новости
DogRecon: ИИ превращает фото собаки в анимированного 3D-аватара

Учёные из Ульсанского национального института науки и технологий (Южная Корея) создали систему ИИ, которая открывает возможность взять пушистого друга в виртуальный мир. Их проект DogRecon умеет превращать всего одну фотографию собаки в реалистичную трёхмерную цифровую модель для виртуальной или дополненной реальности.
Раньше в Ancestry оцифровывали документы 9 месяцев. Теперь ИИ справляется за 9 дней

«Мы собрали более 65 млрд записей из 80 с лишним стран. Чтобы вы представляли масштаб: это примерно 10 000 ТБ данных, которые мы используем, чтобы открывать нашим пользователям новые факты об их предках».
Но у такого колоссального собрания есть и главная трудность: как всё это упорядочить. По словам Тьягараджана, компания стала активно использовать искусственный интеллект и машинное обучение, чтобы справиться с этой почти героической задачей.
Meta✶ привлекла Midjourney к разработке своих ИИ-моделей изображений и видео

Компания Meta✶ заключила партнерство с Midjourney, чтобы получить лицензию на технологии стартапа по генерации изображений и видео с помощью искусственного интеллекта. Об этом в пятницу в Threads сообщил главный директор Meta✶ по ИИ Александр Ван. По его словам, исследовательские команды Meta✶ будут тесно сотрудничать с Midjourney, чтобы встроить эти разработки в будущие ИИ‑модели и продукты компании.
Qwen Image Edit — новый шаг к умному и смысловому редактированию фото

Компания Alibaba обновила свою модель Qwen для работы с изображениями, добавив в неё новые инструменты редактирования.
Система способна на всё — от лёгких косметических ретушей до сложных смысловых изменений. Визуальное редактирование позволяет менять лишь отдельные фрагменты, сохраняя остальное без вмешательств. Семантическое же вмешательство затрагивает пиксели по всей картинке, но при этом главный объект остаётся узнаваемым и неизменным по сути.
Самообучающаяся DINOv3✶ от Meta✶ обгоняет конкурентов в анализе изображений

Обычно обучение систем искусственного интеллекта для генерации или анализа изображений требует колоссальных объемов данных: фотографии, скажем, котов вручную снабжаются ярлыками — «кот», «идет», «полосатый». Но DINOv3✶ от Meta✶ пошла иным путем: она обучалась на 1,7 млрд изображений без каких‑либо меток и теперь умеет решать множество задач без человеческого вмешательства, нередко опережая специализированные модели.
X-Omni от Tencent бросает вызов GPT-4o в генерации изображений, опираясь на опенсорс

Команда Tencent X‑Omni показала, как методы обучения с подкреплением могут исправить типичные слабости гибридных систем искусственного интеллекта для генерации картинок. Модель особенно сильна в отображении длинных текстов в изображениях и временами задаёт новые стандарты качества.
Google Pixel 10: утечка показала новые функции Gemini для камеры

По данным Android Headlines, Google внедрит в новый смартфон Google Pixel 10 ИИ-функцию Camera Coach. И как ясно из названия, она будет обучать владельцев делать более качественные снимки в реальном времени.
Microsoft добавила в Bing Image Creator бесплатный доступ к GPT-4o

Microsoft теперь предоставляет бесплатный доступ к GPT-4o через Bing Image Creator, позволяя каждому пользователю создавать изображения с помощью ИИ. Это та же технология, которую OpenAI интегрировала в ChatGPT в начале текущего года.
xAI запустила Grok Video с режимом генерации NSFW-контента

Компания Илона Маска представила Grok Imagine — инструмент для image-to-video и text-to-image генерации. Функция доступна платным подписчикам SuperGrok и Premium Plus в приложении X для iOS.
Российский ИИ для распознавания доступен на всех отечественных платформах. Завершено портирование на RISC-V

Ученые Smart Engines первыми в России перенесли передовые технологии распознавания штрихкодов, паспортов и других документов на микропроцессоры архитектуры RISC-V. Теперь системы компьютерного зрения доступны на всех без исключения отечественных и основных международных аппаратных платформах: Elbrus, RISC-V, MIPS (КОМДИВ), SPARC, х86, ARM. Это позволяет внедрить распознавание в различных областях – от интернета вещей до ракетостроения – и осуществлять его фактически на любом микроконтроллере, без необходимости в видеокартах и мощных процессорах.
Qwen выпустил генератор изображений с открытым кодом Qwen‑Image

Alibaba представила новую модель генерации изображений Qwen‑Image с открытым исходным кодом. Она доступна в чат-боте Qwen, а также на GitHub, Hugging Face и ModelScope.
Вышел кроссплатформенный инструмент с открытым исходным кодом для создания скриншотов Flameshot 13.0

В начале августа 2025 года состоялся выпуск кроссплатформенного инструмента с открытым исходным кодом для создания скриншотов Flameshot 13.0. Исходный код проекта написан на C++ и опубликован на GitHub под лицензией GNU General Public License v3.0. Предыдущая стабильная версия Flameshot 12.1.0 вышла в июле 2022 года. Выпуск Flameshot 0.1.0 произошёл в июне 2017 года.
Ближайшие события
X-Omni от Tencent: авторегрессионная text-to-image модель с RL

X-Omni — методика обучения T2I моделей, которая наглядно доказывает, что RL может вдохнуть новую жизнь в авторегрессионный подход и вывести такие модели на SOTA-уровень.
Cohere выпустила новую мультимодальную модель Command A Vision

Command A Vision предназначена для анализа изображений, диаграмм, PDF-файлов и других визуальных данных. По заявлению разработчиков, на стандартных бенчмарках для компьютерного зрения она превосходит GPT-4.1, Llama 4 и Mistral Medium 3.
Вышел Mass Image Compressor 4.1.0 для Windows для сжимания, изменения размера и конвертации больших наборов изображений

Состоялся релиз открытого проекта Mass Image Compressor 4.1.0 для Windows, который помогает сжимать, изменять размер и конвертировать большие наборы изображений. Исходный код решения написан на C# и Perl и опубликован на GitHub под лицензией GNU Affero General Public License v3.0.
Adobe расширяет ИИ-инструментарий Photoshop

Компания Adobe запустила новые функции генеративного ИИ для Photoshop, упрощающие добавление и удаление людей и объектов на фотографиях. Обновление включает функции масштабирования изображений с помощью ИИ, улучшенный инструмент удаления объектов, а также средства автоматической композиции, которые позволяют плавно вписывать новые элементы в изображения всего за несколько кликов.
В бета-версии Adobe Photoshop заработала ИИ-функция Harmonize для адаптации добавленных на фото объектов под фон

В бета-версии Adobe Photoshop появилась функция Harmonize на базе нейросети Firefly. Она автоматически адаптирует добавляемые к фотографии объекты к окружающей среде, корректируя освещение, цветовую палитру, тени и общую тональность.
Создавайте целые истории с одним героем: Ideogram запустила Character

Ideogram запустила новую функцию под названием Ideogram Character, которая позволяет создавать целые серии изображений с одним и тем же персонажем — по одной-единственной фотографии.
ИИ-система UVeye для оценки повреждений авто находит намного больше дефектов, чем человек, и придумывает несуществующие

Компания Hertz начала использовать ИИ-систему UVeye для определения повреждений на арендованных автомобилях. Предполагается, что это повысит точность и скорость проверки транспортных средств. Однако, как показала практика, система находит значительно больше повреждений, чем традиционный человеческий осмотр, а порой даже «придумывает» несуществующие дефекты, сообщает The Drive.
ИИ-система UVeye, основанная на камерах и алгоритмах машинного обучения, работает в нескольких автосалонах Hertz в США, включая салон в аэропорту Хартсфилд-Джексон в Атланте. Она автоматически сканирует автомобиль перед сдачей в аренду и после возвращения и фиксирует царапины, вмятины, повреждения шин и другие дефекты.
Вклад авторов
alizar 5672.6ZlodeiBaal 2447.4marks 2439.9Fil 1355.0YUVladimir 1324.0SmartEngines 1151.2Weilard 970.0jeston 744.0homm 674.2