Релиз экспериментальной версии GIMP 3.1.4

В начале сентября 2025 года состоялся релиз экспериментальной версии открытого графического редактора GIMP 3.1.4 для разработчиков.

Работаем с фото и видео

В начале сентября 2025 года состоялся релиз экспериментальной версии открытого графического редактора GIMP 3.1.4 для разработчиков.

Американская Dolby Laboratories презентовала новое поколение технологических решений для создания, обработки и распространения HDR-видео Dolby Vision 2 — спустя 10 лет после релиза Dolby Vision. Вторая итерация технологии включает инструменты Content Intelligence, которые используют искусственный интеллект для автоматической оптимизации телевизора в зависимости от просматриваемого контента и внешних устройств, расширяя существующие функции Dolby Vision IQ.

Состоялся релиз ImageViewer 1.8.0 — легковесного кроссплатформенного приложения для просмотра изображений, созданного на C++ и фреймворке Qt. Решение разработано с упором на простоту и производительность и поддерживает широкий спектр форматов изображений, включая PNG, JPEG, BMP, TIFF. В проекте используется встроенная в Qt поддержка QImage для эффективного рендеринга и декодирования. Исходный текст проекта написан на C++ и C и опубликован на GitHub под лицензией GNU General Public License v3.0.

Корейская компания Samsung с девизом «No shirt? No problem» выпустила новый рекламный ролик, где сообщила, что пользователям не стоит бояться делать фото без верхней одежды для соцсетей, так как ИИ-система Galaxy AI умеет просто добавлять такой контент на картинку.

Yandex B2B Tech совместно со студентами Школы анализа данных (ШАД) и специалистами Санкт-Петербургского государственного педиатрического медицинского университета создал нейросеть, которая помогает врачам оценить развитие мозга младенцев в первые месяцы жизни.
Разработку предлагается применять при подозрении на детский церебральный паралич, а также при диагностике других заболеваний, поражающих центральную нервную систему. Её задача — помочь врачам выбрать наиболее подходящий курс реабилитации для конкретного пациента.

Шведская Hasselblad представила новую флагманскую камеру X2D II 100C, которая оснащена гибридным автофокусом и 10-ступенчатым IBIS, а также поддержкой HDR.
Ricoh выпустит свою компактную камеру GR IV в середине сентября по цене $1500. Она будет комплектоваться новой миниатюрной вспышкой GF-2 за $120.

Учёные из Ульсанского национального института науки и технологий (Южная Корея) создали систему ИИ, которая открывает возможность взять пушистого друга в виртуальный мир. Их проект DogRecon умеет превращать всего одну фотографию собаки в реалистичную трёхмерную цифровую модель для виртуальной или дополненной реальности.

«Мы собрали более 65 млрд записей из 80 с лишним стран. Чтобы вы представляли масштаб: это примерно 10 000 ТБ данных, которые мы используем, чтобы открывать нашим пользователям новые факты об их предках».
Но у такого колоссального собрания есть и главная трудность: как всё это упорядочить. По словам Тьягараджана, компания стала активно использовать искусственный интеллект и машинное обучение, чтобы справиться с этой почти героической задачей.

Компания Meta✶ заключила партнерство с Midjourney, чтобы получить лицензию на технологии стартапа по генерации изображений и видео с помощью искусственного интеллекта. Об этом в пятницу в Threads сообщил главный директор Meta✶ по ИИ Александр Ван. По его словам, исследовательские команды Meta✶ будут тесно сотрудничать с Midjourney, чтобы встроить эти разработки в будущие ИИ‑модели и продукты компании.

Компания Alibaba обновила свою модель Qwen для работы с изображениями, добавив в неё новые инструменты редактирования.
Система способна на всё — от лёгких косметических ретушей до сложных смысловых изменений. Визуальное редактирование позволяет менять лишь отдельные фрагменты, сохраняя остальное без вмешательств. Семантическое же вмешательство затрагивает пиксели по всей картинке, но при этом главный объект остаётся узнаваемым и неизменным по сути.

Обычно обучение систем искусственного интеллекта для генерации или анализа изображений требует колоссальных объемов данных: фотографии, скажем, котов вручную снабжаются ярлыками — «кот», «идет», «полосатый». Но DINOv3✶ от Meta✶ пошла иным путем: она обучалась на 1,7 млрд изображений без каких‑либо меток и теперь умеет решать множество задач без человеческого вмешательства, нередко опережая специализированные модели.

Команда Tencent X‑Omni показала, как методы обучения с подкреплением могут исправить типичные слабости гибридных систем искусственного интеллекта для генерации картинок. Модель особенно сильна в отображении длинных текстов в изображениях и временами задаёт новые стандарты качества.

По данным Android Headlines, Google внедрит в новый смартфон Google Pixel 10 ИИ-функцию Camera Coach. И как ясно из названия, она будет обучать владельцев делать более качественные снимки в реальном времени.

Microsoft теперь предоставляет бесплатный доступ к GPT-4o через Bing Image Creator, позволяя каждому пользователю создавать изображения с помощью ИИ. Это та же технология, которую OpenAI интегрировала в ChatGPT в начале текущего года.

Компания Илона Маска представила Grok Imagine — инструмент для image-to-video и text-to-image генерации. Функция доступна платным подписчикам SuperGrok и Premium Plus в приложении X для iOS.

Ученые Smart Engines первыми в России перенесли передовые технологии распознавания штрихкодов, паспортов и других документов на микропроцессоры архитектуры RISC-V. Теперь системы компьютерного зрения доступны на всех без исключения отечественных и основных международных аппаратных платформах: Elbrus, RISC-V, MIPS (КОМДИВ), SPARC, х86, ARM. Это позволяет внедрить распознавание в различных областях – от интернета вещей до ракетостроения – и осуществлять его фактически на любом микроконтроллере, без необходимости в видеокартах и мощных процессорах.

Alibaba представила новую модель генерации изображений Qwen‑Image с открытым исходным кодом. Она доступна в чат-боте Qwen, а также на GitHub, Hugging Face и ModelScope.

В начале августа 2025 года состоялся выпуск кроссплатформенного инструмента с открытым исходным кодом для создания скриншотов Flameshot 13.0. Исходный код проекта написан на C++ и опубликован на GitHub под лицензией GNU General Public License v3.0. Предыдущая стабильная версия Flameshot 12.1.0 вышла в июле 2022 года. Выпуск Flameshot 0.1.0 произошёл в июне 2017 года.

X-Omni — методика обучения T2I моделей, которая наглядно доказывает, что RL может вдохнуть новую жизнь в авторегрессионный подход и вывести такие модели на SOTA-уровень.