Обновить
56.37

Обработка изображений *

Работаем с фото и видео

Сначала показывать
Порог рейтинга

Dolby Laboratories презентовала технологию Dolby Vision 2

Время на прочтение2 мин
Количество просмотров2K

Американская Dolby Laboratories презентовала новое поколение технологических решений для создания, обработки и распространения HDR-видео Dolby Vision 2 — спустя 10 лет после релиза Dolby Vision. Вторая итерация технологии включает инструменты Content Intelligence, которые используют искусственный интеллект для автоматической оптимизации телевизора в зависимости от просматриваемого контента и внешних устройств, расширяя существующие функции Dolby Vision IQ.

Читать далее

Релиз ImageViewer 1.8.0 — легковесного кроссплатформенного приложения для просмотра изображений на C++ и фреймворке Qt

Время на прочтение2 мин
Количество просмотров2.9K

Состоялся релиз ImageViewer 1.8.0 — легковесного кроссплатформенного приложения для просмотра изображений, созданного на C++ и фреймворке Qt. Решение разработано с упором на простоту и производительность и поддерживает широкий спектр форматов изображений, включая PNG, JPEG, BMP, TIFF. В проекте используется встроенная в Qt поддержка QImage для эффективного рендеринга и декодирования. Исходный текст проекта написан на C++ и C и опубликован на GitHub под лицензией GNU General Public License v3.0.

Читать далее

Samsung с девизом «No shirt? No problem» сообщила, что не стоит бояться делать фото без верхней одежды – ИИ её добавит

Время на прочтение1 мин
Количество просмотров3.1K

Корейская компания Samsung с девизом «No shirt? No problem» выпустила новый рекламный ролик, где сообщила, что пользователям не стоит бояться делать фото без верхней одежды для соцсетей, так как ИИ-система Galaxy AI умеет просто добавлять такой контент на картинку.

Читать далее

Yandex B2B Tech и ШАД представили нейросеть для помощи в диагностике ДЦП и назначении терапии для новорождённых

Время на прочтение2 мин
Количество просмотров304

Yandex B2B Tech совместно со студентами Школы анализа данных (ШАД) и специалистами Санкт-Петербургского государственного педиатрического медицинского университета создал нейросеть, которая помогает врачам оценить развитие мозга младенцев в первые месяцы жизни.

Разработку предлагается применять при подозрении на детский церебральный паралич, а также при диагностике других заболеваний, поражающих центральную нервную систему. Её задача — помочь врачам выбрать наиболее подходящий курс реабилитации для конкретного пациента. 

Читать далее

Hasselblad представила фотоаппарат X2D II 100C с гибридным автофокусом

Время на прочтение1 мин
Количество просмотров1.8K

Шведская Hasselblad представила новую флагманскую камеру X2D II 100C, которая оснащена гибридным автофокусом и 10-ступенчатым IBIS, а также поддержкой HDR.

Читать далее

Компактная камера Ricoh GR IV выйдет в сентябре по цене $1500

Время на прочтение1 мин
Количество просмотров2.4K

Ricoh выпустит свою компактную камеру GR IV в середине сентября по цене $1500. Она будет комплектоваться новой миниатюрной вспышкой GF-2 за $120.

Читать далее

DogRecon: ИИ превращает фото собаки в анимированного 3D-аватара

Время на прочтение3 мин
Количество просмотров643

Учёные из Ульсанского национального института науки и технологий (Южная Корея) создали систему ИИ, которая открывает возможность взять пушистого друга в виртуальный мир. Их проект DogRecon умеет превращать всего одну фотографию собаки в реалистичную трёхмерную цифровую модель для виртуальной или дополненной реальности.

Читать далее

Раньше в Ancestry оцифровывали документы 9 месяцев. Теперь ИИ справляется за 9 дней

Время на прочтение3 мин
Количество просмотров1.9K

«Мы собрали более 65 млрд записей из 80 с лишним стран. Чтобы вы представляли масштаб: это примерно 10 000 ТБ данных, которые мы используем, чтобы открывать нашим пользователям новые факты об их предках».

Но у такого колоссального собрания есть и главная трудность: как всё это упорядочить. По словам Тьягараджана, компания стала активно использовать искусственный интеллект и машинное обучение, чтобы справиться с этой почти героической задачей.

Читать далее

Meta✶ привлекла Midjourney к разработке своих ИИ-моделей изображений и видео

Время на прочтение3 мин
Количество просмотров617

Компания Meta✶ заключила партнерство с Midjourney, чтобы получить лицензию на технологии стартапа по генерации изображений и видео с помощью искусственного интеллекта. Об этом в пятницу в Threads сообщил главный директор Meta✶ по ИИ Александр Ван. По его словам, исследовательские команды Meta✶ будут тесно сотрудничать с Midjourney, чтобы встроить эти разработки в будущие ИИ‑модели и продукты компании.

Читать далее

Qwen Image Edit — новый шаг к умному и смысловому редактированию фото

Время на прочтение3 мин
Количество просмотров8.9K

Компания Alibaba обновила свою модель Qwen для работы с изображениями, добавив в неё новые инструменты редактирования.

Система способна на всё — от лёгких косметических ретушей до сложных смысловых изменений. Визуальное редактирование позволяет менять лишь отдельные фрагменты, сохраняя остальное без вмешательств. Семантическое же вмешательство затрагивает пиксели по всей картинке, но при этом главный объект остаётся узнаваемым и неизменным по сути.

Читать далее

Самообучающаяся DINOv3✶ от Meta✶ обгоняет конкурентов в анализе изображений

Время на прочтение3 мин
Количество просмотров2.5K

Обычно обучение систем искусственного интеллекта для генерации или анализа изображений требует колоссальных объемов данных: фотографии, скажем, котов вручную снабжаются ярлыками — «кот», «идет», «полосатый». Но DINOv3✶ от Meta✶ пошла иным путем: она обучалась на 1,7 млрд изображений без каких‑либо меток и теперь умеет решать множество задач без человеческого вмешательства, нередко опережая специализированные модели.

Читать далее

X-Omni от Tencent бросает вызов GPT-4o в генерации изображений, опираясь на опенсорс

Время на прочтение3 мин
Количество просмотров998

Команда Tencent X‑Omni показала, как методы обучения с подкреплением могут исправить типичные слабости гибридных систем искусственного интеллекта для генерации картинок. Модель особенно сильна в отображении длинных текстов в изображениях и временами задаёт новые стандарты качества.

Читать далее

Google Pixel 10: утечка показала новые функции Gemini для камеры

Время на прочтение2 мин
Количество просмотров2.2K

По данным Android Headlines, Google внедрит в новый смартфон Google Pixel 10 ИИ-функцию Camera Coach. И как ясно из названия, она будет обучать владельцев делать более качественные снимки в реальном времени.

Читать далее

Ближайшие события

Microsoft добавила в Bing Image Creator бесплатный доступ к GPT-4o

Время на прочтение2 мин
Количество просмотров997

Microsoft теперь предоставляет бесплатный доступ к GPT-4o через Bing Image Creator, позволяя каждому пользователю создавать изображения с помощью ИИ. Это та же технология, которую OpenAI интегрировала в ChatGPT в начале текущего года.

Читать далее

xAI запустила Grok Video с режимом генерации NSFW-контента

Время на прочтение2 мин
Количество просмотров5.5K

Компания Илона Маска представила Grok Imagine — инструмент для image-to-video и text-to-image генерации. Функция доступна платным подписчикам SuperGrok и Premium Plus в приложении X для iOS.

Читать далее

Российский ИИ для распознавания доступен на всех отечественных платформах. Завершено портирование на RISC-V

Время на прочтение2 мин
Количество просмотров2.6K

Ученые Smart Engines первыми в России перенесли передовые технологии распознавания штрихкодов, паспортов и других документов на микропроцессоры архитектуры RISC-V. Теперь системы компьютерного зрения доступны на всех без исключения отечественных и основных международных аппаратных платформах: Elbrus, RISC-V, MIPS (КОМДИВ), SPARC, х86, ARM. Это позволяет внедрить распознавание в различных областях – от интернета вещей до ракетостроения – и осуществлять его фактически на любом микроконтроллере, без необходимости в видеокартах и мощных процессорах.

Читать далее

Qwen выпустил генератор изображений с открытым кодом Qwen‑Image

Время на прочтение2 мин
Количество просмотров4.2K

Alibaba представила новую модель генерации изображений Qwen‑Image с открытым исходным кодом. Она доступна в чат-боте Qwen, а также на GitHubHugging Face и ModelScope.

Читать далее

Вышел кроссплатформенный инструмент с открытым исходным кодом для создания скриншотов Flameshot 13.0

Время на прочтение2 мин
Количество просмотров2.5K

В начале августа 2025 года состоялся выпуск кроссплатформенного инструмента с открытым исходным кодом для создания скриншотов Flameshot 13.0. Исходный код проекта написан на C++ и опубликован на GitHub под лицензией GNU General Public License v3.0. Предыдущая стабильная версия Flameshot 12.1.0 вышла в июле 2022 года. Выпуск Flameshot 0.1.0 произошёл в июне 2017 года.

Читать далее

X-Omni от Tencent: авторегрессионная text-to-image модель с RL

Время на прочтение2 мин
Количество просмотров518

X-Omni — методика обучения T2I моделей, которая наглядно доказывает, что RL может вдохнуть новую жизнь в авторегрессионный подход и вывести такие модели на SOTA-уровень.

Читать далее

Cohere выпустила новую мультимодальную модель Command A Vision

Время на прочтение1 мин
Количество просмотров556

Command A Vision предназначена для анализа изображений, диаграмм, PDF-файлов и других визуальных данных. По заявлению разработчиков, на стандартных бенчмарках для компьютерного зрения она превосходит GPT-4.1, Llama 4 и Mistral Medium 3.

Читать далее

Вклад авторов