Как стать автором
Поиск
Написать публикацию
Обновить
152.57

Обработка изображений *

Работаем с фото и видео

Сначала показывать
Порог рейтинга

xAI запустила Grok Video с режимом генерации NSFW-контента

Время на прочтение2 мин
Количество просмотров1.4K

Компания Илона Маска представила Grok Imagine — инструмент для image-to-video и text-to-image генерации. Функция доступна платным подписчикам SuperGrok и Premium Plus в приложении X для iOS.

Читать далее

Новости

Российский ИИ для распознавания доступен на всех отечественных платформах. Завершено портирование на RISC-V

Время на прочтение2 мин
Количество просмотров1.5K

Ученые Smart Engines первыми в России перенесли передовые технологии распознавания штрихкодов, паспортов и других документов на микропроцессоры архитектуры RISC-V. Теперь системы компьютерного зрения доступны на всех без исключения отечественных и основных международных аппаратных платформах: Elbrus, RISC-V, MIPS (КОМДИВ), SPARC, х86, ARM. Это позволяет внедрить распознавание в различных областях – от интернета вещей до ракетостроения – и осуществлять его фактически на любом микроконтроллере, без необходимости в видеокартах и мощных процессорах.

Читать далее

Qwen выпустил генератор изображений с открытым кодом Qwen‑Image

Время на прочтение2 мин
Количество просмотров2.3K

Alibaba представила новую модель генерации изображений Qwen‑Image с открытым исходным кодом. Она доступна в чат-боте Qwen, а также на GitHubHugging Face и ModelScope.

Читать далее

Вышел кроссплатформенный инструмент с открытым исходным кодом для создания скриншотов Flameshot 13.0

Время на прочтение2 мин
Количество просмотров1.9K

В начале августа 2025 года состоялся выпуск кроссплатформенного инструмента с открытым исходным кодом для создания скриншотов Flameshot 13.0. Исходный код проекта написан на C++ и опубликован на GitHub под лицензией GNU General Public License v3.0. Предыдущая стабильная версия Flameshot 12.1.0 вышла в июле 2022 года. Выпуск Flameshot 0.1.0 произошёл в июне 2017 года.

Читать далее

X-Omni от Tencent: авторегрессионная text-to-image модель с RL

Время на прочтение2 мин
Количество просмотров402

X-Omni — методика обучения T2I моделей, которая наглядно доказывает, что RL может вдохнуть новую жизнь в авторегрессионный подход и вывести такие модели на SOTA-уровень.

Читать далее

Cohere выпустила новую мультимодальную модель Command A Vision

Время на прочтение1 мин
Количество просмотров445

Command A Vision предназначена для анализа изображений, диаграмм, PDF-файлов и других визуальных данных. По заявлению разработчиков, на стандартных бенчмарках для компьютерного зрения она превосходит GPT-4.1, Llama 4 и Mistral Medium 3.

Читать далее

Вышел Mass Image Compressor 4.1.0 для Windows для сжимания, изменения размера и конвертации больших наборов изображений

Время на прочтение1 мин
Количество просмотров2.4K

Состоялся релиз открытого проекта Mass Image Compressor 4.1.0 для Windows, который помогает сжимать, изменять размер и конвертировать большие наборы изображений. Исходный код решения написан на C# и Perl и опубликован на GitHub под лицензией GNU Affero General Public License v3.0.

Читать далее

Adobe расширяет ИИ-инструментарий Photoshop

Время на прочтение3 мин
Количество просмотров1.5K

Компания Adobe запустила новые функции генеративного ИИ для Photoshop, упрощающие добавление и удаление людей и объектов на фотографиях. Обновление включает функции масштабирования изображений с помощью ИИ, улучшенный инструмент удаления объектов, а также средства автоматической композиции, которые позволяют плавно вписывать новые элементы в изображения всего за несколько кликов.

Читать далее

В бета-версии Adobe Photoshop заработала ИИ-функция Harmonize для адаптации добавленных на фото объектов под фон

Время на прочтение1 мин
Количество просмотров621

В бета-версии Adobe Photoshop появилась функция Harmonize на базе нейросети Firefly. Она автоматически адаптирует добавляемые к фотографии объекты к окружающей среде, корректируя освещение, цветовую палитру, тени и общую тональность.

Читать далее

Создавайте целые истории с одним героем: Ideogram запустила Character

Время на прочтение2 мин
Количество просмотров509

Ideogram запустила новую функцию под названием Ideogram Character, которая позволяет создавать целые серии изображений с одним и тем же персонажем — по одной-единственной фотографии.

Читать далее

ИИ-система UVeye для оценки повреждений авто находит намного больше дефектов, чем человек, и придумывает несуществующие

Время на прочтение1 мин
Количество просмотров821

Компания Hertz начала использовать ИИ-систему UVeye для определения повреждений на арендованных автомобилях. Предполагается, что это повысит точность и скорость проверки транспортных средств. Однако, как показала практика, система находит значительно больше повреждений, чем традиционный человеческий осмотр, а порой даже «придумывает» несуществующие дефекты, сообщает The Drive.

ИИ-система UVeye, основанная на камерах и алгоритмах машинного обучения, работает в нескольких автосалонах Hertz в США, включая салон в аэропорту Хартсфилд-Джексон в Атланте. Она автоматически сканирует автомобиль перед сдачей в аренду и после возвращения и фиксирует царапины, вмятины, повреждения шин и другие дефекты.

Читать далее

Энтузиаст преобразовал PNG-файл в звуковой сигнал для птицы и научил скворца запоминать и воспроизводить такой файл

Время на прочтение2 мин
Количество просмотров4.2K

Энтузиаст, любитель птиц и музыкант Бенн Джордан рассказал про свой удачный опыт преобразования PNG-файла (размером 176 КБ несжатых данных) в звуковой сигнал и обучения молодого скворца запоминать и почти точно воспроизводить такую звуковую информацию для последующего преобразования в исходный файл. Эксперимент показал, что скворцы могут теоретически «передавать» данные с помощью своего пения со скоростью до 2 МБ в секунду (в сжатом виде).

Читать далее

Gemini 2.5 от Google теперь поддерживает «разговорную сегментацию изображений»

Время на прочтение2 мин
Количество просмотров3.9K

Компания Google представила новую функцию для ИИ-модели Gemini 2.5. Теперь пользователи могут анализировать и выделять объекты на изображениях с помощью запросов на естественном языке.

Читать далее

Ближайшие события

DuckDuckGo позволит скрывать сгенерированные изображения в результатах поиска

Время на прочтение1 мин
Количество просмотров944

Браузер DuckDuckGo представляет новую настройку, позволяющую пользователям отфильтровывать в результатах поиска изображения, созданные с помощью ИИ. Функцию запустили в ответ на отзывы пользователей, которые жаловались на проблемы с поиском реальных картинок.

Читать далее

Google запустили модель для создания видео Veo 3 на Gemini API по высокой цене

Время на прочтение2 мин
Количество просмотров1.1K

Модель для создания видео Veo 3 от Google теперь доступна через Gemini API. По цене она относится к наиболее дорогим вариантам в сфере ИИ-инструментов для создания видео.

Читать далее

Sony представила полнокадровую камеру RX1R III

Время на прочтение2 мин
Количество просмотров4.3K

Спустя почти десятилетие Sony анонсировала новую версию своей компактной камеры RX1R с фиксированным объективом. RX1R III третьего поколения оснащена той же 35-мм полнокадровой матрицей Exmor R, что и предыдущая модель, но с увеличенным с 42,4 до 61 мегапикселя разрешением. 

Читать далее

Google добавила в Veo 3 функцию преобразования изображений в видео

Время на прочтение2 мин
Количество просмотров1.8K

В четверг компания Google заявила, что добавляет функцию преобразования изображений в видео в свой ИИ-генератор видео Veo 3 через приложение Gemini.

Читать далее

Релиз открытого мультиплатформенного растрового графического редактора Krita 5.2.10

Время на прочтение1 мин
Количество просмотров971

В начале июля 2025 года состоялся релиз открытого мультиплатформенного растрового графического редактора Krita 5.2.10, предназначенного для художников и иллюстраторов. Редактор поддерживает многослойную обработку изображений, предоставляет средства для работы с различными цветовыми моделями и обладает большим набором средств для цифровой живописи, создания скетчей и формирования текстур.

Читать далее

Alibaba представила Qwen VLo: мультимодальная модель для работы с изображениями

Время на прочтение2 мин
Количество просмотров1.4K

Китайский технологический гигант Alibaba представил Qwen VLo — мультимодальную модель искусственного интеллекта, предназначенную для анализа, создания и редактирования изображений.

Читать далее

Apple получила патент на камеру для съёмки аналогично человеческому зрению

Время на прочтение2 мин
Количество просмотров4.4K

Apple запатентовала новый тип датчика для камер, который позволяет снимать фото и видео с динамическим диапазоном, близким к тому, как видит человеческий глаз. 

Читать далее
1
23 ...

Вклад авторов