Как стать автором
Поиск
Написать публикацию
Обновить
143.47

Обработка изображений *

Работаем с фото и видео

Сначала показывать
Порог рейтинга

Microsoft добавила в Bing Image Creator бесплатный доступ к GPT-4o

Время на прочтение2 мин
Количество просмотров438

Microsoft теперь предоставляет бесплатный доступ к GPT-4o через Bing Image Creator, позволяя каждому пользователю создавать изображения с помощью ИИ. Это та же технология, которую OpenAI интегрировала в ChatGPT в начале текущего года.

Читать далее

Новости

xAI запустила Grok Video с режимом генерации NSFW-контента

Время на прочтение2 мин
Количество просмотров2.1K

Компания Илона Маска представила Grok Imagine — инструмент для image-to-video и text-to-image генерации. Функция доступна платным подписчикам SuperGrok и Premium Plus в приложении X для iOS.

Читать далее

Российский ИИ для распознавания доступен на всех отечественных платформах. Завершено портирование на RISC-V

Время на прочтение2 мин
Количество просмотров2.1K

Ученые Smart Engines первыми в России перенесли передовые технологии распознавания штрихкодов, паспортов и других документов на микропроцессоры архитектуры RISC-V. Теперь системы компьютерного зрения доступны на всех без исключения отечественных и основных международных аппаратных платформах: Elbrus, RISC-V, MIPS (КОМДИВ), SPARC, х86, ARM. Это позволяет внедрить распознавание в различных областях – от интернета вещей до ракетостроения – и осуществлять его фактически на любом микроконтроллере, без необходимости в видеокартах и мощных процессорах.

Читать далее

Qwen выпустил генератор изображений с открытым кодом Qwen‑Image

Время на прочтение2 мин
Количество просмотров2.9K

Alibaba представила новую модель генерации изображений Qwen‑Image с открытым исходным кодом. Она доступна в чат-боте Qwen, а также на GitHubHugging Face и ModelScope.

Читать далее

Вышел кроссплатформенный инструмент с открытым исходным кодом для создания скриншотов Flameshot 13.0

Время на прочтение2 мин
Количество просмотров2K

В начале августа 2025 года состоялся выпуск кроссплатформенного инструмента с открытым исходным кодом для создания скриншотов Flameshot 13.0. Исходный код проекта написан на C++ и опубликован на GitHub под лицензией GNU General Public License v3.0. Предыдущая стабильная версия Flameshot 12.1.0 вышла в июле 2022 года. Выпуск Flameshot 0.1.0 произошёл в июне 2017 года.

Читать далее

X-Omni от Tencent: авторегрессионная text-to-image модель с RL

Время на прочтение2 мин
Количество просмотров427

X-Omni — методика обучения T2I моделей, которая наглядно доказывает, что RL может вдохнуть новую жизнь в авторегрессионный подход и вывести такие модели на SOTA-уровень.

Читать далее

Cohere выпустила новую мультимодальную модель Command A Vision

Время на прочтение1 мин
Количество просмотров486

Command A Vision предназначена для анализа изображений, диаграмм, PDF-файлов и других визуальных данных. По заявлению разработчиков, на стандартных бенчмарках для компьютерного зрения она превосходит GPT-4.1, Llama 4 и Mistral Medium 3.

Читать далее

Вышел Mass Image Compressor 4.1.0 для Windows для сжимания, изменения размера и конвертации больших наборов изображений

Время на прочтение1 мин
Количество просмотров2.5K

Состоялся релиз открытого проекта Mass Image Compressor 4.1.0 для Windows, который помогает сжимать, изменять размер и конвертировать большие наборы изображений. Исходный код решения написан на C# и Perl и опубликован на GitHub под лицензией GNU Affero General Public License v3.0.

Читать далее

Adobe расширяет ИИ-инструментарий Photoshop

Время на прочтение3 мин
Количество просмотров1.5K

Компания Adobe запустила новые функции генеративного ИИ для Photoshop, упрощающие добавление и удаление людей и объектов на фотографиях. Обновление включает функции масштабирования изображений с помощью ИИ, улучшенный инструмент удаления объектов, а также средства автоматической композиции, которые позволяют плавно вписывать новые элементы в изображения всего за несколько кликов.

Читать далее

В бета-версии Adobe Photoshop заработала ИИ-функция Harmonize для адаптации добавленных на фото объектов под фон

Время на прочтение1 мин
Количество просмотров661

В бета-версии Adobe Photoshop появилась функция Harmonize на базе нейросети Firefly. Она автоматически адаптирует добавляемые к фотографии объекты к окружающей среде, корректируя освещение, цветовую палитру, тени и общую тональность.

Читать далее

Создавайте целые истории с одним героем: Ideogram запустила Character

Время на прочтение2 мин
Количество просмотров526

Ideogram запустила новую функцию под названием Ideogram Character, которая позволяет создавать целые серии изображений с одним и тем же персонажем — по одной-единственной фотографии.

Читать далее

ИИ-система UVeye для оценки повреждений авто находит намного больше дефектов, чем человек, и придумывает несуществующие

Время на прочтение1 мин
Количество просмотров843

Компания Hertz начала использовать ИИ-систему UVeye для определения повреждений на арендованных автомобилях. Предполагается, что это повысит точность и скорость проверки транспортных средств. Однако, как показала практика, система находит значительно больше повреждений, чем традиционный человеческий осмотр, а порой даже «придумывает» несуществующие дефекты, сообщает The Drive.

ИИ-система UVeye, основанная на камерах и алгоритмах машинного обучения, работает в нескольких автосалонах Hertz в США, включая салон в аэропорту Хартсфилд-Джексон в Атланте. Она автоматически сканирует автомобиль перед сдачей в аренду и после возвращения и фиксирует царапины, вмятины, повреждения шин и другие дефекты.

Читать далее

Энтузиаст преобразовал PNG-файл в звуковой сигнал для птицы и научил скворца запоминать и воспроизводить такой файл

Время на прочтение2 мин
Количество просмотров4.3K

Энтузиаст, любитель птиц и музыкант Бенн Джордан рассказал про свой удачный опыт преобразования PNG-файла (размером 176 КБ несжатых данных) в звуковой сигнал и обучения молодого скворца запоминать и почти точно воспроизводить такую звуковую информацию для последующего преобразования в исходный файл. Эксперимент показал, что скворцы могут теоретически «передавать» данные с помощью своего пения со скоростью до 2 МБ в секунду (в сжатом виде).

Читать далее

Ближайшие события

Gemini 2.5 от Google теперь поддерживает «разговорную сегментацию изображений»

Время на прочтение2 мин
Количество просмотров3.9K

Компания Google представила новую функцию для ИИ-модели Gemini 2.5. Теперь пользователи могут анализировать и выделять объекты на изображениях с помощью запросов на естественном языке.

Читать далее

DuckDuckGo позволит скрывать сгенерированные изображения в результатах поиска

Время на прочтение1 мин
Количество просмотров951

Браузер DuckDuckGo представляет новую настройку, позволяющую пользователям отфильтровывать в результатах поиска изображения, созданные с помощью ИИ. Функцию запустили в ответ на отзывы пользователей, которые жаловались на проблемы с поиском реальных картинок.

Читать далее

Google запустили модель для создания видео Veo 3 на Gemini API по высокой цене

Время на прочтение2 мин
Количество просмотров1.1K

Модель для создания видео Veo 3 от Google теперь доступна через Gemini API. По цене она относится к наиболее дорогим вариантам в сфере ИИ-инструментов для создания видео.

Читать далее

Sony представила полнокадровую камеру RX1R III

Время на прочтение2 мин
Количество просмотров4.3K

Спустя почти десятилетие Sony анонсировала новую версию своей компактной камеры RX1R с фиксированным объективом. RX1R III третьего поколения оснащена той же 35-мм полнокадровой матрицей Exmor R, что и предыдущая модель, но с увеличенным с 42,4 до 61 мегапикселя разрешением. 

Читать далее

Google добавила в Veo 3 функцию преобразования изображений в видео

Время на прочтение2 мин
Количество просмотров1.8K

В четверг компания Google заявила, что добавляет функцию преобразования изображений в видео в свой ИИ-генератор видео Veo 3 через приложение Gemini.

Читать далее

Релиз открытого мультиплатформенного растрового графического редактора Krita 5.2.10

Время на прочтение1 мин
Количество просмотров972

В начале июля 2025 года состоялся релиз открытого мультиплатформенного растрового графического редактора Krita 5.2.10, предназначенного для художников и иллюстраторов. Редактор поддерживает многослойную обработку изображений, предоставляет средства для работы с различными цветовыми моделями и обладает большим набором средств для цифровой живописи, создания скетчей и формирования текстур.

Читать далее

Alibaba представила Qwen VLo: мультимодальная модель для работы с изображениями

Время на прочтение2 мин
Количество просмотров1.4K

Китайский технологический гигант Alibaba представил Qwen VLo — мультимодальную модель искусственного интеллекта, предназначенную для анализа, создания и редактирования изображений.

Читать далее
1
23 ...

Вклад авторов