
Midjourney внедряет экспериментальную функцию под названием Omni-Reference, которая позволяет пользователям детально контролировать, какие визуальные элементы появляются на сгенерированных изображениях.
Работаем с фото и видео
Midjourney внедряет экспериментальную функцию под названием Omni-Reference, которая позволяет пользователям детально контролировать, какие визуальные элементы появляются на сгенерированных изображениях.
Во вторник Freepik, онлайн-платформа для графического дизайна, представила новую «открытую» модель изображений на основе ИИ, которая, по словам компании, была обучена исключительно на изображениях с коммерческой лицензией, «безопасных для работы».
25 апреля 2025 года состоялся релиз компактного открытого проекта портативного фоторедактора PhotoDemon 2025.4 для ОС Windows. Исходный код решения написан на Visual Basic 6.0 и опубликован на GitHub.
В четверг компания Adobe выпустила последнюю версию своего семейства моделей искусственного интеллекта Firefly для создания изображений, модель для создания векторов и обновленное веб-приложение, в котором представлены все модели искусственного интеллекта, а также некоторые модели конкурентов. Также в разработке находится мобильное приложение Firefly.
Искусственный интеллект, прочёсывающий огромное количество информации, оказался заражён несуществующим научным термином. Этот набор слов уже попал в базы данных ИИ OpenAI и Anthropic.
Речь идёт о «термине» «вегетативная электронная микроскопия» (vegetative electron microscopy). Как сообщает The Conversation, он мог появиться из статьи о клеточных стенках бактерий, опубликованной в журнале Bacteriological Reviews в 1959 году и позже оцифрованной. Расположение колонок в статье сбило с толку программное обеспечение оцифровки, которое смешало слово vegetative из одной колонки со словом electron из другой.
ByteDance представляет Seedream 3.0 — новую модель преобразования текста в изображение. Тесты показывают, что она превосходит GPT-4o и Midjourney по скорости, точности и качеству изображения.
Sony презентовала миниатюрный маленький датчик глубины AS-DT1 LiDAR размером всего 29х29х31 мм. Он использует сложные технологии миниатюризации и оптических линз промышленных камер машинного зрения для точного измерения расстояния и диапазона.
Ещё в 2023 году Microsoft представила новую функцию в Snipping Tool под названием Text Actions, которая может обнаруживать текст на скриншотах, чтобы копировать его. Теперь компания анонсировала добавление популярной функции Text Extractor на панель захвата «Ножниц».
OpenAI приступила к внутреннему тестированию системы нанесения цифровых меток на изображения, которые генерируются в ChatGPT-4o. По данным Bleeping Computer, эта функция появится в бесплатной версии нейросети. У подписчиков ChatGPT Plus останется возможность скачивать изображения без водяных знаков.
В LinkedIn завирусился тренд с использованием генератора изображений ChatGPT — люди создают ИИ-аватары в виде фигурок. На это обратило внимание издание The Verge.
Журналист Android Authority изучил новую функцию Google для Gboard, которая пока находится в разработке. Это «студия мемов» на базе искусственного интеллекта. Как показали первые тесты, функция не позволяет генерировать действительно смешные шутки.
12 апреля 2025 года состоялся релиз открытого мультиплатформенного графического редактора Pinta 3.0. Это бесплатный небольшой редактор растровых изображений, который поддерживает слои и ряд инструментов для рисования и редактирования. Исходный код проекта написан на C# и опубликован на GitHub под лицензией MIT.
Fujifilm презентовала новую камеру мгновенной печати Instax mini 41 спустя четыре года после релиза предшествующей модели — Instax mini 40. Новое устройство сохранило винтажный дизайн и получило функцию коррекции параллакса, которую имеет Instant mini 12.
Midjourney, один из первых генераторов изображений с использованием искусственного интеллекта в интернете, представил свою первую обновлённую модель изображений, разработанную с применением технологий ИИ, спустя почти год.
Мультимодальную нейросеть GPT-4o добавили на Image Arena — площадку, на которой пользователи в слепом тесте выбирают лучшую модель для генерации картинок по тексту. Решение от OpenAI вырвалось на первое место практически сразу после релиза возможности создавать картинки.
Разработчик под никнеймом faisalsayed10 опубликовал расширение для браузера Google Chrome, которое очищает ленту в социальной сети X от сгенерированных картинок в стиле аниме студии «Гибли». За распознавание генеративного контента отвечает небольшая классификационная нейросеть.
Дизайнера Фрэнка Миллера не пустили на концерт в Radio City Music Hall, принадлежащий Madison Square Garden (MSG). Система видеонаблюдения MSG опознала Миллера как человека, который критиковал гендиректора компании, после чего ему пожизненно запретили посещать все её объекты.
Microsoft выпустила большое новое обновление для приложения Windows Photos в программе Windows Insider. Теперь инсайдерам каналов предварительной версии Windows 11 и 10 доступны такие функции, как поиск в Интернете с помощью OCR (оптического распознавания символов), улучшенные контекстные меню, поддержка подпапок, специальная кнопка Copilot, поддержка JXL и многое другое.
Ideogram, генератор изображений, использующий искусственный интеллект, представил новую версию 3.0 с расширенными возможностями для создания более правдоподобных и стилизованных изображений.
Привет, Хабр! Сегодня наша команда компьютерного зрения представляет две новые модели. Базовая модель YandexART 2.5 уже доступна всем пользователям Шедеврума и в Чате с Алисой. Более мощную Pro-версию можно попробовать в новой подписке Шедеврум Про. Модели научились самостоятельно подбирать подходящие стиль и оформление изображения и стали лучше генерировать надписи на латинице. Новые возможности будут полезны, например, для создания книжных обложек, логотипов или художественных иллюстраций.
Чуть подробнее о том, что мы изменили в процессе обучения, расскажу под катом. Ну а в конце новости вас ждут наглядные примеры наиболее заметных улучшений.