Как стать автором
Поиск
Написать публикацию
Обновить
98.18

Обработка изображений *

Работаем с фото и видео

Сначала показывать
Порог рейтинга

Компактная камера Ricoh GR IV выйдет в сентябре по цене $1500

Время на прочтение1 мин
Количество просмотров1.6K

Ricoh выпустит свою компактную камеру GR IV в середине сентября по цене $1500. Она будет комплектоваться новой миниатюрной вспышкой GF-2 за $120.

Читать далее

Новости

DogRecon: ИИ превращает фото собаки в анимированного 3D-аватара

Время на прочтение3 мин
Количество просмотров499

Учёные из Ульсанского национального института науки и технологий (Южная Корея) создали систему ИИ, которая открывает возможность взять пушистого друга в виртуальный мир. Их проект DogRecon умеет превращать всего одну фотографию собаки в реалистичную трёхмерную цифровую модель для виртуальной или дополненной реальности.

Читать далее

Раньше в Ancestry оцифровывали документы 9 месяцев. Теперь ИИ справляется за 9 дней

Время на прочтение3 мин
Количество просмотров1.7K

«Мы собрали более 65 млрд записей из 80 с лишним стран. Чтобы вы представляли масштаб: это примерно 10 000 ТБ данных, которые мы используем, чтобы открывать нашим пользователям новые факты об их предках».

Но у такого колоссального собрания есть и главная трудность: как всё это упорядочить. По словам Тьягараджана, компания стала активно использовать искусственный интеллект и машинное обучение, чтобы справиться с этой почти героической задачей.

Читать далее

Meta✶ привлекла Midjourney к разработке своих ИИ-моделей изображений и видео

Время на прочтение3 мин
Количество просмотров507

Компания Meta✶ заключила партнерство с Midjourney, чтобы получить лицензию на технологии стартапа по генерации изображений и видео с помощью искусственного интеллекта. Об этом в пятницу в Threads сообщил главный директор Meta✶ по ИИ Александр Ван. По его словам, исследовательские команды Meta✶ будут тесно сотрудничать с Midjourney, чтобы встроить эти разработки в будущие ИИ‑модели и продукты компании.

Читать далее

Qwen Image Edit — новый шаг к умному и смысловому редактированию фото

Время на прочтение3 мин
Количество просмотров6.5K

Компания Alibaba обновила свою модель Qwen для работы с изображениями, добавив в неё новые инструменты редактирования.

Система способна на всё — от лёгких косметических ретушей до сложных смысловых изменений. Визуальное редактирование позволяет менять лишь отдельные фрагменты, сохраняя остальное без вмешательств. Семантическое же вмешательство затрагивает пиксели по всей картинке, но при этом главный объект остаётся узнаваемым и неизменным по сути.

Читать далее

Самообучающаяся DINOv3✶ от Meta✶ обгоняет конкурентов в анализе изображений

Время на прочтение3 мин
Количество просмотров1.8K

Обычно обучение систем искусственного интеллекта для генерации или анализа изображений требует колоссальных объемов данных: фотографии, скажем, котов вручную снабжаются ярлыками — «кот», «идет», «полосатый». Но DINOv3✶ от Meta✶ пошла иным путем: она обучалась на 1,7 млрд изображений без каких‑либо меток и теперь умеет решать множество задач без человеческого вмешательства, нередко опережая специализированные модели.

Читать далее

X-Omni от Tencent бросает вызов GPT-4o в генерации изображений, опираясь на опенсорс

Время на прочтение3 мин
Количество просмотров919

Команда Tencent X‑Omni показала, как методы обучения с подкреплением могут исправить типичные слабости гибридных систем искусственного интеллекта для генерации картинок. Модель особенно сильна в отображении длинных текстов в изображениях и временами задаёт новые стандарты качества.

Читать далее

Google Pixel 10: утечка показала новые функции Gemini для камеры

Время на прочтение2 мин
Количество просмотров2.1K

По данным Android Headlines, Google внедрит в новый смартфон Google Pixel 10 ИИ-функцию Camera Coach. И как ясно из названия, она будет обучать владельцев делать более качественные снимки в реальном времени.

Читать далее

Microsoft добавила в Bing Image Creator бесплатный доступ к GPT-4o

Время на прочтение2 мин
Количество просмотров697

Microsoft теперь предоставляет бесплатный доступ к GPT-4o через Bing Image Creator, позволяя каждому пользователю создавать изображения с помощью ИИ. Это та же технология, которую OpenAI интегрировала в ChatGPT в начале текущего года.

Читать далее

xAI запустила Grok Video с режимом генерации NSFW-контента

Время на прочтение2 мин
Количество просмотров2.9K

Компания Илона Маска представила Grok Imagine — инструмент для image-to-video и text-to-image генерации. Функция доступна платным подписчикам SuperGrok и Premium Plus в приложении X для iOS.

Читать далее

Российский ИИ для распознавания доступен на всех отечественных платформах. Завершено портирование на RISC-V

Время на прочтение2 мин
Количество просмотров2.4K

Ученые Smart Engines первыми в России перенесли передовые технологии распознавания штрихкодов, паспортов и других документов на микропроцессоры архитектуры RISC-V. Теперь системы компьютерного зрения доступны на всех без исключения отечественных и основных международных аппаратных платформах: Elbrus, RISC-V, MIPS (КОМДИВ), SPARC, х86, ARM. Это позволяет внедрить распознавание в различных областях – от интернета вещей до ракетостроения – и осуществлять его фактически на любом микроконтроллере, без необходимости в видеокартах и мощных процессорах.

Читать далее

Qwen выпустил генератор изображений с открытым кодом Qwen‑Image

Время на прочтение2 мин
Количество просмотров3.6K

Alibaba представила новую модель генерации изображений Qwen‑Image с открытым исходным кодом. Она доступна в чат-боте Qwen, а также на GitHubHugging Face и ModelScope.

Читать далее

Вышел кроссплатформенный инструмент с открытым исходным кодом для создания скриншотов Flameshot 13.0

Время на прочтение2 мин
Количество просмотров2.2K

В начале августа 2025 года состоялся выпуск кроссплатформенного инструмента с открытым исходным кодом для создания скриншотов Flameshot 13.0. Исходный код проекта написан на C++ и опубликован на GitHub под лицензией GNU General Public License v3.0. Предыдущая стабильная версия Flameshot 12.1.0 вышла в июле 2022 года. Выпуск Flameshot 0.1.0 произошёл в июне 2017 года.

Читать далее

Ближайшие события

X-Omni от Tencent: авторегрессионная text-to-image модель с RL

Время на прочтение2 мин
Количество просмотров486

X-Omni — методика обучения T2I моделей, которая наглядно доказывает, что RL может вдохнуть новую жизнь в авторегрессионный подход и вывести такие модели на SOTA-уровень.

Читать далее

Cohere выпустила новую мультимодальную модель Command A Vision

Время на прочтение1 мин
Количество просмотров540

Command A Vision предназначена для анализа изображений, диаграмм, PDF-файлов и других визуальных данных. По заявлению разработчиков, на стандартных бенчмарках для компьютерного зрения она превосходит GPT-4.1, Llama 4 и Mistral Medium 3.

Читать далее

Вышел Mass Image Compressor 4.1.0 для Windows для сжимания, изменения размера и конвертации больших наборов изображений

Время на прочтение1 мин
Количество просмотров2.7K

Состоялся релиз открытого проекта Mass Image Compressor 4.1.0 для Windows, который помогает сжимать, изменять размер и конвертировать большие наборы изображений. Исходный код решения написан на C# и Perl и опубликован на GitHub под лицензией GNU Affero General Public License v3.0.

Читать далее

Adobe расширяет ИИ-инструментарий Photoshop

Время на прочтение3 мин
Количество просмотров1.7K

Компания Adobe запустила новые функции генеративного ИИ для Photoshop, упрощающие добавление и удаление людей и объектов на фотографиях. Обновление включает функции масштабирования изображений с помощью ИИ, улучшенный инструмент удаления объектов, а также средства автоматической композиции, которые позволяют плавно вписывать новые элементы в изображения всего за несколько кликов.

Читать далее

В бета-версии Adobe Photoshop заработала ИИ-функция Harmonize для адаптации добавленных на фото объектов под фон

Время на прочтение1 мин
Количество просмотров820

В бета-версии Adobe Photoshop появилась функция Harmonize на базе нейросети Firefly. Она автоматически адаптирует добавляемые к фотографии объекты к окружающей среде, корректируя освещение, цветовую палитру, тени и общую тональность.

Читать далее

Создавайте целые истории с одним героем: Ideogram запустила Character

Время на прочтение2 мин
Количество просмотров586

Ideogram запустила новую функцию под названием Ideogram Character, которая позволяет создавать целые серии изображений с одним и тем же персонажем — по одной-единственной фотографии.

Читать далее

ИИ-система UVeye для оценки повреждений авто находит намного больше дефектов, чем человек, и придумывает несуществующие

Время на прочтение1 мин
Количество просмотров883

Компания Hertz начала использовать ИИ-систему UVeye для определения повреждений на арендованных автомобилях. Предполагается, что это повысит точность и скорость проверки транспортных средств. Однако, как показала практика, система находит значительно больше повреждений, чем традиционный человеческий осмотр, а порой даже «придумывает» несуществующие дефекты, сообщает The Drive.

ИИ-система UVeye, основанная на камерах и алгоритмах машинного обучения, работает в нескольких автосалонах Hertz в США, включая салон в аэропорту Хартсфилд-Джексон в Атланте. Она автоматически сканирует автомобиль перед сдачей в аренду и после возвращения и фиксирует царапины, вмятины, повреждения шин и другие дефекты.

Читать далее
1
23 ...

Вклад авторов