Обработка изображений *

Работаем с фото и видео

СтатьиПостыНовостиАвторыКомпании

SmartEngines 21 июн 2024 в 08:45

Как устроены 4.6-битные сети: обучение

Средний

8 мин

1.7K

Блог компании Smart EnginesОбработка изображений * Машинное обучение * Искусственный интеллект

Мы уже писали о том, что предложили новую модель квантования нейронных сетей, позволяющую ускорить их на 40% на центральных процессорах, а также о том, как она устроена тут. Сегодня мы расскажем о том, как мы в Smart Engines обучали 4.6-битные сети.

PaaLadin 19 июн 2024 в 16:21

ИИ Яндекс пытается переплюнуть Тинькофф?

Простой

3 мин

9.2K

Искусственный интеллектОблачные сервисы * Машинное обучение * Обработка изображений * Хранение данных *

Кейс

В своё время читал, как голосовой консультант "Олег" от компании Тинькофф рекомендовал пользователю совершить 'Роскомнадзор' в качестве решения проблемы.
Думал - шутка.

Недавно решил потрогать Яндекс360 в варианте Премиум. В ответ Yandex решил ~~потрогать меня~~ сделать мне приятное своими нейросетевыми алгоритмами, о чём известил меня ненавязчивым пушем - Цветочное настроение.
Миниатюра фото уже намекает, да?

Хватит ли Диска для всех букетов...

+20

MerlinShow 18 июн 2024 в 05:26

Глубокое обучение для деформируемой регистрации медицинских изображений

Средний

7 мин

1.1K

Машинное обучение * Обработка изображений * Алгоритмы *

Из песочницы

В этой статье я расскажу о применении регистрации изображений в медицине, а также рассмотрю современные подходы к решению этой задачи.

Tehnologika 17 июн 2024 в 10:47

Сравнение сервисов для анализа документов AWS Textract, Azure Document Intelligence и Ripper Service от Технологики

Средний

10 мин

1.5K

Microsoft Azure * Amazon Web Services * PDFОбработка изображений *

Аналитика

Бизнес все чаще и чаще предпочитают отдать искусственному интеллекту извлечение данных из документов: при таком подходе меньше ошибок и выше скорость обработки документов. И все чаще звучит вопрос — каким решением пользоваться и к какому подрядчику пойти за оказанием услуги?

Поэтому мы сделали сравнительный обзор двух популярных решений от лидеров рынка по обработке документов — AWS Textract, Microsoft Azure Document Intelligence и собственного решения Ripper Service. Сравнивали решения по нескольким основаниям: по производительности, по результатам извлечения значений из форм, а также по стоимости.

Надеемся, что данная статья будет полезна руководителям компаний, которые уже задумались о применении ИИ для массовой обработки документов.

Hanamime 14 июн 2024 в 07:40

Ваш путеводитель по дипфейкам: осведомлён — значит вооружён

Простой

7 мин

5.4K

Блог компании СберМашинное обучение * Работа с видео * Обработка изображений *

Мнение

Даже если вы не знаете, что такое дипфейки, вы наверняка с ними сталкивались. Хотя изменённые и поддельные медиа не являются чем-то новым, дипфейки выводят их на совершенно новый уровень, используя искусственный интеллект для создания изображений, видео и аудио, которые кажутся реальными, но на самом деле таковыми не являются. Дипфейки (DeepFake) — это синтетические медиа, в которых человек на существующем изображении, видео или записи заменяется чьим-либо подобием. Технология DeepFake представляет собой одно из самых интригующих и противоречивых достижений в сфере ИИ. Поскольку дипфейки становятся всё доступнее, а их качество растёт, они создают серьёзные проблемы и в то же время дают новые возможности развития в различных сферах жизни человека.

+18

SmartEngines 14 июн 2024 в 07:39

В листах правды нет: как вузам быстро и безопасно ввести данные абитуриентов?

Простой

5 мин

900

Блог компании Smart EnginesИскусственный интеллектОбработка изображений *

Через неделю вузы начнут принимать документы абитуриентов на все формы обучения. Собрать и направить все необходимые бумаги в институты для будущих студентов – тот еще челлендж. Таким же малоприятным является процесс обработки этих документов и для сотрудников приемных комиссий, которым – когда абитуриенты выстроятся в очереди с оригиналами документов – придется перелопатить кипы бумаг.

Мы в Smart Engines нашли способ, как ускорить и упростить этот процесс для всех его участников.

DewT-Mag 13 июн 2024 в 09:00

Умная стройка как (микро)сервис: следим за возведением зданий

Простой

7 мин

2.4K

Блог компании Magnus TechМикросервисы * Машинное обучение * Обработка изображений * IT-инфраструктура *

Кейс

✏️ Технотекст 7

В России наблюдается интерес к комплексным системам автоматизации строительства, но их внедрение — долгий и сложный процесс. Поэтому чаще застройщики предпочитают точечные решения. Появился спрос на специализированные нейросетевые микросервисы для подключения к готовым системам заказчика.

Мы отметили эту тенденцию после одного примечательного проекта по мониторингу процесса строительства. Фактически сначала нас попросили сделать «‎то, не знаю что»‎, причем в очень сжатые сроки. Ситуация могла обернуться провалом, но мы справились и нашли новую перспективную нишу для разработки новых продуктов. Сейчас расскажу, как это было.

+14

smile_artem 12 июн 2024 в 15:04

Максимально точное увеличение разрешения изображений: билинейная аппроксимация

Средний

8 мин

6.1K

Open source * .NET * Обработка изображений * Восстановление данных * C# *

Аналитика

В этом выпуске: улучшение билинейной интерполяции, больше методов апскейлинга, второй этап сравнения методов с точки зрения наименьшей ошибки, как применять шейдеры к отдельным изображениям, как уменьшить звон на изображении и многое другое...

Продолжаем увеличивать апскейл...

+20

SmartEngines 11 июн 2024 в 07:26

Как обезопасить себя при приеме на работу мигрантов, чтобы не получить штраф или дисквалификацию

Простой

6 мин

1.6K

Блог компании Smart EnginesОбработка изображений * Искусственный интеллект

Для компаний трудоустройство сотрудника из‑за рубежа — не самая простая процедура. К тому же она сопровождается риском найма нелегальных мигрантов, что может аукнуться работодателю многотысячными штрафами и другими неприятным последствиям. Как избежать таких проблем при оформлении иностранного гражданина? И причем тут искусственный интеллект? Разбираемся в статье.

patapum_gg 4 июн 2024 в 10:47

ML в OCR: зачем и как

Простой

5 мин

2.9K

Блог компании SL SoftОбработка изображений * Машинное обучение *

Привет, меня зовут Георгий Гончаров, я инженер‑консультант OCR‑платформы SOICA, предназначенной для распознавания и обработки текстовых и графических данных. Поскольку это собственная разработка, то мы постоянно внедряем новые фичи. Недавно появилась еще одна — мы назвали ее ML‑локатор. В статье расскажу, почему и как мы реализовали эту функциональность и каких результатов удалось достичь.

truetechday 1 июн 2024 в 08:00

Tech4Art: как дроны и VR помогают рисовать граффити и муралы

10 мин

2.4K

Блог компании МТСОбработка изображений * AR и VRРобототехника

Привет, Хабр! Меня зовут Миша Most, я художник, который начинал как граффити-райтер. Сегодня расскажу о том, как технологии помогают нам, представителям искусства, творить, создавая необычные проекты. Сначала — немного о своих работах, которые находятся на стыке искусства и технологий. А потом вместе с моим коллегой расскажу о самих технологиях.

В статье кроме информации о моем творчестве немало технических подробностей, которые помогают понять, как работает симбиоз современного искусства и технологий. Всё самое интересное — под катом.

Этот пост — переработанная версия доклада с True Tech Day 2.0.

+16

SmartEngines 31 мая 2024 в 07:58

“Семь раз отмерь, один раз сшей” или совмещение 3D изображений в компьютерной томографии

Простой

4 мин

822

Блог компании Smart EnginesОбработка изображений * Data Engineering *

Привет, Хабр!

Мудрая пословица гласит: «Семь раз отмерь, один – отрежь». Эта пословица применима и к томографии, так как в случае проведения томографических экспериментов при классическом подходе для каждого объекта составляется сначала план измерений, а потом уже выполняются сами измерения. Если объект протяженный или помещается в поле вида детектора впритык, то часто принимается решение сделать два измерения: верхней части объекта и нижней. В этом случае в программе обработки данных томографических измерений необходима дополнительная функциональность, а именно, совмещение и сшивка трехмерных изображений. О том, как мы добавили такую функциональность в Smart Tomo Engine, наш продукт для томографической реконструкции и анализа, мы расскажем в сегодняшней статье.

boomb0om 31 мая 2024 в 07:14

Как мы собираем данные для обучения Kandinsky

Сложный

14 мин

3.3K

Блог компании SberDevicesБлог компании СберМашинное обучение * Обработка изображений *

Кейс

Всем привет! Наша команда в Sber AI занимается генеративными моделями и сегодня мы расскажем про очень важный этап разработки моделей для генерации фотореалистичных изображений и видео — процесс сбора и фильтрации данных. Про этот этап очень редко подробно рассказывают разработчики и исследователи таких известных генеративных моделей как DALL-E 3, Stable Diffusion, MidJourney или SORA. Генеративные модели уже многих впечатлили своими возможностями создавать максимально реалистичные изображения и видеоролики, а качественные данные — далеко не последняя причина, по которой такого качества генераций удалось достичь.

+20

VArkhipkin 28 мая 2024 в 09:47

Kandinsky Video 1.1: обновленная модель генерации видео

Средний

9 мин

7.3K

Блог компании СберБлог компании SberDevicesОбработка изображений * Машинное обучение * Natural Language Processing *

Обзор

В ноябре прошлого года наша команда представила свою первую разработку в области генерации видео по тексту – модель Kandinsky Video, основанную на модели генерации изображений Kandinsky 3.0, по которой мы недавно выпустили обновление – версию 3.1 (о чем можно почитать здесь). Первая видеомодель уже обладала весьма достойным качеством, сравнимым с лучшими мировыми решениями на тот момент. Нам удалось прокачать скорость генерации и моделирование динамики, но главное – мы вступили в новую для себя область генеративного искусственного интеллекта и быстро достигли в ней заметных результатов. Тогда, полгода назад, о подобных моделях знали в основном лишь те, кто так или иначе интересуется областью генеративного искусственного интеллекта. Сегодня же ситуация изменилась – благодаря значительному росту качества генерации видео за последний период, о существовании подобных моделей не слышал только ленивый. Разумеется, такой вход новых технологий в нашу жизнь стал возможным именно благодаря тем исследованиям, которые сообщество проводило за последние полтора года и в которые исследователи из нашей команды включились практически сразу.

Сегодня мы представляем следующую версию нашей модели генерации видео по тексту – Kandinsky Video 1.1. Мы учли последние тенденции в области разработок видеомоделей и сделали нашу технологию еще более впечатляющей, проведя собственные исследования в области архитектур, обработки данных и замере показателей качества, которые мы опишем ниже.

+35

Xcom-shop 23 мая 2024 в 05:37

Чем новый ChatGPT-4o отличается от GPT-4, что умеет и почему это супер-важно

Простой

7 мин

90K

Блог компании Группа компаний X-ComИскусственный интеллектОбработка изображений * Будущее здесь

Обзор

В середине мая компания OpenAI представила новую версию самой популярной и хайповой нейросети в мире. Продукт получил название ChatGPT-4o, сохранив порядковый номер своего предшественника. Несмотря на это, чат-бот не только стал быстрее обрабатывать информацию, но и получил поддержку мультимодальности, и это буквально все изменило.

+10

120

mynameco 20 мая 2024 в 21:32

Delta-Rle-Huffman (DRH) Texture Format

8 мин

4.2K

Сжатие данных * C# * Обработка изображений * Алгоритмы * Ненормальное программирование *

Всем привет! В этой статье я опишу алгоритм работы формата сжатия изображений без потерь. Сжатие использует известные методики, которые и дали ему название. Проект начинался с простых экспериментов, которые вышли из под контроля. Не смотря на то, что формат чаще сжимает лучше чем png, никакого практического применения этот формат не имеет, оставаясь чисто академическим.

Внимание! В статье много картинок.

Кому интересно, добро пожаловать под кат!

+53

OSINT_mindset 18 мая 2024 в 14:29

Магия музеев или что могут технологии

Простой

6 мин

1.7K

Привет! На Хабре рассказывают про технологии, поэтому я выбрала подходящую и красивую тему. В этом посте рассказ пойдет об онлайн-музеях — какие из них стоит посмотреть, где искать ссылки, как и почему музеи оцифровывают коллекции.

Я, riaria — специалист по арткрайму и OSINT энтузиаст, расскажу, что остается за кадром. Кстати, 18 мая Международный день музеев и узнать побольше о том, что обычно скрывается от посетителей — отличный способ его отметить!

Вперед по музеям →

+11

Ilep 13 мая 2024 в 18:45

Копаемся в встроенном приложении камеры старого Xiaomi. Часть 2

Средний

22 мин

4.9K

Android * Обработка изображений * Реверс-инжиниринг *

Попытаемся отреверсить и заглянуть в реализацию фото-эффектов приложения камеры Xiaomi 8 летней давности

[Начать реверс!]

aufklarer 11 мая 2024 в 08:39

Архитектура Stable Diffusion: Face ID, Lighting

Средний

7 мин

5.8K

Обработка изображений * Искусственный интеллект

Обзор

Это перевод моей статьи на medium.com.

Год назад я провёл краткий обзор по теме переноса стиля. Пару месяцев назад я решил вернуться к этому вопросу и исследовать прогресс за последний год. За это время случилось много значимых изменений: архитектура open-source модели Stable Diffusion стала, лидирующей среди моделей для задач генерации изображений. Особенно её модификация SDXL [1]. Hugging Face превратился в лидирующую платформу для запуска модели Stable Diffusion с помощью библиотеки diffusers [2].

+21

smile_artem 6 мая 2024 в 11:56

Точное увеличение растровых изображений

Средний

10 мин

7.2K

Визуализация данных * Математика * Обработка изображений * Алгоритмы * Иконки *

Аналитика

Как красиво в фильмах увеличивают изображения с дешёвой видеокамеры, да так, что чётко видно лицо в отражении зрачка человека, находящегося за километр. Я тоже так хочу. А что мы имеем по факту? На какой максимальный результат можно рассчитывать хотя бы теоретически? А оказывается можно сделать чуть лучше, чем размазню...

Увеличим апскейл до максимума!

+17

1 2 ...

11 12

14 15 ...

120 121

Обработка изображений *

Как устроены 4.6-битные сети: обучение

ИИ Яндекс пытается переплюнуть Тинькофф?

Глубокое обучение для деформируемой регистрации медицинских изображений

Сравнение сервисов для анализа документов AWS Textract, Azure Document Intelligence и Ripper Service от Технологики

Ваш путеводитель по дипфейкам: осведомлён — значит вооружён

В листах правды нет: как вузам быстро и безопасно ввести данные абитуриентов?

Умная стройка как (микро)сервис: следим за возведением зданий

Максимально точное увеличение разрешения изображений: билинейная аппроксимация

Как обезопасить себя при приеме на работу мигрантов, чтобы не получить штраф или дисквалификацию

ML в OCR: зачем и как

Tech4Art: как дроны и VR помогают рисовать граффити и муралы

“Семь раз отмерь, один раз сшей” или совмещение 3D изображений в компьютерной томографии

Как мы собираем данные для обучения Kandinsky

Ближайшие события

Kandinsky Video 1.1: обновленная модель генерации видео

Чем новый ChatGPT-4o отличается от GPT-4, что умеет и почему это супер-важно

Delta-Rle-Huffman (DRH) Texture Format

Магия музеев или что могут технологии

Копаемся в встроенном приложении камеры старого Xiaomi. Часть 2

Архитектура Stable Diffusion: Face ID, Lighting

Точное увеличение растровых изображений

Вклад авторов