Как стать автором
Обновить
43.33

Обработка изображений *

Работаем с фото и видео

Сначала показывать
Порог рейтинга
Уровень сложности

Как создавать шаг за шагом свою метавселенную с бренд-персонажем и зачем это нужно

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров407

В последнее время все больше популярности набирают метавселенные. Когда подключаешься через очки виртуальный реальности не просто где-то на берегу моря к фильму, в котором можешь вращать головой, раскачиваясь в той реальности на большой качели, взлетая выше неба над небоскребами.

Еще лет 100 назад нам бы сказали в ответ на наше желание создать из нуля целый мир... "Опомнитесь, что за бред... Евреи лишены постоянной территории, разве им хорошо? Если надо – добивайтесь статуса правителя государства, пробейтесь в гос. думу, это все реально... Что за персонажи, что за..." И вот уже мы входим в эпоху, когда в блокчейне TON окончательно популяризуют мемкоины и выдуманных персонажей, а ВК, при поддержке ИНТЦ Сириус, ставят на побережье в Адлере собачек и других героев социальной сети, которые раньше казались только развлечением.

Нормальные люди прошлого не будут как фанаты стремиться к каким-то фанатам, идеализированным героям, но мы не такие. Вселенная Marvel, DC... Если раньше за счет науки мы, люди, развеивали мифы о Богах, обосновывали физические явления аксиомами и опытным путем, а не догмами, то современный тренд – это то же продолжение постклассической философии, когда не важно, каким путем придешь к истине. В этом мире если не существует чего-то или оно не доказано, найдется как минимум 2-3 возможности доказать теорию, что это-таки существует и возможно, как и придумать альтернативные законы, по аналогии с неевклидовой геометрией, которая создана уже давно.

Современного же человека с детства учат удивляться чему-то неизведанному, в мультиках появляется все больше магии и волшебства, которое затем, оказывается, вполне дополняется огненными шоу, фокусами, но в компьютерной среде человек погружается в целую вселенную онлайн-игр и продуктов, где важно, насколько сильно и глубоко продуман образ. Люди приучены реагировать на бренды, но это породило целый новый ход человеческого времени, где многим уже не так интересно смотреть на реальных людей с их неидеальностями и проблемами. Привлекательнее, когда уже считаешь, что многое видел в этом мире, наблюдать за чем-то, чего 100 лет еще подавно не было. За жизнью вымышленных персонажей, за историями успеха, когда в каждой сториз показано, как зарабатываются большие деньги или человек учится чему-то очень сложному. Кажется, сейчас людям стало уже все равно, наблюдать ли им за реальными блогерами, или за искусственно созданными мультипликационными персонажами. Еще 5 лет назад очень популярным был тренд геймификации, когда даже рабочие серьезные процессы пробовали представить в виде компьютерных игр.

Читать далее
Всего голосов 2: ↑0 и ↓2-2
Комментарии4

Новости

Апдейтить или нет: нужно ли брать новую ML-модель?

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров2.2K

Бывала у вас такая ситуация. Выходит новая нейронная сеть и все руководство начинает требовать внедрить её? Половина коллег восторженно рассказывает о новом слое который позволил повысить точность сети? YoloV(N+1)? LLAMA100?

Читать далее
Всего голосов 15: ↑13 и ↓2+14
Комментарии16

Атрибутивное распознавание документов

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров2.6K

Многие компании, несмотря на переход на электронный документооборот, всё равно сталкиваются с задачами автоматизации ввода информации с бумажных документов. Все они хотят избавиться от этой рутинной операции, и внедряют системы атрибутивного распознавания. На практике, часто оказывается, что такие системы не всегда соответствуют ожиданиям. Сегодня хочу обсудить подходы к решению задачи атрибутивного распознавания, а также проблемы с которыми я сталкивался за 10 лет практики в этой области. 

Многие забывают, что само распознавание документов не является конечной целью. Главная задача - это сократить человеческие трудозатраты на ввод информации с бумажных документов. т.е. в теории, если производительность человека на ввод информации магическим образом вырастет, то и распознавать ничего не надо.  Скорее всего, для этой магии нам конечно понадобится распознавание, но это лишь один из инструментов. 

Так как же сократить трудозатраты?
Всего голосов 1: ↑1 и ↓0+3
Комментарии2

Конкурс «Беспилотный трамвай против водителя» глазами разработчика

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров2.2K

Ежегодно в Горэлектротрансе и раз в два года по всей России проводятся соревнования по профессиональному мастерству водителей трамвая. Надо сказать, что соревнования эти достаточно непростые, потому что для участия в них нужно целый год ездить без нарушений, не иметь ни одного случая ДТП и фактически войти в тройку лучших водителей своего парка. Следующий этап - лучшие три человека с каждого парка состязаются с представителями других парков уже на общегородском уровне. Общее количество участников финала - 18 человек. Такой вот непростой многоступенчатый отбор на пути к вершине и званию лучшего вагоновожатого-2024.

Сами испытания состоят из нескольких этапов:
• Оценка теоретических знаний правил дорожного движения;
• Оценка теоретических знаний правил приемки трамвая;
• Оценка практических навыков по управлению трамваем на этапе по скоростному вождению;
• Оценка практических навыков по управлению трамваем “на плавность и комфортность вождения”.

Нас (компанию Cognitive Pilot) тоже попросили поучаствовать в данном мероприятии, поскольку мы разрабатываем системы помощи водителю трамвая, которые эксплуатируются в петербургском Горэлектротрансе. Сегодня уже более 200 умных трамваев с нашей системой перевозят в Санкт-Петербурге по 60 тысяч человек ежедневно.

Соревнования проводились на второй площадке Трамвайного парка №5 на улице Шаврова. Трасса в целом была типовой и состояла из нескольких пунктов: начало движения, остановка, зона ограничения скорости, стрелка, экстренная остановка на рандомно включающийся светофор (при втором проезде без него), внезапное появление человека (на втором круге) и финиш.

Все пункты, имеющие четкое назначение, должны сопровождаться определенными действиями и командами от водителя. Также учитывается точность позиционирования трамвая (дальше на фото на земле видны щиты с зонами - белой, красной и зеленой). По результатам работы на каждом пункте выставляются баллы.

Читать далее
Всего голосов 21: ↑21 и ↓0+28
Комментарии13

Истории

Как устроены 4.6-битные сети: обучение

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров1.2K

Мы уже писали о том, что предложили новую модель квантования нейронных сетей, позволяющую ускорить их на 40% на центральных процессорах, а также о том, как она устроена тут. Сегодня мы расскажем о том, как мы в Smart Engines обучали 4.6-битные сети.

Читать далее
Всего голосов 4: ↑4 и ↓0+5
Комментарии0

ЦВЕТА белиссимо

Уровень сложностиСредний
Время на прочтение2 мин
Количество просмотров2.4K
Ultra HD издания фильмов с HDR цветом содержат гораздо больше информации о цветах, чем может отобразить обычный монитор. Но из него можно сделать более красочное видео и при этом воспроизводимое на обычных мониторах.

Вот цвета обычные

и колор


Читать дальше →
Всего голосов 12: ↑11 и ↓1+14
Комментарии18

ИИ Яндекс пытается переплюнуть Тинькофф?

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров8.7K

В своё время читал, как голосовой консультант "Олег" от компании Тинькофф рекомендовал пользователю совершить 'Роскомнадзор' в качестве решения проблемы.
Думал - шутка.

Недавно решил потрогать Яндекс360 в варианте Премиум. В ответ Yandex решил потрогать меня сделать мне приятное своими нейросетевыми алгоритмами, о чём известил меня ненавязчивым пушем - Цветочное настроение.
Миниатюра фото уже намекает, да?

Хватит ли Диска для всех букетов...
Всего голосов 45: ↑29 и ↓16+19
Комментарии14

Глубокое обучение для деформируемой регистрации медицинских изображений

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров765

В этой статье я расскажу о применении регистрации изображений в медицине, а также рассмотрю современные подходы к решению этой задачи.

Читать далее
Всего голосов 3: ↑2 и ↓1+1
Комментарии2

Сравнение сервисов для анализа документов AWS Textract, Azure Document Intelligence и Ripper Service от Технологики

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров539

Бизнес все чаще и чаще предпочитают отдать искусственному интеллекту извлечение данных из документов: при таком подходе меньше ошибок и выше скорость обработки документов. И все чаще звучит вопрос — каким решением пользоваться и к какому подрядчику пойти за оказанием услуги?

Поэтому мы сделали сравнительный обзор двух популярных решений от лидеров рынка по обработке документов — AWS Textract, Microsoft Azure Document Intelligence и собственного решения Ripper Service. Сравнивали решения по нескольким основаниям: по производительности, по результатам извлечения значений из форм, а также по стоимости.

Надеемся, что данная статья будет полезна руководителям компаний, которые уже задумались о применении ИИ для массовой обработки документов.

Читать далее
Всего голосов 3: ↑2 и ↓1+3
Комментарии1

Ваш путеводитель по дипфейкам: осведомлён — значит вооружён

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров4.6K

Даже если вы не знаете, что такое дипфейки, вы наверняка с ними сталкивались. Хотя изменённые и поддельные медиа не являются чем-то новым, дипфейки выводят их на совершенно новый уровень, используя искусственный интеллект для создания изображений, видео и аудио, которые кажутся реальными, но на самом деле таковыми не являются. Дипфейки (DeepFake) — это синтетические медиа, в которых человек на существующем изображении, видео или записи заменяется чьим-либо подобием. Технология DeepFake представляет собой одно из самых интригующих и противоречивых достижений в сфере ИИ. Поскольку дипфейки становятся всё доступнее, а их качество растёт, они создают серьёзные проблемы и в то же время дают новые возможности развития в различных сферах жизни человека.

Читать далее
Всего голосов 11: ↑11 и ↓0+16
Комментарии3

В листах правды нет: как вузам быстро и безопасно ввести данные абитуриентов?

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров717

Через неделю вузы начнут принимать документы абитуриентов на все формы обучения. Собрать и направить все необходимые бумаги в институты для будущих студентов – тот еще челлендж. Таким же малоприятным является процесс обработки этих документов и для сотрудников приемных комиссий, которым – когда абитуриенты выстроятся в очереди с оригиналами документов – придется перелопатить кипы бумаг.

Мы в Smart Engines нашли способ, как ускорить и упростить этот процесс для всех его участников. 

Читать далее
Всего голосов 4: ↑3 и ↓1+3
Комментарии1

Умная стройка как (микро)сервис: следим за возведением зданий

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров1.7K

В России наблюдается интерес к комплексным системам автоматизации строительства, но их внедрение — долгий и сложный процесс. Поэтому чаще застройщики предпочитают точечные решения. Появился спрос на специализированные нейросетевые микросервисы для подключения к готовым системам заказчика. 

Мы отметили эту тенденцию после одного примечательного проекта по мониторингу процесса строительства. Фактически сначала нас попросили сделать «‎то, не знаю что»‎, причем в очень сжатые сроки. Ситуация могла обернуться провалом, но мы справились и нашли новую перспективную нишу для разработки новых продуктов. Сейчас расскажу, как это было.

Читать далее
Всего голосов 13: ↑13 и ↓0+14
Комментарии1

Максимально точное увеличение разрешения изображений: билинейная аппроксимация

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров4.8K

В этом выпуске: улучшение билинейной интерполяции, второй этап сравнения методов апскейлинга с точки зрения наименьшей ошибки, как применять шейдеры к отдельным изображениям, как уменьшить звон на изображении и многое другое...

Продолжаем увеличивать апскейл...
Всего голосов 17: ↑17 и ↓0+20
Комментарии19

Ближайшие события

Как обезопасить себя при приеме на работу мигрантов, чтобы не получить штраф или дисквалификацию

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров1.2K

Для компаний трудоустройство сотрудника из‑за рубежа — не самая простая процедура. К тому же она сопровождается риском найма нелегальных мигрантов, что может аукнуться работодателю многотысячными штрафами и другими неприятным последствиям. Как избежать таких проблем при оформлении иностранного гражданина? И причем тут искусственный интеллект? Разбираемся в статье.

Читать далее
Всего голосов 6: ↑3 и ↓3+3
Комментарии12

ML в OCR: зачем и как

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров2K

Привет, меня зовут Георгий Гончаров, я инженер‑консультант OCR‑платформы SOICA, предназначенной для распознавания и обработки текстовых и графических данных. Поскольку это собственная разработка, то мы постоянно внедряем новые фичи. Недавно появилась еще одна — мы назвали ее ML‑локатор. В статье расскажу, почему и как мы реализовали эту функциональность и каких результатов удалось достичь.

Читать далее
Всего голосов 6: ↑5 и ↓1+4
Комментарии11

Tech4Art: как дроны и VR помогают рисовать граффити и муралы

Время на прочтение10 мин
Количество просмотров1.7K

Привет, Хабр! Меня зовут Миша Most, я художник, который начинал как граффити-райтер. Сегодня расскажу о том, как технологии помогают нам, представителям искусства, творить, создавая необычные проекты. Сначала — немного о своих работах, которые находятся на стыке искусства и технологий. А потом вместе с моим коллегой расскажу о самих технологиях.

В статье кроме информации о моем творчестве немало технических подробностей, которые помогают понять, как работает симбиоз современного искусства и технологий. Всё самое интересное — под катом.

Этот пост — переработанная версия доклада с True Tech Day 2.0.

Читать далее
Всего голосов 9: ↑9 и ↓0+16
Комментарии4

“Семь раз отмерь, один раз сшей” или совмещение 3D изображений в компьютерной томографии

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров647

Привет, Хабр! 

Мудрая пословица гласит: «Семь раз отмерь, один – отрежь». Эта пословица применима и к томографии, так как в случае проведения томографических экспериментов при классическом подходе для каждого объекта составляется сначала план измерений, а потом уже выполняются сами измерения. Если объект протяженный или помещается в поле вида детектора впритык, то часто принимается решение сделать два измерения: верхней части объекта и нижней. В этом случае в программе обработки данных томографических измерений необходима дополнительная функциональность, а именно, совмещение и сшивка трехмерных изображений. О том, как мы добавили такую функциональность в Smart Tomo Engine, наш продукт для томографической реконструкции и анализа, мы расскажем в сегодняшней статье.

Читать далее
Всего голосов 4: ↑4 и ↓0+5
Комментарии0

Как мы собираем данные для обучения Kandinsky

Уровень сложностиСложный
Время на прочтение14 мин
Количество просмотров2.4K

Всем привет! Наша команда в Sber AI занимается генеративными моделями и сегодня мы расскажем про очень важный этап разработки моделей для генерации фотореалистичных изображений и видео — процесс сбора и фильтрации данных. Про этот этап очень редко подробно рассказывают разработчики и исследователи таких известных генеративных моделей как DALL-E 3, Stable Diffusion, MidJourney или SORA. Генеративные модели уже многих впечатлили своими возможностями создавать максимально реалистичные изображения и видеоролики, а качественные данные — далеко не последняя причина, по которой такого качества генераций удалось достичь.

Читать далее
Всего голосов 18: ↑17 и ↓1+20
Комментарии0

Kandinsky Video 1.1: обновленная модель генерации видео

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров3.7K

В ноябре прошлого года наша команда представила свою первую разработку в области генерации видео по тексту – модель Kandinsky Video, основанную на модели генерации изображений Kandinsky 3.0, по которой мы недавно выпустили обновление – версию 3.1 (о чем можно почитать здесь). Первая видеомодель уже обладала весьма достойным качеством, сравнимым с лучшими мировыми решениями на тот момент. Нам удалось прокачать скорость генерации и моделирование динамики, но главное – мы вступили в новую для себя область генеративного искусственного интеллекта и быстро достигли в ней заметных результатов. Тогда, полгода назад, о подобных моделях знали в основном лишь те, кто так или иначе интересуется областью генеративного искусственного интеллекта. Сегодня же ситуация изменилась – благодаря значительному росту качества генерации видео за последний период, о существовании подобных моделей не слышал только ленивый. Разумеется, такой вход новых технологий в нашу жизнь стал возможным именно благодаря тем исследованиям, которые сообщество проводило за последние полтора года и в которые исследователи из нашей команды включились практически сразу.

Сегодня мы представляем следующую версию нашей модели генерации видео по тексту – Kandinsky Video 1.1. Мы учли последние тенденции в области разработок видеомоделей и сделали нашу технологию еще более впечатляющей, проведя собственные исследования в области архитектур, обработки данных и замере показателей качества, которые мы опишем ниже.

Читать далее
Всего голосов 24: ↑24 и ↓0+35
Комментарии7

Чем новый ChatGPT-4o отличается от GPT-4, что умеет и почему это супер-важно

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров55K

В середине мая компания OpenAI представила новую версию самой популярной и хайповой нейросети в мире. Продукт получил название ChatGPT-4o, сохранив порядковый номер своего предшественника. Несмотря на это, чат-бот не только стал быстрее обрабатывать информацию, но и получил поддержку мультимодальности, и это буквально все изменило.

Читать далее
Всего голосов 25: ↑14 и ↓11+9
Комментарии119
1
23 ...

Вклад авторов