Все потоки
Поиск
Написать публикацию
Обновить
50.55

Обработка изображений *

Работаем с фото и видео

Сначала показывать
Порог рейтинга
Уровень сложности

«Человек. Собака. Человек с собакой». Как искусственный интеллект понимает, что жизни школьников в опасности

Время на прочтение3 мин
Количество просмотров1.6K

В новостях Казани регулярно появляются заголовки о том, что бродячие, беспризорные собаки нападают на людей. Пугают сообщения о том, что школьнику прокусили щеку, на детей напала собака прямо на детской площадке, ребятам из группы школьников прокусили ногу и разорвали куртку… Осенью прошлого года замглавы исполкома Казани Искандер Гиниятуллин сообщал, что в столице Татарстана находится 4 900 животных, подлежащих отлову и стерилизации. Очевидно, что кроме этих мер требуются и другие. Команда исследований в области искусственного интеллекта Центра цифровой трансформации Республики Татарстан (ЦЦТ РТ) в начале года вплотную занялась вопросом.

Как именно - рассказываем в статье.

Читать далее

Как мы искали самый точный метод детектирования ключевых точек

Время на прочтение7 мин
Количество просмотров5.4K

Найдутся ли среди новых методов конкуренты старому доброму SIFT?

Читать далее

Сборка OpenCV с поддержкой OpenVINO

Уровень сложностиСредний
Время на прочтение3 мин
Количество просмотров3.4K

В статье мы соберём OpenCV с поддержкой OpenVINO, а также узнаем отличия в скорости инференса модели машинного зрения на C++ и Python при прочих равных.

Читать далее

О работе с персональными данными в «Ситимобил» спустя 2.5 месяца после утечки – взгляд пользователя

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров4.9K

В этой статье будет рассмотренно продолжение известной по прошлому году истории о подходе к обработке персданных в «Ситимобил». Напомню, 23 декабря 2022 года стало известно об утечке данных водителей «Ситимобил». Компания признала факт утечки, уведомила Роскомнадзор, принесла извинения водителям и заявила о проведении внутреннего расследования. Среди многочисленных утечек (а всего по данным Роскомнадзора в 2022 было зафиксировано порядка 150 крупных утечек персональных данных) утечка у «Ситимобил» отличалась тем, что в открытый доступ попали не просто персданные, а изображения паспортов водителей.

На сегодняшний день информации о назначении штрафа компании еще нет. Но мне кажется, что при его назначении учтут, что в этой утечке были изображения паспортов и, как показано вот здесь изображения селфи водителей с паспортом одновременно. Не знаю можно ли фото, на котором есть и паспорт, и лицо крупным планом, классифицировать как биометрию, но очевидно, что с таким фото возможностей для нанесения ущерба водителю становится сильно больше.

В этой заметке я хочу показать свой взгляд пользователя на то, как происходит обработка изображений паспортов и персданных водителей в «Ситимобил» через 2.5 месяца после утечки.

Читать далее

Распознавание подачи в волейболе с помощью машинного обучения

Время на прочтение6 мин
Количество просмотров3.5K

Развитие искусственного интеллекта сейчас переживает бурный рост, и сфера его применения постоянно расширяется, проникая в области, ранее никак не связанные с ИТ.

Хорошим примером такой экспансии является спорт.

Не так давно появился термин Sport tech и количество проектов значительно выросло за последние несколько лет.

Волейбол — перспективное направление в спортивной аналитике. Один из самых массовых видов спорта, распространен в очень многих странах.

Итак, у нас есть видеозапись волейбольной игры. С какой целью она обычно делается? Возможно, чтобы показать друзьям или пересматривать лучшие моменты долгими зимними вечерами. Но наверное, в сыром виде, запись не очень годится для этого. Ведь скорее всего, первые минут десять игроки будут переодеваться и разминаться, а после каждого розыгрыша будет проходить минута‑другая, пока кто‑то сбегает за мячом.

В общем, мы подходим к очевидной цели — избавиться от всего скучного и оставить только самое интересное. Ок, стратегия ясна, переходим к тактике.

Для стороннего зрителя (которым конечно является искуственный интеллект) есть несколько маркеров для привлечения внимания: игроки, мяч, судья, табло. Любой из этих объяектов может быть подвергнут аналитике. Но сегодня мы поговорим о мяче.

Связь зрительского интереса и мяча вполне очевидна: мяч летает — мы смотрим. Нет мяча — некуда смотреть. В общем, понятно, что нам надо вырезать все кадры, где мяч не летает и тогда это можно будет смотреть без зевоты.

Читать далее

Neural Network Optimization: океан в капле

Уровень сложностиПростой
Время на прочтение14 мин
Количество просмотров22K

Всех приветствую, меня зовут Антон Рябых, работаю в Doubletapp. Вместе с коллегой Данилом Гальпериным мы написали статью про важный этап в процессе обучения нейронных сетей и получения необходимых нам результатов —  оптимизацию модели. Зачем нужно оптимизировать модель, если и так все работает? Но как только вы начнете разворачивать модель на устройстве, которое будет ее обрабатывать, перед вами встанет множество проблем.

Более крупные модели занимают больше места для хранения, что затрудняет их распространение. Более крупные модели требуют больше времени для работы и могут потребовать более дорогого оборудования. Это особенно важно, если вы создаете модель для приложения, работающего в реальном времени.

Оптимизация моделей направлена на уменьшение размера моделей при минимизации потерь в точности и производительности.

Методы оптимизации

Pruning — устранение части параметров нейронной сети.
Quantization — уменьшение точности обрабатываемых типов данных.
Knowledge distillation — обновление топологии исходной модели до более эффективной, с уменьшенным количеством параметров и более быстрым выполнением.
Weight clustering — сокращение количества уникальных параметров в весах модели.
OpenVino, TensorRT — фреймворки, с помощью которых можно оптимизировать модели.

Читать далее

Синтетические данные для машинного обучения: их природа, типы и способы генерации

Время на прочтение14 мин
Количество просмотров13K

Данные — один из самых ценных в наше время ресурсов. Однако из-за затрат, конфиденциальности и времени обработки сбор реальных данных не всегда возможен. В таком случае для подготовки моделей машинного обучения хорошей альтернативой могут стать синтетические данные. В этой статье мы объясним, что такое синтетические данные, почему они используются и когда их лучше применять, какие существуют модели и инструменты генерации и какими способами можно задействовать синтетические данные.
Читать дальше →

Какого цвета атомы?

Время на прочтение18 мин
Количество просмотров8.1K

В этой статье мы обсудим какие бывают цветовые схемы для атомов, дальтонизм, цветовую модель RGB в контексте Python-а, ну и попробуем сделать собственную цветовую модель, которая, надеюсь, будет чуточку дружелюбнее к дальтоникам.

И да, это кликбейтный заголовок :)

Клюнуть на кликбейтный заголовок

AliveColors: Есть ли замена фотошопу на земле русской?

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров13K

Привет, Хабр! Сегодня мы поговорим о графическом редакторе AliveColors и попробуем разобраться, что за задачи он может решать. В этом посте мы коснемся вопроса, в каких ситуациях AliveColors может заменить безвременно покинувший наш рынок Adobe Photoshop, и почему его стоит рассмотреть в качестве интересного софта для самых разных ситуаций. Всех, кто пользовался AliveColors, а также страдает от отсутствия лицензионного фотошопа, приглашаем под кат и в комментарии.

Читать далее

Midjourney, BlueWillow, PLAYGROUND AI, Stable Diffusion, Leonardo AI — как пользоваться

Уровень сложностиСредний
Время на прочтение3 мин
Количество просмотров14K

Собрал в одно месте все самое нужное и популярное. Для тех, кто больше любит посмотреть, чем почитать, в конце прикрепил ссылку, где можно посмотреть ролики авторов, которые очень подробно обо всем рассказывают. Пользуйтесь на здоровье =)

prompt для этих ИИ будут фактически одинаковым, как и для других похожих сервисов.

Читать далее

Медицинские датасеты для машинного обучения: цели, типы и способы применения

Время на прочтение12 мин
Количество просмотров13K

Международная система здравоохранения ежедневно генерирует множество медицинских данных, которые (по крайней мере, теоретически) можно использовать для машинного обучения. В любой отрасли данные считаются ценным ресурсом, который помогает компаниям обгонять конкурентов, и здравоохранение не является исключением.

В этом посте мы вкратце рассмотрим сложности, с которыми приходится сталкиваться при работе с медицинскими данными, и сделаем обзор публичных медицинских датасетов, а также практических задач, которые они помогают выполнять.
Читать дальше →

Как я делал ChatGPT бота в Salebot и ничего не вышло

Время на прочтение4 мин
Количество просмотров8.6K

Данная статья описывает моё знакомство с ChatGPT на уровне API и интеграцию с платформой создания ботов Salebot.

Давно занимаюсь сборкой ботов в Salebot и на Python, и я не мог просто пройти мимо ChatGPT и её API (модель GPT 3). Но, во время изучения API, меня понесло дальше, невозможно было остановиться на GPT 3. Вот какие задачи я себе поставил.

Читать далее

Smart Tomo Engine 2.0. Выход на новый уровень

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров3K

В сегодняшней статье речь пойдет о Smart Tomo Engine 2.0  – новой версии нашего продукта реконструкции трехмерных объектов из набора их томографических проекций (рентгенограмм). По сравнению с предыдущей версией у новой выше качество получаемых изображений, существенно повышено быстродействие, улучшена технологическая совместимость с программами анализа трехмерных данных и с различными видами томографов. Заходите под кат, чтобы увидеть работу новой версии STE на примере реконструкции цветов (в честь Международного женского дня).

Читать далее

Ближайшие события

Чего не хватает в ChatGPT по опыту использования Stable Diffusion

Уровень сложностиСредний
Время на прочтение2 мин
Количество просмотров2.9K

Всем привет. Последний месяц я в составе сообщества поклонников одной компьютерной игры активно экспериментирую со stable diffusion. И на основе этого у меня сложилось впечатление, как можно было бы улучшить ChatGPT.

Во-первых, это богатство настроек. Поскольку SD это опен сорс, то там можно настроить буквально все что угодно - количество итераций, размер картинки, степень похожести картинки на другую картинку и так далее. Очень не хватает схожих настроек для чатгпт - например, отдельно указать тематику, размер желаемого текста, степень его подробностей и так далее.

Читать далее

Распознавание корпоративных документов: как не утонуть в море бумаг?

Время на прочтение7 мин
Количество просмотров3.3K

Мы подсчитали, что ручной ввод данных из типовых форм занимает 6–7 часов в день. Автономная система Smart Document Engine на смартфоне справляется с подобной задачей буквально за минуты. В этой статье мы расскажем о самых эффективных бизнес‑кейсах применения нашей мобильной OCR.

Читать далее

Вам звонит Том Круз: как разоблачить дипфейк во время видеозвонка

Время на прочтение14 мин
Количество просмотров8.1K

Взрывное распространение ИИ‑генеративных технологий затронуло и создание видеоконтента. Главным двигателем здесь стали дипфейки (DeepFake). В общем доступе появились десятки инструментов, вроде DeepFaceLab, Deepfakes Web или FaceSwap, которые позволяют изменять лица людей на видео, добиваясь пугающей натуралистичности.

Ранее мы уже разбирали, что представляет собой технология deepfake, какие потенциальные опасности несет, а также тестировали популярные инструменты для распознавания дипфейк‑изображений. Этим материалом мы продолжим интересную тематику и раскроем больше технологических деталей вывода «глубоких подделок» на чистую воду. На сей раз речь пойдет о real‑time или live‑дипфейках, способных в реальном времени подменять участников видеозвонков образами других людей. Также расскажем о критических уязвимостях «живых» дипфейков, которые можно эффективно использовать для их распознавания.

Читать далее

Взгляд компьютерным зрением на работу коммунальных служб

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров11K

С помощью обработки данных с уличных камер проанализируем характеристики движения пешеходов. Посмотрим как на их поведение влияет качество работы коммунальных служб. Узнаем насколько сильно замедляет передвижение гололед, и как много шагов нужно, чтобы это выяснить.

Пошагали

Руководство по аутсорсингу разметки данных для машинного обучения

Время на прочтение15 мин
Количество просмотров2.5K

Аннотирование и разметка сырых данных (изображений и видео) для моделей машинного обучения (ML) — это самая длительная и трудоёмкая, хотя и необходимая часть любого проекта компьютерного зрения.

Качественные результаты и точность работы команды аннотаторов непосредственно влияет на точность любой модели машинного обучения, вне зависимости от того, применяются ли к массивам данных изображений AI (искусственный интеллект) или алгоритм глубокого обучения.

Организации из различных сфер (здравоохранения, производства, спорта, ВПК, автоматизации и возобновляемой энергетики) используют модели машинного обучения и компьютерного зрения для решения задач, выявления паттернов и интерпретирования тенденций в массивах данных изображений и видео.

Любой проект компьютерного зрения начинается с разметки и аннотирования сырых данных командами аннотаторов; это огромные объёмы изображений и видео. Успешные результаты аннотирования гарантируют, что модель сможет «учиться» на этих данных обучения, решая задачи, поставленные перед ней организацией.

После формулирования задачи и целей проекта у организаций возникает непростой выбор перед этапом аннотирования: нужно ли отдавать эту работу на аутсорс, или выполнять аннотирование массивов данных изображений и видео собственными силами?
Читать дальше →

7 способов улучшения датасетов медицинских снимков для машинного обучения

Время на прочтение9 мин
Количество просмотров2.6K

Качество датасета медицинских снимков (как и датасетов изображений в любой другой области) напрямую влияет на точность модели машинного обучения.

В секторе здравоохранения это ещё более важно, ведь качество крупных массивов данных медицинских снимков для диагностического и медицинского AI (искусственного интеллекта) или моделей глубокого обучения может стать для пациентов вопросом жизни и смерти.

Как знают команды клинических исследователей, сложность, форматы и слои информации в медицине больше и затейливее, чем в немедицинских изображениях и видео. Отсюда и берётся необходимость в алгоритмах искусственного интеллекта, машинного обучения (ML) и глубокого обучения с целью понимания, интерпретации и обучения на аннотированных массивах данных медицинских снимков.

В этой статье мы расскажем о сложностях создания обучающих массивов данных из медицинских снимков и видео (особенно в сфере радиологии), а также поделимся рекомендациями по созданию обучающих массивов данных высочайшего качества.
Читать дальше →

Как найти похожие картинки

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров6K

Веб 2.0 — отличная штука. Сайты на самообслуживании. Пользователи наполняют их сами («постят контент», как сейчас выражаются). Сами напостили, сами посмеялись. А владелец сайта только платит за хостинг и стрижет купоны на рекламе. Удобно же.

Но жизнь наша так странно устроена, что плюсов без минусов не бывает, а нередко недостатки вообще являются продолжением достоинств. Есть проблемы и у самонаполняемых сайтов — баяны. В смысле, дубли.

Дубли многие посетители не любят, особенно старожилы, на зубок помнящие мемасики, появившиеся во времена превед‑медведа и олбанского йазыгга. Каждое их появление они встречают фырканьем и угрозами немедленно отписаться.

Что же делать? Конечно, призвать на помощью железную машину — пусть она сама ищет баяны.

Читать далее

Вклад авторов