Все потоки
Поиск
Написать публикацию
Обновить
51.18

Обработка изображений *

Работаем с фото и видео

Сначала показывать
Порог рейтинга
Уровень сложности

Кто продаёт спутниковые фотографии и сколько они стоят

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров28K


Статья содержит ответы на ряд популярных вопросов, о возможности строительства и запуска космических спутников, способах и стоимости заказа космической фотосъёмки и о ресурсах, на которых можно найти бесплатные спутниковые фото, а также о том, какую пользу приносит использование спутниковых фото в разных сферах жизни.
Читать дальше →

Астрономическая «рыбалка»

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров4.9K

Вы когда-нибудь слышали о астрофотографии? Несложно догадаться, что речь сейчас пойдет о фотографии и астрономии.

Астрофотография - вид фотографии в котором предметом съемки являются различные астрономические объекты, такие как: планеты солнечной системы, шаровые и рассеянные звездные скопления, двойные звезды, туманности, и конечно же Солнце с Луной. Исходя из методики съемки и обработки материала, можно выделить два основных направления в астрофотографии: лунно-планетное (lunar/planetary imaging), и фотография объектов дальнего космоса (deepsky imaging).

Именно о своем опыте в лунно-планетном фото я и хочу вам рассказать. Все фотографии которые вы увидите в статье, получены мной с использованием любительских телескопов.

Читать далее

Автоматическое построение плоской панорамы

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров7.8K

В статье представлен простой алгоритм автоматического сшивания нескольких фотографий в плоское (иногда называют перспективное) панорамное изображение (planar/perspective panoramic image). Статья содержит код на языкеPythonс использованием библиотекиOpenCV.

Читать далее

«Иной путь» Джона Кармака к общему искусственному интеллекту. Часть 1

Время на прочтение6 мин
Количество просмотров4.1K

Культовый разработчик игр, ракетный и VR инженер Джон Кармак переключился на новое амбициозное испытание: разработку общего искусственного интеллекта — формы искусственного интеллекта, которая выйдет за рамки имитации человеческого интеллекта и перейдёт к пониманию сути явлений и решению проблем. Кармак считает что к 2030 году есть 60% шанс достижения начального успеха в разработке общего искусственного интеллекта (ОИИ). В этом интервью вы узнаете о том, как и почему он работает независимо, над тем чтобы это случилось.

Читать далее

Savant: новый высокопроизводительный фреймворк Python для видеоаналитики на оборудовании Nvidia

Уровень сложностиСредний
Время на прочтение22 мин
Количество просмотров5.2K

В статье рассматривается новый открытый фреймворк для потоковой видеоаналитики и демонстрируются его возможности на примере демонстрационного приложения, которое использует модель DeepStream’s PeopleNet для обнаружения людей и их лиц, размывает лица и отображает панель управления с помощью OpenCV CUDA.

Мы будем использовать Savant для обработки видео в реальном времени с протоколом RTSP и для обработки видеофайлов в пакетном режиме, чтобы продемонстрировать, как конвейер может достигать скорости 400 кадров в секунду на Nvidia Tesla T4.

Для тех, кто хочет сначала попробовать без подробностей, мы подготовили скрипты для быстрого старта на основе Docker Compose (раздел "Быстрый старт").

Savant на GitHub: https://github.com/insight-platform/Savant

Читать далее

Обзор современных автономных технологий в России

Время на прочтение2 мин
Количество просмотров2.5K

Автономные технологии становятся все более актуальными в современном мире, и Россия не остается в стороне от этого процесса. В этой статье мы рассмотрим успешные примеры автономных технологий в России, среди которых проекты компании «Яндекс» в Иннополисе и дроны НТР Томск, демонстрирующие инновационный подход и значительный потенциал для дальнейшего развития.

Читать далее

Как видит нейросеть от Сбера одно из страшных заболеваний лица

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров5.9K

Для начала небольшое вступление - описание болезни. "Страшное" заболевание название которому Гемифациальный спазм, также известное как – тиковые судороги. Представляет собой состояние, которое вызывает «тики» или мышечные спазмы на одной стороне лица. Эти тики безболезненны, хотя и могут доставлять дискомфорт, но как правило, не опасны для жизни. Однако по мере ухудшения состояния больного, тики могут становиться все более частыми и мешать привычному образу жизни. 

Наверное вам доводилось видеть людей страдающих "тиками". Согласитесь, что выглядит это мягко говоря не очень. Особенно когда тики и подергивания в области лица интенсивные, прямо пробирает до мурашек и хочется отвести взгляд куда подальше.

Читать далее

Гонка по развитию ИИ вышла из-под контроля и настолько же опасна, как и Манхэттенский проект

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров5.4K

Подобно созданию атомной бомбы  искусственный интеллект изменит всё - проблема в том, что мы не знаем как.

Автор оригинала: Dan Snow

Читать далее

Segment Anything: создание первой базисной модели для сегментации изображений

Время на прочтение9 мин
Количество просмотров6.2K

Сегментация, то есть распознавание пикселей изображения, принадлежащих объекту — базовая задача компьютерного зрения, используемая в широком спектре применений, от анализа научных снимков до редактирования фотографий. Однако для создания точной модели сегментации под конкретные задачи обычно требуется высокоспециализированный труд технических экспертов, имеющих доступ к инфраструктуре обучения ИИ и большим объёмам тщательно аннотированных данных, относящихся к предметной области.

Наша лаборатория Meta AI* стремится сделать сегментацию более доступной, основав проект Segment Anything: новую задачу, датасет и модель для сегментации изображений (подробности см. в нашей исследовательской статье). Мы публикуем нашу Segment Anything Model (SAM) и датасет масок Segment Anything 1-Billion mask dataset (SA-1B) (крупнейший в мире датасет сегментации), чтобы их можно было использовать во множестве разных областей и стимулировать дальнейшие исследования базисных моделей компьютерного зрения. Мы открываем доступ к датасету SA-1B, позволяя использовать его в исследовательских целях; модель Segment Anything Model доступна по открытой лицензии (Apache 2.0). Вы можете протестировать демо SAM со своими собственными изображениями.

* Принадлежит корпорации Meta Platforms, которая признана экстремистской организацией, её деятельность в России запрещена.
Читать дальше →

Астрологи объявили неделю нейроарта на Хабре

Время на прочтение5 мин
Количество просмотров26K

Однажды весною, в час небывалого жаркого заката, на Хабре объявили конкурс, посвящённый технологиям искусственного интеллекта. В Сезоне Data Mining мы собрали статьи об обработке больших данных. Из Сезона ML узнали, как работают нейросети и с чем их готовить. В разработке ещё один Сезон на эту тему. Мы решили передохнуть и объявляем неделю нейроарта. Участвовать может любой автор, который опубликует статью с 4 по 14 апреля 2023 года и добавит на картинку в ленте изображение от Kandinsky 2.1. Подробности под катом.

Читать далее

Как не заменить фару сосиской: определение качества изображений в сервисе оценки технического состояния автомобиля

Уровень сложностиСредний
Время на прочтение19 мин
Количество просмотров3K

В научно‑популярных статьях и докладах, обучающих материалах по системам компьютерного зрения упор нередко делается на основную компоненту — тяжелые (или не очень) нейронные сети, которые неким волшебным образом обрабатывают картинку, и на выходе отдают результат.

Однако каждый ли вход в сеть стоит обрабатывать? Обучающие датасеты заранее подобраны и размечены, мусора и шума там чаще всего относительно мало, чего нельзя сказать о данных на входе в реально работающие системы. Особенно если данные загружаются обычными пользователями.

Мы не можем гарантировать, что сеть корректно обработает любой вход. Да, есть способы оценить, насколько модель уверена в своем ответе, но уже после обработки входа, когда мы потратили вычислительные ресурсы. Можем ли мы сказать заранее, что корректно обработать изображение не получится, что оно скорее всего не содержит достаточно информации? Давайте попробуем разобраться на примере реальной задачи.

Читать далее

Kandinsky 2.1, или Когда +0,1 значит очень много

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров84K

В ноябре 2022 года мы выпустили свою первую диффузионную модель для синтеза изображений по текстовым описаниям Kandinsky 2.0, которая собрала как позитивные, так и отрицательные отклики. Её ключевой особенностью была мультиязычность и использование двойного текстового энкодера на входе сети: XLMR-clip и mT5-small. Рефлексия после релиза подтолкнула нас к перестройке планов по развитию архитектуры и к сильному стремлению получить буст в качестве генераций, чтобы выйти на уровень аналогичных решений, названия которых слишком хорошо известны, чтобы их называть. В то же время мы могли наблюдать за появлением новых генеративных моделей и их файнтюнов, таких как ControlNet, GigaGAN, GLIGEN, Instruct Pix2Pix и др. В этих работах представлены и новые взгляды на генерацию, и новые возможности использования латентного пространства для внесения контролируемых изменений через текстовые промты, а также для смешивания изображений — возможности использования генеративных моделей расширяются постоянно. Бурное развитие прикладных кейсов привело к интенсивно нарастающему числу различных привлекательных для пользователей реализаций этих функций — визуализация городов, изображения известных личностей в нетипичных ситуациях и многие другие.

Читать далее

Пять причин, по которым вам нужны синтетические данные

Время на прочтение6 мин
Количество просмотров2.9K
Сбор и разметка данных в реальном мире может быть длительным и дорогостоящим занятием. Кроме того, у этих данных могут быть проблемы с качеством, разнообразием и количеством. К счастью, подобные проблемы можно решать при помощи синтетических данных.


Для обучения модели машинного обучения нужны данные. Задачи data science обычно непохожи на соревнования Kaggle, где у вас есть отличный крупный датасет с готовой разметкой. Иногда приходится собирать, упорядочивать и очищать данные самостоятельно. Такой процесс сбора и разметки данных в реальном мире может быть долгим, неудобным, неточным, а иногда и опасным. Более того, в конце этого процесса может оказаться, что полученные в реальном мире данные не соответствуют вашим требованиям с точки зрения качества, разнообразия (например, дисбаланс классов) и количества.
Читать дальше →

Ближайшие события

Можно ли привить кибериммунитет роботу? Практическое исследование на примере DIY робота официанта

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров2.3K

Иногда, устроившись на мягком пуфике с книжкой, так и хочется скосплеить Громозеку из мультфильма Тайна третьей планеты, и сказать “Официант, 400 капель яблочного сока и печеньку”. Статья описывает результаты работ по разработке DIY робота-официанта на базе Alpahabot, а также эксперимента по прививке роботу киберимунитета при помощи KasperskyOS CE.

Читать далее

Определение внимания водителей за рулем — реализация прототипов

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров3.3K

Задача контроля водителя очень актуальна в наше время. Должный контроль за состоянием водителей поможет сохранить здоровье автолюбителей, избежать многих дорожно-транспортных происшествий, тем самым снизив количество человеческих жертв. 

В конце 2022 года нашей команде поступил запрос на решение данной задачи. Было необходимо предложить подходы, используя которые можно понять, насколько устал водитель, занят ли он какими-либо посторонними делами за рулем, куда он смотрит при выполнении маневров, открыты ли у него глаза (не спит ли он) и т.д.

После продолжительного изучения существующих исследований в данной области, было принято решение начать работу с разработки следующих прототипов.

Читать далее

Хайп с нейросетями на ТВ. «СвоёТВ» и чужие технологии

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров3.9K

Большое количество профильных и новостных телеграмм каналов, крупные СМИ опубликовали прогноз погоды из Ставрополья, созданный нейросетями.

Читать далее

ML-подходы по поиску похожих изображений

Уровень сложностиСредний
Время на прочтение16 мин
Количество просмотров13K

Привет, Хабр!

Меня зовут Паймеров Владимир, я Data Scientist и участник профессионального сообщества NTA.

Компьютерное зрение (computer vision, CV) — активно развивающаяся научная область,
связанная с анализом изображений и видео. В последнее время данному направлению
уделяется большое внимание, так как CV позволяет решать множество задач, таких как
детекцию объектов, классификацию изображений, распознавание лиц и т. д., которые
в свою очередь применяются в разных сферах жизни от мобильных приложений для
наложения масок на лицо во время звонка до построения систем безопасности,
поиска преступников и мошенников. Сейчас есть инструменты, позволяющие
хранить большой объем данных и обрабатывать изображения, поэтому появилось
множество инструментов для решения различных задач. Об одной из таких задач
будет рассказано в данном посте.

Читать далее

Многоклассовая детекция клеток рака почки: нейросетевой ассистент врача-патоморфолога

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров2.2K

Всем привет, меня зовут Арсений, я студент 2 курса магистратуры Сеченовского университета по специальности "Наноматериал и биофотоника”. В октябре прошлого года я занял первое место во всероссийском межвузовском конкурсе “Samsung Innovation Campus” со своим проектом “Многоклассовая детекция ядер светло-клеточного почечно-клеточного рака” и хотел бы поделиться подробностями.

Читать далее

YOLOv7 для определения поз людей на видео

Уровень сложностиСредний
Время на прочтение16 мин
Количество просмотров12K

Привет, Хабр!

С вами Максим Алёшин, Data Scientist и участник профессионального сообщества NTA.

В этом посте мы познакомимся с возможностями YOLOv7 для определения поз людей на видео, обсудим принцип работы алгоритма, разберёмся, чем принципиально отличается подход к детекции скелетов человека в модели YOLOv7 и других фреймворках, подробно пройдёмся по всем шагам запуска на инференс предобученной модели YOLOv7-pose для детекции людей с их скелетами.

В процессе копания в первоисточниках и не только, мне удалось почерпнуть несколько интересных фактов о YOLO, чем я поделюсь с читателями. Некоторые труднопереводимые термины будут оставаться как есть.

Узнать больше

Andrej Karpathy: глубокие нейросети 33 года назад и 33 года спустя

Время на прочтение10 мин
Количество просмотров6.9K

На мой взгляд, статья Янна Лекуна с соавторами Backpropagation Applied to Handwritten Zip Code Recognition (1989 год) имеет определённую историческую ценность, поскольку, насколько мне известно, это первое реальное применение нейронной сети, от начала до конца обученной при помощи обратного распространения (backpropagation). Если не учитывать крошечный датасет (7291 изображений цифр в градациях серого размером 16x16) и крошечный размер использованной нейронной сети (всего тысяча нейронов), эта статья спустя 33 года ощущается вполне современной — в ней описана структура датасета, архитектура нейронной сети, функция потерь, оптимизация и приведены отчёты об величинах экспериментальных ошибок классификации для обучающего и тестового датасетов. Всё это очень узнаваемо и воспринимается как современная статья о глубоком обучении, только написанная 33 года назад. Я решил воспроизвести эту статью 1) для развлечения, а ещё 2) чтобы использовать это упражнение как исследование природы прогресса глубокого обучения.
Читать дальше →

Вклад авторов