Результаты поиска по запросу «[yolo]» / Хабр

Публикации Хабы Компании Пользователи Комментарии

Вышел Savant 0.2.7: фреймворк компьютерного зрения, оптимизированный для NVIDIA

4 мин

3.1K

Программирование*Алгоритмы*Машинное обучение*Разработка робототехники*Искусственный интеллект

7 февраля 2024 года наша команда выпустила очередную версию фреймворка Savant - 0.2.7. Релиз содержит несколько исправлений ошибок, четыре новых демонстрационных пайплайна и ряд улучшений, о которых будет написано далее.

worksolutions 2 авг 2021 в 17:38

Нейродайджест: главное из области машинного обучения за июль 2021

3 мин

5.7K

Python*Машинное обучение*Искусственный интеллектTensorFlow*

Новый язык программирования от Open AI, рост популярности диффузионных моделей, чат-бот с памятью не как у золотой рыбки — об этом и многом другом в июльском выпуске.

Перейти к обзору

kitaisky 13 сен 2021 в 15:24

Детекция объектов с помощью YOLOv5

2 мин

38K

Обработка изображений*Машинное обучение*

Туториал

Пошаговый туториал для детекции кастомных объектов на изображении.

honyaki 19 апр 2021 в 16:02

Распознавание маски на лице с помощью YOLOv3

9 мин

8.7K

Блог компании SkillfactoryРабота с видео*Python*Обработка изображений*Машинное обучение*

Туториал

Перевод

YOLO или You Only Look Once — это архитектура свёрточных нейронных сетей, которая используется для распознавания множественных объектов на изображении. В 2020, на фоне пандемии, задача детектирования объектов (object detection) на изображении стала как никогда актуальной. Специально к старту нового потока курса по Machine Learning и Deep Learning, делимся с вами полным пошаговым руководством для тех, кто хочет научиться распознавать объекты с помощью YOLO на разных данных. Предполагается, что вы уже знаете, как делать распознавание объектов с помощью методов глубокого обучения и, в частности, вы знаете основы YOLO, так что давайте погрузимся в нашу задачу.

gingermuffin 8 мая 2021 в 13:07

Обнаружение объектов с помощью YOLOv3 на Tensorflow 2.0

14 мин

39K

Python*Программирование*Машинное обучение*Искусственный интеллектTensorFlow*

Из песочницы

Перевод

До появления YOLO большинство способов обнаружения объектов пытались адаптировать классификаторы для детекции. В YOLO же, обнаружение объектов было сформулировано как задача регрессии на пространственно разделенных ограничивающих рамок (bounding boxes) и связанных с ними вероятностей классов.

В данной статье мы узнаем о системе YOLO Object Detection и как реализовать подобную систему в Tensorflow 2.0.

AlexeyAB 7 дек 2020 в 19:05

Scaled YOLO v4 самая лучшая нейронная сеть для обнаружения объектов на датасете MS COCO

6 мин

20K

Программирование*Обработка изображений*Машинное обучение*Искусственный интеллект

Научная статья
Pytorch: YOLOv4-CSP, YOLOv4-P5, YOLOv4-P6, YOLOv4-P7 (main repository — use to reproduce results)
YOLOv4-CSP
YOLOv4-tiny
YOLOv4-large
Darknet: YOLOv4-tiny, YOLOv4-CSP, YOLOv4x-MISH
Структура YOLOv4-CSP

Scaled YOLO v4 является самой лучшей нейронной сетью для обнаружения объектов — самой точной нейронной сетью (55.8% AP) на датасете Microsoft COCO среди всех опубликованных нейронных сетей на данный момент. А также является лучшей с точки зрения соотношения скорости к точности во всем диапазоне точности и скорости от 15 FPS до 1774 FPS. На данный момент это Top1 нейронная сеть для обнаружения объектов.

Scaled YOLO v4 обгоняет по точности нейронные сети:

Google EfficientDet D7x / DetectoRS or SpineNet-190 (self-trained on extra-data)
Amazon Cascade-RCNN ResNest200
Microsoft RepPoints v2
Facebook RetinaNet SpineNet-190

Мы показываем, что подходы YOLO и Cross-Stage-Partial (CSP) Network являются лучшими с точки зрения, как абсолютной точности, так и соотношения точности к скорости.

График Точности (вертикальная ось) и Задержки (горизонтальная ось) на GPU Tesla V100 (Volta) при batch=1 без использования TensorRT:

Читать дальше →

+25

NewTechAudit 25 окт 2021 в 08:11

Подсчет автомобильного трафика с использованием COMPUTER VISION

3 мин

8.7K

Python*Программирование*Машинное обучение*

Иногда у нас встречаются задачи по подсчету клиента потока. Мы можем считать очереди, заполнение общественных мест и т.д.

Представим, что нам поставили задачу посчитать поток машин в определенном месте в разное время. На ум приходит только то, что человеку фактически придется вручную произвести примерный расчет по тем или иным показателям.

Давайте попробуем автоматизировать данную задачу, так как на текущий момент у нас есть огромное количество инструментов и вычислительных мощностей.

Для начала определимся с источником видеозаписей. Для примера можно взять портал https://weacom.ru/cams. На данном портале размещены в общий доступ различные камеры, которые имеют качественное изображение и хорошее расположение (отлично видно дорогу и автомобили)

В качестве примера камеры возьмем https://weacom.ru/cams/view/akademmost2

Данная камера отлично подойдет дли примера, после попробуем усложнить задачу.

Чтобы получить кадры с камеры, нам необходимо подключиться к потоку самой камеры. Заходим в исходный код и находим ссылку на видеопоток с текущей камеры.

Igordru 9 дек 2023 в 10:31

Дата-аналитик в Апх. (Или Yolo на фермах)

4 мин

2.9K

Python*

Из песочницы

Однако здравствуйте. После года самообразования, 6 месяцев курсов по Data-Science - я умудрился устроиться Data-aналитиком в крупную АПХ. Месяц на вкатку в мир данных, пару скучных проектов и тут начальство загорелось внедрить нейронные сети на фермы. Об этом и пойдет повествование. Точнее о первых двух.

NewTechAudit 14 дек 2023 в 07:07

Я знаю, что ты делал этой ночью

Средний

11 мин

16K

Python*Обработка изображений*Машинное обучение*

Кейс

✏️ Технотекст 2023

Привет, Хабр!

Сегодня с вами участники профессионального сообщества NTA Промкин Михаил, Мымрин Дмитрий и Господарикова Ирина.

Одной из областей применения ИИ сегодня является автоматизация контроля за сотрудниками. В данном посте мы рассмотрим приложение технологий ML к задаче детектирования спящих людей (в частности, охранников на рабочем месте) по видеозаписям камер наблюдения.

Обсудим технические аспекты этого процесса, а также потенциальные преимущества и перспективы, которые предоставляет применение искусственного интеллекта в обеспечении безопасности на рабочем месте.

Узнать больше

mishad_0 16 янв в 10:30

Как нейросети помогают изучать снежных барсов: о проекте Сайлюгемского парка и Yandex Cloud

Простой

12 мин

3.9K

Блог компании ЯндексБлог компании Yandex Cloud & Yandex InfrastructureМашинное обучение*Искусственный интеллектЭкология

Кейс

Снежный барс (ирбис) — один из самых редких видов больших кошачьих, который обитает в горных районах. С 2000 года снежный барс занесён в Красный список МСОП как «находящийся под угрозой исчезновения», а с 2017 года ирбисам присвоен статус уязвимого вида.

Такие животные нуждаются в особом наблюдении. Для мониторинга их поведения, состояния и численности учёные используют фотоловушки — автоматические камеры, которые устанавливаются на звериных тропах. Но чтобы отсмотреть и отсортировать все изображения c ловушек вручную, исследователи могут потратить несколько недель.

Меня зовут Михаил Добрицын, я учусь в Школе Анализа Данных Яндекса. В 2023 году совместно с Сайлюгемским национальным парком и другими студентами мы обучили нейросеть, которая поможет учёным быстрее находить снежных барсов и других животных на снимках и узнавать больше об их маршрутах. В этой статье расскажем, как создали собственный датасет для обучения такой нейросети, как тренировали модель, какие результаты получили сейчас и как планируем развивать это решение.

+35

ginbor 27 авг 2023 в 13:32

Overdetection или SFTE. Другие возможности применения YOLO

Простой

8 мин

2.6K

Машинное обучение*

Из песочницы

В этой статье будет описан подход (идея), как при помощи детектирующей нейросети решать более сложные задачи, чем детекция. Идея, лежащая в основе: давайте решать не задачу детекции объекта, а задачу детекции ситуации. Причем, вместо того, чтобы конструировать новую нейросетевую архитектуру, мы будем конструировать входящий кадр. А решать саму задачу будем при помощи стандартных предобученных сетей.

В качестве детектирующей нейросети использована архитектура YOLO, и все гипотезы этого подхода проверены для неё. Вероятно, эти же подходы будут работать и на других архитектурах. Действительно ли они будут работать, надо проверять отдельно.

В заметке я покажу как «переформулировать» задачу детекции так, чтобы решать другие, более сложные задачи. А именно, при помощи YOLO можно не только решать задачу детекции, но и задачу трекинга. И даже больше.

+10

DenisN03 5 сен 2023 в 16:33

Автоматическая разметка данных

Средний

4 мин

5.2K

Python*Data Mining*Обработка изображений*Машинное обучение*Искусственный интеллект

Туториал

В задачах машинного обучения значительную часть времени занимает процесс подготовки данных. К этапу подготовки относятся: сбор, фильтрация, разметка и предобработка данных.В данной статье я буду рассматривать процесс автоматической разметки данных для задач компьютерного зрения.

09.03.2023 года была представлена модель Grounding DINO. Данная модель позволяет детектировать объекты на изображениях по текстовому описанию. Согласно аннотации к статье Grounding DINO, модель достигает значения 52,5 AP на бенчмарке "Zero-Shot Object Detection on MS-COCO". Далее мы рассмотрим как использовать эту модель для автоматической разметки данных.

NewTechAudit 15 сен 2023 в 08:53

Практическое применение моделей YOLO и ResNet для обнаружения нежелательных предметов на фотографиях

Средний

11 мин

10K

Обработка изображений*Машинное обучение*

Кейс

Привет, Хабр!

Сегодня с вами участники профессионального сообщества NTA Попов Иван и Чимбеев Анатолий.

В современном мире, где фотографии играют огромную роль в сфере социальных медиа, онлайн‑безопасности и контроля содержимого, важно иметь эффективные инструменты для обнаружения нежелательных предметов на изображениях. В данной публикации мы рассмотрим практическое применение двух популярных моделей — YOLO и ResNet — для обнаружения нежелательных предметов на фотографиях.

Как мы искали

vladoossss 3 фев в 17:32

YOLO-World: распознавание произвольного числа объектов с высокой точностью и скоростью

Средний

5 мин

10K

Обработка изображений*Машинное обучение*Искусственный интеллект

Из песочницы

Всем привет! Буквально несколько дней назад была представлена новая модель семейства Yolo. Ее основная фишка заключается в том, что в отличие от своих старших братьев, она способна распознавать на изображении фактически любые объекты (которые интересуют человека) без предварительного обучения и делает все это в real-time режиме! Звучит неплохо, не так ли?

В этой статье мы попробуем разобраться, что же за магия скрывается внутри новой архитектуры.

+18

nepexom 11 фев в 15:25

Детекция объектов. YOLO. Часть 2

Средний

9 мин

4.2K

Алгоритмы*Big Data*Машинное обучение*Искусственный интеллект

Ретроспектива

Кто такой YOLO? 🤔

Когда пытаешься разобраться в работе YOLO по статьям в интернете, постоянно натыкаешься на примерно такое объяснение: «Алгоритм делит изображение сеткой SxS, где каждому элементу этой сетки соответствует N ббоксов с координатами, предсказаниями классов и тд...». Но лично мне становилось только непонятнее от такого высокоуровнего описания.. Ведь в исследованиях часто всё происходит примерно так: перебирают гипотезы, пока не получат приемлемый результат, а потом уже придумывают красивое описание. Поэтому для ясности хочется в данной статье рассказать, как вообще приходили к идеям, которые ложились в основу YOLOv1 и последующих версий.

Ilya12c 29 июн 2023 в 12:26

Как подготовить PreLabeled-датасет при помощи CVAT, YOLO и FiftyOne

Простой

7 мин

3.4K

Блог компании Magnus TechOpen source*Обработка изображений*Машинное обучение*

Туториал

Представьте ситуацию: подходит к концу спринт, во время которого вы с командой планировали разметить десятки тысяч картинок для обучения новой нейросети (допустим, детектора). Откладывать задачи — не про вас! И вы обязались придумать способ как успеть в срок!

Сегодня я подробно расскажу:

• как развернуть CVAT — популярный сервис для разметки данных;

• как быстро и удобно предразметить датасет с помощью YOLO и FiftyOne;

• как загрузить полученный датасет на CVAT для переразметки;

• как выгрузить предразмеченный датасет обратно.

+16

smeyanoff 28 окт 2022 в 13:20

Как мы “побеждали” в хакатоне по машинному обучению Data Product Hack

5 мин

3.1K

Python*ХакатоныУчебный процесс в ITИскусственный интеллект

Из песочницы

В статье я поделюсь опытом, как нам удалось всего за 5 дней собрать команду, придумать идею проекта, создать с нуля работающий прототип продукта, который решает реальную проблему на данных, и параллельно с этим посетить 12 встреч с ML-экспертами из ведущих AI компаний. Надеюсь, мой опыт поможет тебе подготовиться к твоему первому хакатону!

dimanosov007 22 ноя 2022 в 10:54

YOLOv7 пользовательское обнаружение объектов

20 мин

19K

Python*Data Mining*Машинное обучение*Искусственный интеллект

Туториал

Recovery Mode

Перевод

Статья по обучению YOLOv7 на своих данных, для обнаружения выбоин на дорогах

С момента своего создания семейство моделей обнаружения объектов YOLO прошло долгий путь. YOLOv7 является самым последним дополнением к этому знаменитому семейству детекторов объектов с одним выстрелом на основе привязки. Он поставляется с множеством улучшений, которые включают в себя самую современную точность и скорость. В этой статье мы проведем точную настройку модели обнаружения объектов YOLOv7 на основе реального набора данных для обнаружения выбоин.

Поехали

dimanosov007 9 дек 2022 в 15:27

Tutorial к автоматизации разметки изображений с использованием OpenCV Python

17 мин

9.3K

Python*Data Mining*Машинное обучение*Искусственный интеллект

Туториал

Перевод

Разметка- самая важная часть проекта глубокого обучения. Это решающий фактор того, насколько хорошо модель обучится. Однако это очень утомительно и отнимает много времени. Одним из решений является использование автоматизированного инструмента разметки изображений, который значительно сокращает время.

В этой статье мы обсудим некоторые приемы и приемы разметки в OpenCV. С помощью этих методов мы создадим автоматизированный инструмент для разметки одного класса. Он также будет иметь функцию отклонения ненужных объектов. Все это использует возможности некоторых простых алгоритмов в OpenCV.

Artgor 23 дек 2022 в 14:23

Третья жизнь пет-проекта по распознаванию рукописных цифр

8 мин

4.6K

Блог компании Open Data ScienceOpen source*Обработка изображений*Машинное обучение*Искусственный интеллект

В этом блогпосте я поделюсь историей о том, как я обновлял свой старенький пет-проект по распознаванию цифр, как делал разметку для него, и почему модель предсказывает 12 классов, хотя цифр всего 10.
Вот ссылка на само приложение, если хочется интерактива сразу.

+27