Recognitor, Москва - Computer Vision and Machine Learning / Статьи / Хабр

ПрофильСтатьи42ПодписчикиСотрудники7

ZlodeiBaal 6 фев в 01:33

VLM / VLA / World Models / Physical AI

Средний

11 мин

9.7K

Блог компании RecognitorОбработка изображений * Искусственный интеллектМашинное обучение * Алгоритмы *

Туториал

Нейроночки в последнее время заполонили всё. Ну, почти всё. Cейчас подбираются к роботам. Настоящего прогресса почти так же много как нейрослопа, пиара и преувеличений.
В этой статье попробую рассказать про нейроночки для управления роботами:

🤖 Расскажу немного про теорию
🤖 Покажу как обучить всё это дома на коленке ~~(и стать экспертом в Physical AI конечно)~~

+16

ZlodeiBaal 10 апр 2025 в 07:39

Всё про инференс на Sophon NPU (TPU)

Средний

7 мин

6.3K

Блог компании RecognitorМашинное обучение * Обработка изображений * Искусственный интеллектВысоконагруженные системы *

Туториал

Перевод

В этой статье мы поговорим про ML на базе плат Sophon. Наверное это один из производителей которые набрали больше всего популярнсти в AI последнее время.

Я расскажу как они соотносятся с другими платами на рынке (Jetson, RockChip, Hailo, TI, etc.). Расскажу как подготовить сети для работы на платформах, покажу ограничения (что пока нельзя сделать, ограничения по скорости, и.т.д.).

+16

ZlodeiBaal 13 окт 2024 в 23:36

Как готовить EdgeAI в 2024/2025 году

Средний

14 мин

15K

Блог компании RecognitorОбработка изображений * Искусственный интеллектПроизводство и разработка электроники * Алгоритмы *

Обзор

Есть у меня такое развлечение - разные платы для AI тестировать.

Очень много того с чем я работаю - про Computer Vision на Edge. В какой то момент я понял что мне не хватает информации. Нет ничего кроме восторженного пресс-релизов. Дай бог ещё есть видео как официальные примеры запускают. Но обычно без этого.

Так что в какой-то момент начал тестировать всё сам. Просто чтобы понимать какие есть альтернативы, что можно а что нельзя.
Иногда (раз в год-два) я пишу обзорную статью. И это именно она. Тут я попробую рассмотреть критерии, которые можно считать важными для AI плат. А так же кратко рассмотреть основные платы на рынке.

+43

ZlodeiBaal 3 июл 2024 в 12:10

OrangePi AiPro — гайд и обзор

Средний

8 мин

34K

Блог компании RecognitorКомпьютерное железоМашинное обучение * Обработка изображений * DIY или Сделай сам

Туториал

Я не знаю как правильно назвать обзор/гайд про эту плату. Самая китайская плата? Самая загадочная? Самая неоднозначная? В любом случае - одна из самых интересных!

Поговорим про OrangePi AIpro, плату от запрещённой в половине мира Huawei.

+37

ZlodeiBaal 26 июн 2024 в 00:12

Апдейтить или нет: нужно ли брать новую ML-модель?

Средний

5 мин

5.8K

Блог компании RecognitorИскусственный интеллектМашинное обучение * Обработка изображений * Алгоритмы *

Туториал

Бывала у вас такая ситуация. Выходит новая нейронная сеть и все руководство начинает требовать внедрить её? Половина коллег восторженно рассказывает о новом слое который позволил повысить точность сети? YoloV(N+1)? LLAMA100?

+15

ZlodeiBaal 18 янв 2024 в 00:50

«Пора ли гнать на мороз Computer Vision — scientist'ов ?» (Fondation Models и вокруг)

Средний

8 мин

23K

Блог компании RecognitorИскусственный интеллектМашинное обучение * Обработка изображений * Алгоритмы *

Аналитика

Прошлый год в Computer Vision запомнился тем, что появилось множество больших претрейненных сетей (Fondation Models). Самая известная - GPT4v (ChatGPT с обработкой изображений).
В статье я попробую простым языком объяснить что это такое (для тех кто пропустил), как меняет индустрию. Какие задачи стало проще решать. Какие продукты появились в последнее время и появятся в будущем.
И можно ли уже выгнать на мороз лишних "ресерчеров"?!

+65

ZlodeiBaal 27 дек 2022 в 05:11

Распознавание товаров на полках

8 мин

8.5K

Блог компании RecognitorData Mining * Алгоритмы * Обработка изображений * Машинное обучение *

Computer Vision позволил создать принципиально новые продукты и механики в многих областях жизни: умный город, беспилотный транспорт, аналитика производств.
То же самое произошло и с супермаркетами: “оценка длины очереди”, “оценка загруженности зала”, “оценка загруженности полок товарами”, “проверка выкладки”, “проверка качества уборки”, “проверка ценников” и многое-многое другое это теперь автоматизированные задачи.
В этой статье я хочу рассказать про то, какие используются общие принципы для распознавания товаров. Эти алгоритмы необходимы для проверки выкладки, заполненности полок, контроля остатков и других задач.
Так получилось что за последние 7 лет мы были вовлечены в решение и консультирование по большинству таких задач, так что накопилось много интересного опыта.

+15

ZlodeiBaal 15 сен 2022 в 14:21

Как выбрать плату для Computer Vision в 2022

6 мин

14K

Блог компании RecognitorDIY или Сделай самКомпьютерное железоМашинное обучение * Обработка изображений *

Выбор платформы для работы с Computer Vision on the Edge - непростая задача. На рынке десятки плат. И одна другой краше. Но на практике все оказывается не так хорошо.
Я попробовал сравнить дешевые платы которые есть на рынке. И сделал это не только в по скорости. Я попробовал сравнить платформы по “удобству” их использования. Насколько просто будет портировать сети, насколько хорошая поддержка. И насколько просто работать. И актуализировал это для 2022 года (один и тот же Coral из 2020 и из 2022 - две разные платы).

+19

ZlodeiBaal 10 мая 2022 в 11:23

Как улучшить распознавание скелетов в MediaPipe

5 мин

Блог компании RecognitorАлгоритмы * Обработка изображений * Машинное обучение * Искусственный интеллект

Туториал

Я очень люблю скелетные детекторы из Mediapipe. Чтобы запустить их нужно всего несколько минут. Работает на разных платформах (мобильные, pc, embedded, и.т.д.). И выдает достаточное качество для многих применений.

Но надо признать что не всюду его можно брать и использовать. Давайте я расскажу как небольшими силами можно его улучшить. Приведенная тут логика будет построена вокруг Mediapipe, но она им не ограничена. Применяя аналогичные подходы можно улучшить практически любой скелетный алгоритм.

+14

ZlodeiBaal 31 янв 2022 в 07:38

Что такое «Action Recognition»?

11 мин

12K

Блог компании RecognitorАлгоритмы * Обработка изображений * Машинное обучение * Искусственный интеллект

Туториал

Год назад моя статья про трекинг была тепло принята на Хабре. Эта статья в каком-то смысле продолжение. В ней я сделал обзор современных методов распознавания действий. От самых простых до самых сложных. Расскажу в каких ситуациях что использовать, и расскажу как это применяют в некоторых проектах.

Вперед!

+27

ZlodeiBaal 8 дек 2021 в 09:18

Как нейронные сети заменяют рендеринг

8 мин

16K

Блог компании RecognitorИскусственный интеллектМашинное обучение * Обработка изображений * Алгоритмы *

Нейронные сети уже везде. И фильтры в фотошопе, и подделка лиц в видео. Но многое пока ещё невозможно. Магические слова "сделай мне видео по моей любимой книжке" пока не работают. Хоть потихоньку мы и движемся к этому. В этой статье я попробую рассказать что сейчас делается в этом направлении и где проходит современный технический прогресс.

В прошлой своей статье я рассказывал про современные генеративные сетки, в первую очередь про StyleGan. Эмбединги и GAN - это красивая математика. Но на практике применений у них пока мало.

Сегодня я немного расскажу о чуть более прикладных подходах и проектах, которые помогают генерировать видео. Тут GANы тоже встречаются, но зачастую как малая часть системы, и куда больше значит логика и схема работ.

+21

ZlodeiBaal 19 июл 2021 в 08:43

ComputerVision и стиль

8 мин

28K

Блог компании RecognitorИскусственный интеллектМашинное обучение * Обработка изображений * Алгоритмы *

Несколько месяцев назад я писал статью про тихую революцию в ComputerVision - про трансформеры. А сейчас я хочу поговорить про другую революцию в CV. Уже не такую тихую (статьи тут куда более известные). Рассказ будет про GAN'ы. Как ими сегодня умеют управлять, и что достигли. В первую очередь это StyleGan и его производные.
В последний год-полтора появилось много различных способов управлять GAN-сетями и улучшилось их качество. Ещё чуть чуть и… Что? Можно будет генерить фильмы по описанию? Игры? Нужно ли будет рисовать крутые текстуры, или их можно будет создать?Попробую показать куда дошла современная технология, и чего ожидать от GAN’ов.

+64

ZlodeiBaal 20 апр 2021 в 23:14

Тихая революция и новый дикий запад в ComputerVision

7 мин

38K

Блог компании RecognitorАнализ и проектирование систем * Алгоритмы * Обработка изображений * Машинное обучение *

Технотекст 2021

Казалось бы, революция с Computer Vision уже была. В 2012 году выстрелили алгоритмы основанные на сверточных нейронных сетях. Года с 2014 они дошли до продакшна, а года с 2016 заполонили все. Но, в конце 2020 года прошел новый виток. На этот раз не за 4 года, а за один. поговорим о Трансформерах в ComputerVision. В статье будет обзор новинок, которые появились в последний год.

+101

ZlodeiBaal 13 апр 2021 в 03:09

Edge платы для домашнего Computer Vision

8 мин

13K

Блог компании RecognitorDIY или Сделай самКомпьютерное железоМашинное обучение * Обработка изображений *

Я люблю делать всякие странные штуки с Computer Vision. Назовем их “условно полезные девайсы”. Из того, что я выкладывал на Хабре, - рассказ про умную кормушку для птиц и камера для слежения за ребенком. По работе тоже примерно тем же самым занимаюсь. Так что люблю следить за актуальным рынком устройств которые подходят для ComputerVision. Свой прошлый обзор я делал полтора года назад. Что для Embedded - много. В этом я сосредоточусь на устройствах которые вышли недавно + на устройствах которые будут интересны для хоббийных проектов.

+36

ZlodeiBaal 27 окт 2020 в 06:34

Как запихать нейронку в кофеварку

12 мин

39K

Блог компании RecognitorDevOps * Анализ и проектирование систем * Компьютерное железоМашинное обучение *

Мир машинного обучения продолжает стремительно развиваться. Всего за год технология может стать мейнстримом, и разительно измениться, придя в повседневность.

За прошедший год-полтора, одной из таких технологий, стали фреймворки выполнения моделей машинного обучения. Не то, что их не было. Но, за этот год, те которые были — стали сильно проще, удобнее, мощнее.

В статье я попробую осветить всё что повылезало за последнее время. Чтобы вы, решив использовать нейронную сеть в очередном калькуляторе, знали куда смотреть.

Читать дальше →

+31

ZlodeiBaal 21 сен 2020 в 06:11

Одноглазый глубиномер

5 мин

17K

Блог компании Recognitor3D-графика * Обработка изображений * Машинное обучение * AR и VR

Недавно вышла интересная статья от FaceBook о том как можно делать неплохой 3D с монокулярных камер. Статья не очень применимая на практике. Но по качеству картинки завораживает.
Посмотрев на это я решил сделать небольшой рассказ о том что в статье творится, куда современные технологии пришли, и что можно ждать от них на практике.

Далее много картинок

+43

ZlodeiBaal 28 авг 2020 в 07:15

RPi-няня

15 мин

15K

Блог компании RecognitorОбработка изображений * Машинное обучение * Искусственный интеллектDIY или Сделай сам

Периодически меня подмывает сделать что-то странное. Очевидно бесполезную вещь, которая не оправдывает себя по объему вложенных средств, и через полгода после создания пылиться на полке. Но зато полностью оправдывает себя по количеству эмоций, полученному опыту и новым рассказам. На Хабре даже есть две моих статьи про такие эксперименты: Алкоорган и умная кормушка для птиц.

Что ж. Пришло время рассказать о новом эксперименте. Как собрал, что из этого вышло и как повторить.

К новому проекту меня подтолкнуло событие, в каком-то смысле, банальное — родился сын. Я заранее устроил себе отпуск на месяц. Но ребёнок оказался тихим — было свободное время. И спящий рядом деть.

Дома много разных embedded-железок для computer vision. В итоге решил сделать видео-няню. Но не такую унылую, которыми завалены все магазины. А что-то поумнее и поинтереснее.

Читать дальше →

+38

Vasyutka 4 авг 2020 в 08:48

Роботы на карантине

9 мин

5.6K

Блог компании RecognitorАлгоритмы * Машинное обучение * Развитие стартапаРобототехника

Тут недавно мужики на Хабре рассказывали про Flipper и отладку на осциллографе по видеосвязи.

И это, конечно, победа вне конкурса! Но и у нас был интересный опыт отладки робота, находящегося в 2000 км от нас в лодочном гараже на норвежском побережье. Под катом рассказ о том, как мы делали зрение и правили “облачные мозги” роботам во время карантина удаленно:

+30

ZlodeiBaal 15 июн 2020 в 08:03

Самая сложная задача в Computer Vision

13 мин

85K

Блог компании RecognitorОбработка изображений * Машинное обучение * Искусственный интеллектPython *

Туториал

Среди всего многообразия задач Computer Vision есть одна, которая стоит особняком. К ней обычно стараются лишний раз не притрагиваться. И, если не дай бог работает, — не ворошить.
У неё нет общего решения. Практически для каждого применения существующие алгоритмы надо тюнинговать, переобучать, или судорожно копаться в куче матриц и дебрях логики.

Статья о том как делать трекинг. Где он используется, какие есть разновидности. Как сделать стабильное решение.

+127

ZlodeiBaal 19 фев 2020 в 06:07

Как объяснить роботу свою точку зрения

5 мин

4.4K

Блог компании RecognitorИскусственный интеллектМашинное обучение * Обработка изображений * Робототехника

Когда-нибудь задумывались зачем сегодня нужны роботы? С детства мне казалось, что роботы стоят где-то на современных фабриках, что это где-то далеко от нас. Или в фантастике.
Но уже нет. Роботы на сегодня — это автоматизация любого рутинного процесса. Их могут ставить и на фермах, и в автомастерских.

Если раньше цена такой автоматизации была огромной, то сейчас она падает. Становятся доступны более сложные технологические манипуляции. Роборуки — это по сути такой универсальный манипулятор, который не нужно проектировать под каждую задачу, => снижение цены внедрения, ускорение внедрения (хотя роборука может быть дороже чем кусок конвейера, который делает аналогичную операцию).

Но роборука это лишь половина процесса. Вторая половина — научить роборуку думать. И тут до недавних пор ситуация была ужасная. Нет универсальных подходов, которые сможет настроить любой инженер. Надо нанимать программистов/разработчиков/математиков, чтобы они сформулировали проблему, попробовали сделать решение. Конечно, такая ситуация не могла существовать долго. Да и Computer Vision с глубоким обучением подвезли. Так что сейчас начинает появляться какая-то первичная автоматизация не только сторого повторяющихся процессов. Сегодня о ней и поговорим.

+16

2 3

VLM / VLA / World Models / Physical AI

Всё про инференс на Sophon NPU (TPU)

Как готовить EdgeAI в 2024/2025 году

OrangePi AiPro — гайд и обзор

Апдейтить или нет: нужно ли брать новую ML-модель?

«Пора ли гнать на мороз Computer Vision — scientist'ов ?» (Fondation Models и вокруг)

Распознавание товаров на полках

Как выбрать плату для Computer Vision в 2022

Как улучшить распознавание скелетов в MediaPipe

Что такое «Action Recognition»?

Как нейронные сети заменяют рендеринг

ComputerVision и стиль

Тихая революция и новый дикий запад в ComputerVision

Edge платы для домашнего Computer Vision

Ближайшие события

Как запихать нейронку в кофеварку

Одноглазый глубиномер

RPi-няня

Роботы на карантине

Самая сложная задача в Computer Vision

Как объяснить роботу свою точку зрения

Информация