Articles / Bookmarks / Profile of dimanosov007 / Habr

@dimanosov007

Computer Vision

Profile Publications 15Comments 16Bookmarks 18

kashokhin Jan 14 at 14:31

Mamba. От начала до конца

Medium

5 min

23K

Machine learning*Artificial Intelligence

FAQ

From sandbox

Во времена повсеместного заполонения трансформерами, которые пожирали в себя все больше и больше кремниевых чипов; когда казалось, что лучше уже не будет и за каждый новый токен нужно платить в квадрате от предыдущих, в эту холодную зимнюю пору появилась она - Мамба.

+27

Squirrelfm Jan 9 at 09:07

Как объяснить функции активации вашему коту: простое руководство

Easy

8 min

12K

Machine learning*Artificial IntelligenceNatural Language Processing*Raft corporate blog

Tutorial

Итак, функции активации. Что мы знаем о них помимо загадочной тайны ужасных соглашений о наименованиях (о чем поговорим позже 🧐) и зачем они нам нужны (если вас это вообще интересно)?

Идея, собственно, настолько проста, что даже ваш кот может разобраться в этом. Прежде всего, что-то похожее есть в наших головах. Для этого давайте взглянем на упрощенный нейрон (органический и искусственный):

+32

pzrnqt1vrss Aug 18 2023 at 12:15

Простая нейронная сеть без библиотек и матриц. Эволюционный алгоритм

Medium

15 min

10K

Python*Machine learning*Artificial Intelligence

Tutorial

Руководство? Гайд? В общем вторая часть описания моего опыта в создании простой, а главное понятной любому новичку нейросети :)

В этот раз поговорим про эволюционный/генетический алгоритм и заставим нейросеть балансировать мячи.

+20

EnjiRouz Nov 24 2020 at 11:47

Пишем голосового ассистента на Python

16 min

154K

Python*Machine learning*Development for Windows*Voice user interfaces*

Tutorial

From sandbox

Введение

Технологии в области машинного обучения за последний год развиваются с потрясающей скоростью. Всё больше компаний делятся своими наработками, тем самым открывая новые возможности для создания умных цифровых помощников.

В рамках данной статьи я хочу поделиться своим опытом реализации голосового ассистента и предложить вам несколько идей для того, чтобы сделать его ещё умнее и полезнее.

Читать дальше →

+12

gfx_pro Jan 9 2023 at 14:04

(Более) точное измерение динамического диапазона сенсора камеры

7 min

2.5K

Photographic equipmentData Engineering*

From sandbox

Всем привет! В этом посте поговорим о том, как (более) точно измерять динамический диапазон сенсора камеры и что с этими замерами можно сделать.

Разумеется, я не являюсь специалистом по компьютерному зрению, программистом или статистиком, поэтому не стесняйтесь поправлять меня в комментариях, если я допускаю в этом посте ошибки. Здесь мой интерес был в основном направлен на повседневные и прикладные задачи, такие как фотография, но я считаю, что результат может быть полезен также и специалистам по компьютерному зрению.

io_io Aug 18 2015 at 15:08

Как легко понять логистическую регрессию

5 min

205K

System Analysis and Design*Big Data*Machine learning*.io corporate blog

Tutorial

Translation

Логистическая регрессия является одним из статистических методов классификации с использованием линейного дискриминанта Фишера. Также она входит в топ часто используемых алгоритмов в науке о данных. В этой статье суть логистической регрессии описана так, что она станет понятна даже людям не очень близким к статистике.

Читать дальше →

+13

egor_labintcev May 12 2017 at 13:59

Метрики в задачах машинного обучения

9 min

623K

Python*Data Mining*Mathematics*Machine learning*Open Data Science corporate blog

Привет, Хабр!

В задачах машинного обучения для оценки качества моделей и сравнения различных алгоритмов используются метрики, а их выбор и анализ — непременная часть работы датасатаниста.

В этой статье мы рассмотрим некоторые критерии качества в задачах классификации, обсудим, что является важным при выборе метрики и что может пойти не так.

Читать дальше →

+38

ginbor Aug 27 2023 at 13:32

Overdetection или SFTE. Другие возможности применения YOLO

Easy

8 min

2.6K

Machine learning*

From sandbox

В этой статье будет описан подход (идея), как при помощи детектирующей нейросети решать более сложные задачи, чем детекция. Идея, лежащая в основе: давайте решать не задачу детекции объекта, а задачу детекции ситуации. Причем, вместо того, чтобы конструировать новую нейросетевую архитектуру, мы будем конструировать входящий кадр. А решать саму задачу будем при помощи стандартных предобученных сетей.

В качестве детектирующей нейросети использована архитектура YOLO, и все гипотезы этого подхода проверены для неё. Вероятно, эти же подходы будут работать и на других архитектурах. Действительно ли они будут работать, надо проверять отдельно.

В заметке я покажу как «переформулировать» задачу детекции так, чтобы решать другие, более сложные задачи. А именно, при помощи YOLO можно не только решать задачу детекции, но и задачу трекинга. И даже больше.

+10

karinakvanchiani Jul 13 2023 at 10:56

Мнение большинства для разметки данных в задачах компьютерного зрения

Medium

8 min

2.8K

Data Mining*Image processing*Machine learning*CrowdsourcingSberDevices corporate blog

Tutorial

Многие прикладные задачи из области компьютерного зрения требуют от разработчиков создания собственных наборов данных, которые можно своевременно обновлять и адаптировать: увеличивать количество классов и сэмплов или делать сэмплы более разнородными по тем или иным признакам. Кроме того, для некоторых задач необходимы доменные и достаточно специфичные данные. Например в SberDevices, для реализации управления умными устройствами с помощью жестов, необходим датасет, на изображениях которого люди показывают жесты перед камерой; для бьютификации в Jazz — фотографии людей на веб-камеру или селфи. Необходимость постоянно создавать и поддерживать собственные наборы данных требует автоматизации их сбора и разметки.

+10

Ilya12c Jun 29 2023 at 12:26

Как подготовить PreLabeled-датасет при помощи CVAT, YOLO и FiftyOne

Easy

7 min

3.3K

Open source*Image processing*Machine learning*Magnus Tech corporate blog

Tutorial

Представьте ситуацию: подходит к концу спринт, во время которого вы с командой планировали разметить десятки тысяч картинок для обучения новой нейросети (допустим, детектора). Откладывать задачи — не про вас! И вы обязались придумать способ как успеть в срок!

Сегодня я подробно расскажу:

• как развернуть CVAT — популярный сервис для разметки данных;

• как быстро и удобно предразметить датасет с помощью YOLO и FiftyOne;

• как загрузить полученный датасет на CVAT для переразметки;

• как выгрузить предразмеченный датасет обратно.

+16

FFelix Jan 8 2021 at 17:55

Самообучение в Data science, с нуля до Senior за два года

9 min

243K

IT career

From sandbox

Хочу поделиться методами освоения Data science с нуля человеком из другой ИТ специальности. Цель: дать понять, подходит ли Вам эта специальность в принципе, и рассказать про эффективные подходы к самообучению, которые мне помогли.

Отличные материалы уже существуют по большинству конкретных тем, я сам по ним учился. Думаю, многим будут полезны "мета" материалы о том, как выбирать курсы и статьи, по которым учиться.

+15

kitaisky Sep 13 2021 at 15:24

Детекция объектов с помощью YOLOv5

2 min

38K

Image processing*Machine learning*

Tutorial

Пошаговый туториал для детекции кастомных объектов на изображении.

DELTA37 Jun 9 2022 at 12:44

Как быстро создать обучающий датасет для задач обнаружения объектов YOLO с помощью Label Studio

4 min

12K

Data Mining*Big Data*Machine learning*Data Engineering*

Tutorial

Обнаружение объектов — одна из подзадач компьютерного зрения для идентификации определенных объектов. Например, люди, здания, растений, дорожных знаков или транспортные средства на изображениях и видео.

Для создания таких моделей существует множество различных типов алгоритмов, таких, как Scale-invariant feature transform (SIFT), Detectron, RefineDet или You Only Look Once (YOLO). Их часто используют в самых разных отраслях, начиная с автономного вождения и охранных систем, заканчивая автоматизацией на производстве и распознаванием лиц.

Как и с любой моделью машинного обучения, всё начинается с создания обучающего набора данных. Сделать это можно разными способами: можно заказать разметку данных, а можно всё сделать самому.

Конечно, второй вариант займет намного больше времени и сил, но с помощью правильно подобранного ПО можно неплохо упростить задачу. Сейчас я подробно расскажут, как быстро создать обучающий датасет для задач детекции объектов YOLO с помощью Label Studio.

Посмотрим, что у тебя там...

mr-pickles Oct 11 2021 at 15:18

Разбираемся с параллельными и конкурентными вычислениями в Python

21 min

52K

Python*Programming*Wunder Fund corporate blog

Translation

Я собираюсь рассказать историю о еде, раскрывающую различные возможности конкурентного и параллельного выполнения кода в Python.

Прим. Wunder Fund: для задач, где не критичны экстремально низкие задержки — при сохранении и обработке биржевых данных, мы используем Питон, и естественно применяем описанные в статье подходы. Статья будет полезна начинающим разработчикам.

Мы увидим, что когда один человек одновременно делает несколько дел — это похоже на конкурентность, а когда несколько человек, работая бок о бок, заняты каждый собственным делом — это напоминает параллелизм. Эти ситуации мы разберём на простом и понятном примере закусочных, в которые люди заходят в обеденный перерыв. Такие заведения стремятся обслуживать клиентов как можно быстрее и эффективнее. Потом я покажу реализацию механизмов этих закусочных на Python, а в итоге мы сравним разные возможности одновременного «приготовления нескольких блюд», которые даёт нам этот язык, и разберёмся с тем, в каких ситуациях их применение наиболее оправдано.

А именно, я раскрою здесь следующие вопросы:

▪ Отличия конкурентности от параллелизма.
▪ Различные варианты организации конкурентного выполнения кода (многопоточность, модуль asyncio, модуль multiprocessing, облачные функции) и их сравнение.
▪ Сильные и слабые стороны каждого подхода к организации конкурентного выполнения кода.
▪ Выбор конкретного варианта организации конкурентного выполнения кода с использованием специальной блок-схемы.

+23

ZlodeiBaal Dec 27 2022 at 08:11

Распознавание товаров на полках

8 min

5.2K

Data Mining*Algorithms*Image processing*Recognitor corporate blogMachine learning*

Tutorial

Computer Vision позволил создать принципиально новые продукты и механики в многих областях жизни: умный город, беспилотный транспорт, аналитика производств.
То же самое произошло и с супермаркетами: “оценка длины очереди”, “оценка загруженности зала”, “оценка загруженности полок товарами”, “проверка выкладки”, “проверка качества уборки”, “проверка ценников” и многое-многое другое это теперь автоматизированные задачи.
В этой статье я хочу рассказать про то, какие используются общие принципы для распознавания товаров. Эти алгоритмы необходимы для проверки выкладки, заполненности полок, контроля остатков и других задач.
Так получилось что за последние 7 лет мы были вовлечены в решение и консультирование по большинству таких задач, так что накопилось много интересного опыта.

+15

kucev Jul 6 2022 at 12:18

Опенсорсные массивы данных для Computer Vision

8 min

3.4K

Data Mining*Image processing*Big Data*Machine learning*Artificial Intelligence

Translation

Модели Computer Vision, обучаемые на опенсорсных массивах данных

Computer Vision (CV) — одна из самых увлекательных тем в сфере искусственного интеллекта (Artificial Intelligence, AI) и машинного обучения (Machine Learning, ML). Это важная часть многих современных конвейеров AI/ML, преобразующая практически все отрасли и позволяющая компаниям осуществлять революцию в работе машин и бизнес-систем.

В науке CV многие десятилетия была уважаемой областью computer science, и за многие годы в этой сфере было проведено множество исследований по её совершенствованию. Однако революцию в ней совершило недавно начавшееся применение глубоких нейросетей, ставшее стимулом ускорения её развития.

Читать дальше →

dimanosov007 Dec 9 2022 at 15:27

Tutorial к автоматизации разметки изображений с использованием OpenCV Python

17 min

9.2K

Python*Data Mining*Machine learning*Artificial Intelligence

Tutorial

Translation

Разметка- самая важная часть проекта глубокого обучения. Это решающий фактор того, насколько хорошо модель обучится. Однако это очень утомительно и отнимает много времени. Одним из решений является использование автоматизированного инструмента разметки изображений, который значительно сокращает время.

В этой статье мы обсудим некоторые приемы и приемы разметки в OpenCV. С помощью этих методов мы создадим автоматизированный инструмент для разметки одного класса. Он также будет иметь функцию отклонения ненужных объектов. Все это использует возможности некоторых простых алгоритмов в OpenCV.