Comments / Profile of ErmIg / Habr

Ермолаев Игорь @ErmIg

Пользователь

ProfileArticles11PostsNewsComments226

Исследователи на ходу запустили дрон из пневматической пушки

ErmIg Nov 22 2019 at 12:21

Думаю, что военные оценят эту идею.

Look

Synet — фреймворк для запуска предварительно обученных нейронных сетей на CPU

ErmIg Nov 18 2019 at 11:55

Честно говоря, я не проверял работоспособность под C++Builder. То что проверено: MSVS, GCC, CLANG.

Look

Сверточный слой: методы оптимизации основанные на матричном умножении

ErmIg Nov 7 2019 at 06:24

Я видел много реализаций сверточного слоя в разных библиотеках. Во многом они совпадают. Может потому, что код у всех открытый, а может люди независимо приходят к похожим вещам. Это в принципе не так важно. Я лишь хотел раскрыть для заинтересованного читателя, как это все устроено.

Look

Компьютерное зрение как альтернатива офисным пропускам

ErmIg Nov 1 2019 at 10:00

Понятно. Вы такими тонкостями не заморачиваетесь. Ладно, вопрос снимается.

Look

Компьютерное зрение как альтернатива офисным пропускам

ErmIg Nov 1 2019 at 09:40

На сколько я помню, в OpenCV реализованы все эти методы. Вопрос — какой из них использовали конкретно вы?

Look

Компьютерное зрение как альтернатива офисным пропускам

ErmIg Nov 1 2019 at 07:00

Вопрос: а распознавание лиц на основе OpenCV на чем работает (Haar, LBP, HOG, DNN)?

Look

Вымирание компьютерных файлов

ErmIg Oct 31 2019 at 14:00

C 2013 года я переключился на другие проекты. На AntiDupl не хватает времени и сил. Впрочем ей я и так посвятил почти 11 лет своей жизни. Если у вас есть энтузиазм — там люди на проекте не помешали бы.

Look

Вымирание компьютерных файлов

ErmIg Oct 31 2019 at 13:36

Да было время… Была своя коллекция музыки, фильмов, картинок. Для последних даже написал прогу, чтобы избавляться от дубликатов в автоматическом режиме. Сейчас кажется смешным, а раньше была радость — вот удалил пару десятков мегабайт дублирующих картинок.

Look

Synet — фреймворк для запуска предварительно обученных нейронных сетей на CPU

ErmIg Oct 16 2019 at 05:52

2) Скорость кода может катастрофически (до 10 раз) меняться в зависимости от того, влазят расчетные данные в процессорный уеш или нет. Потому любой быстрый алгоритм должен разбивать/сливать исходные данные такми образом, что бы кеш использовался максимально эффективно. В Synet и Inference Engine немного разный подход, но основные принципы совпадают.
4) Не знаю, VFP — вроде как аналог x87 и считается устаревшим в ARMv7 и ARMv8. Везде рекомендуют вместо него использовать NEON. Единственное его преимущество — поддержка FP64. Но почитаю про него по подробнее.

Look

Synet — фреймворк для запуска предварительно обученных нейронных сетей на CPU

ErmIg Oct 16 2019 at 05:31

На самом деле название произошло от имени компании: Synet = Synesis Network, но ход ваших мыслей мне нравится!

Look

Synet — фреймворк для запуска предварительно обученных нейронных сетей на CPU

ErmIg Oct 15 2019 at 09:09

1) Возможно я не прав.
2) Synet тоже оптимизирует свёртки и их последовательность для оптимального использования памяти. Благодаря чему и достигается преимущество в производительности.
3) Согласен. Добавлю в цели :).
4) Под сопроцессором вы встроенный GPU имеете в виду?

Look

Synet — фреймворк для запуска предварительно обученных нейронных сетей на CPU

ErmIg Oct 15 2019 at 08:43

1) Наболее быстрая реализация OpenCV на процессорах Интел реализовано как раз на OpenVINO (Inference Engine там под капотом). Потому зачем тащить OpenCV, если можно сравнить напрямую.
2) По умолчанию OpenVINO включает распараллеливание на все ядра, как и другие фреймворки. Может поэтому у вас сложилось такое впечатление. Если я не прав — поправьте.
3) У нас на проекте используется два вдижка (Inference Engine и Synet) — взависимости от того что быстрее, то и используется. Потому с целью облегчения своей работы, я ограничился конвертацией из OpenVINO — благо в этот формат так и так надо перегонять.
4) Raspberry Pi поддерживается. Впрочем как и любой ARM с поддержкой NEON.

Look

ВМФ США хочет запатентовать компактный термоядерный реактор

ErmIg Oct 13 2019 at 16:57

Немного не по теме, но когда мы сможем прочитать ваши новые статьи? Ждем с нетерпением!

Look

Выходные на электромобиле

ErmIg Sep 10 2019 at 05:47

На самом деле тут не сложно подсчитать: при скорости света в 300000 км/с и частоте в 50 Гц длина волны будет 6000 км. Два источника переменного тока уже на расстоянии в 1500 км будут полностью разсогласованы. На практике переменным током передают обычно максимум на 300 км.

Look

Выходные на электромобиле

ErmIg Sep 9 2019 at 07:19

Здесь видится некоторое непонимание ситуации. Что постоянный, что переменный ток имею практически одинаковые потери при передачи по проводам. Но! Что бы потери при передачи на растоянии были меньше, нужно высокое напряжение. А для переменного тока можно легко менять напряжение при помощи трансформатора практически со 100% КПД. Если расстояние становится слишком большим (несколько тысяч км), то у переменного тока возрастают потери на согласование фаз. И тогда уже выгоднее передавать постоянный ток, даже не смотря на его большие потери при преобразованиях.

Look

«Умное» видеонаблюдение: какой будет жизнь под камерами с искусственным интеллектом

ErmIg Jul 26 2019 at 06:17

Не подумайте, что я придираюсь. Но это так типично — для демонстрации многокамерного слежения использовать человека в красной кофте и белой юбке.

Look

Какой язык — D, Go или Rust имеет лучшие перспективы заменить C и почему?

ErmIg Jul 25 2019 at 05:51

OpenCv написан практически полностью на С++. От С там остался легаси API от OpenCV-1.0.

Look

Умножение матриц: эффективная реализация шаг за шагом

ErmIg Mar 15 2019 at 11:21

К сожалению нет. На первый взгляд действительно все проще: данные A и B лежат одинаково — только считай взаимное скалярное произведение их строчек.

Однако: максимальный размер микроядра получится 3x4, что дает нам (3 + 4)/(3*4) = ~0.58 загрузок на одну fma. Напомню, что при классической схеме с окном 6x16 получается (6 + 16)/(6*16) = ~0.23 загрузок на одну fma. Т.е. предложенная вами схема почти в 2.5 раза более требовательна к пропускной способности памяти. В принципе мои внутренние тесты это подтверждают.

Look

Умножение матриц: эффективная реализация шаг за шагом

ErmIg Mar 15 2019 at 07:19

Если подвезете, я возражать не буду. Сам я в этом деле не специалист.

Look

Умножение матриц: эффективная реализация шаг за шагом

ErmIg Mar 15 2019 at 06:45

Цитата из введения: С целью ограничить объем изложения, я ограничился описанием однопоточного алгоритма для обычных процессоров. Тема многопоточности и алгоритмов для графических ускорителей явно заслуживает отдельной статьи.

Look

1 2 3

5 6 ...

11 12