Comments / Profile of SmartEngines / Habr

Пользователь

ProfileArticles174PostsNews50Comments429

Регуляризация? Ортогонализация! Улучшаем компактные сети

SmartEngines Apr 6 2020 at 16:58

Есть специфичные техники как drop connect, sample pairing, mixup (статьи гуглятся по этим названиям), которые независят от весов и модифицируют именно входные данные. При этом, по своему эффекту они ближе к регуляризации, чем к аугментации, так как создают неправдоподбные изображения. Они не являются универсальными, но иногда могут помочь.

0

Алгоритм распознавания ценников, который работает даже на терминалах сбора данных

SmartEngines Apr 4 2020 at 04:51

Обращайтесь в службу продаж, на сайте есть как. Тут точно не место.

-1

Алгоритм распознавания ценников, который работает даже на терминалах сбора данных

SmartEngines Apr 3 2020 at 13:20

Спасибо! Исправили, сказывается режим работы из дома.

0

Алгоритм распознавания ценников, который работает даже на терминалах сбора данных

SmartEngines Apr 3 2020 at 13:02

Спасибо, поправили.

0

8-битные сети на Эльбрусе, есть ли смысл?

SmartEngines Mar 31 2020 at 18:09

На самом деле да, ПЛИС очень разные. Но выбор платформы для конкретного решения часто ограничен какими-то дополнительными факторами, и не стоит бездумно использовать стандартные решения, без оглядки на оборудование. А оптимизированные fp16 для сеток — это тоже прекрасно.

0

8-битные сети на Эльбрусе, есть ли смысл?

SmartEngines Mar 31 2020 at 17:45

Пример для Intel c SSE4 был тут, для AVX-512 VNNI все еще проще, потому что это расширение специально под нейронные сети. Можно оценить и сложность на элемент матрицы, и прикинуть время, это не выглядит сложной задачей. В первую очередь мы хотели показать, как привычные методы могут повести себя на конкретном не слишком обычном вычислителе, и насколько важно задуматься об архитектуре процессора перед оптимизацией.

0

8-битные сети на Эльбрусе, есть ли смысл?

SmartEngines Mar 31 2020 at 15:18

Да, для умножения канал не блокируется, и результаты можно получать на каждом такте, но с задержкой в 4 такта.

0

Долгожданный шаг в сторону сложно структурированных документов (+видео)

SmartEngines May 23 2019 at 09:44

Основная фишка нашего продукта заключается в том, что мы выполняем все вычисления непосредственно на устройстве (без использования внешних высокопроизводительных серверов), быстро и точно.

0

Долгожданный шаг в сторону сложно структурированных документов (+видео)

SmartEngines May 23 2019 at 07:48

Мы купили его непосредственно у производителя.

0

Зачем нужна низкоуровневая оптимизация на Эльбрусе или как ускорить распознающую систему в полтора раза

SmartEngines Feb 6 2019 at 08:23

К сожалению, это общая беда!

+2

Повышение качества склейки панорамы с помощью согласования графа проективных преобразований

SmartEngines Nov 16 2018 at 12:03

В предложенном подходе первый (опорный) кадр проективно не выпрямлялся.

0

Низкоуровневая оптимизация кода на платформе Эльбрус: векторное сложение uint16_t с помощью интринсиков

SmartEngines Mar 14 2018 at 15:23

В задаче распознавания паспорта РФ использование EML и интринсиков (для реализации функций, которых пока нет в EML) ускоряет вычисления где-то в 2 раза на Эльбрус-401PC. Сейчас научная статья, включающая эти результаты, находится в печати.

0

Низкоуровневая оптимизация кода на платформе Эльбрус: векторное сложение uint16_t с помощью интринсиков

SmartEngines Mar 14 2018 at 10:47

По первому замечанию: Вам действительно интересен код, замусоренный обработкой «хвостика» массива? На производительность это не влияет. Код — элементарный. А тема поста — производительность. Маловероятно, что среди читателей есть разработчики на Эльбрусе, мечтающие именно о 16-битном сложении и надеющиеся на готовую копипасту. Поэтому мы выкинули то, что ухудшило бы подачу материала. Напротив, невыровненность начала массива — это ключевая проблема. Отдельной обработкой «начала» она не лечится. Что же касается второго замечания, то, простите, не ясно, что именно вызывает раздражение. Не уточните?

+3

Низкоуровневая оптимизация кода на платформе Эльбрус: векторное сложение uint16_t с помощью интринсиков

SmartEngines Mar 14 2018 at 06:06

Спасибо, исправили. По ошибке скопипастили при выкладывании.

0

История победы на международном соревновании по распознаванию документов команды компании SmartEngines

SmartEngines Dec 30 2017 at 12:05

Спасибо за поздравления)
Вопрос аугментации на GPU обычно рассматривается, когда процесс обучения сетей замедляется из-за недостаточной скорости подготовки данных на лету. Как раз обрезка, поворот, сдвиги, простые яркостные искажения делаются достаточно быстро и на CPU, а вот например маштабирование и проективные искажения иногда переносим на вторую GPU для ускорения раздутия данных.

0

История победы на международном соревновании по распознаванию документов команды компании SmartEngines

SmartEngines Dec 30 2017 at 11:52

Очень рады, что Вам понравилось)
Кроме Отцу и Ниблэка мы так же пробовали алгоритмы Nicholas R. Howe Binarization и Sauvola binarization
Скорость работы алгоритма во многом зависит от целого ряда факторов и здесь можно дать несколько ответов.
Например при среднем соотношении скорость — качество (за счёт частоты нарезки окон, определённая нейронная сеть и т.д.) скорость бинаризации одного изображения составляет около 5 секунд при использованни GPU Titan X.
При необходимости повысить качество — время работы возрастает в десятки раз из-за многократного применения сети / сетей.
При необходимости повысить скорость (или впихнуть этого U-net крокодила на мобильник) можно использовать например многопроходную схему:
На первом этапе можно применить несетевой метод бинаризации.
На втором этапе применить сетевой метод только к тем окнам, где возможно находится текст (результат работы 1-го этапа)
На третьем этапе применить U-net сеть для уточния работы алгоритма на 2ом этапе.
Благодаря подобному подходу возможно многократное ускорение алгоритма бинаризации с помощью сетей.

0

Сравнительное тестирование Smart IDReader на 5 вычислительных комплексах с процессорами Эльбрус

SmartEngines Dec 29 2017 at 10:51

Мы используем и библиотеку EML, и специальный набор интринсиков от производителя.

0

Сравнительное тестирование Smart IDReader на 5 вычислительных комплексах с процессорами Эльбрус

SmartEngines Dec 28 2017 at 13:47

Вот тут мы проводили сравнение

0

Smart IDReader SDK — как написать Telegram-бота на Python для распознавания документов за 5 минут

SmartEngines Dec 20 2017 at 18:17

Планов пока нет, но и проблем с этим мы не видим, тем более потому, что Go поддерживается SWIG-ом. Будет заказчик, который попросит Go — будет и поддержка Go. :)

0

История победы на международном соревновании по распознаванию документов команды компании SmartEngines

SmartEngines Dec 14 2017 at 12:12

Работа с данными в большей степени происходит на cpu. Именно поэтому, при большом числе раздутий, применяемых к данным, подающимся на обучение нейронной сети, может возникать ситуация, когда предыдущий минибатч уже использовался в обучении, а новый ещё не готов. В такой ситуации gpu простаивает, сетка не учится, время обучения сети увеличивается.

0

1 2 ...

15

16 17 ...