Как стать автором
Обновить

Компания Smart Engines временно не ведёт блог на Хабре

Сначала показывать

Технологии распознавания паспорта – 10 лет.  Хабрология от Smart Engines

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров898

Десять лет назад, 17 марта 2015 года, мы опубликовали свой самый первый хабр. Тогда мы впервые представили городу и миру нашу технологию распознавания паспорта на мобильнике. Публика в комментах разделилась на два лагеря: одни сомневались в пользе решения, другие критиковали за недостаток возможностей и предлагали идеи по улучшению. 

Теперь, с высоты уже немалого времени докладываем: 1) идея себя оправдала и даже превзошла самые смелые ожидания; 2) работа по совершенствованию технологии была проделана; 3) работы было и будет очень много. Собрали для вас хайлайты этой увлекательной и яркой истории.

Как это было?

Томографическая реконструкция реактивного двигателя в сборе: как мы это сделали?

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров2.8K

Приём, Хабр! На связи отдел компьютерной томографии Smart Engines. Сегодня хотим поделиться нашими результатами по КТ-исследованиям реактивных двигателей, рассказать о том, почему недостаточно просто взять и измерить, и как нам удалось не потерять лопасти.

Под катом – красивые трехмерные изображения реактивного двигателя, КТ взорвавшегося двигателя, а также ответ на вопрос, стоит ли верить своим глазам.

Читать далее

Распознавание день в день: как настроить шаблон нового документа без программирования

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров995

Привет, Хабр! Вы прекрасно знаете, что мы в Smart Engines непрерывно совершенствуем наши системы распознавания российского паспорта и других документов. Вместе с этим мы постоянно расширяем список документов, которые могут быть распознаны при помощи наших решений, – и будем делать это и дальше. Но что если бизнесу нужно оперативно настроить распознавание нового корпоративного документа с жесткой структурой? Сегодня такая потребность есть практически у любой организации.

Можно прийти с этой задачей к нам, и мы обязательно поможем. Но есть и альтернативный сценарий – встроить возможность настройки распознавания к себе. Для этого мы выпустили специальный инструмент – дизайнер форм. С ним ждать никого не придется, а добавлять распознавание новых форм можно будет по мере их появления, буквально день в день. О нем мы сегодня и поговорим.

Читать далее

Квантованные БМ сети: упрощаем типы данных

Уровень сложностиСложный
Время на прочтение6 мин
Количество просмотров441

Как вы уже видели, регулярно читая наш блог, мы не только занимаемся разработкой промышленных систем распознавания документов (паспортов, кадрового документооборота, первички и т.п.), но и активно развиваем перспективные технологии в области компьютерного зрения. Сегодняшняя статья из области эффективных нейросетевых архитектур.

Биполярные морфологические (БМ) сети – нейронные сети от Smart Engines практически без умножения. Мы уже показали, что они успешно справляются с задачами классификации изображений и поиска объектов на изображениях. Однако для достижения высокой вычислительной и энергоэффективности важно не только максимально упростить используемые операции, но и взять максимально простой и компактный тип данных, то есть отквантовать нейронную сеть. Так что насчет квантования БМ сетей?

Читать далее

Фильтр Гаусса на стероидах: подход на точность вычислений

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров1.8K

Hello, world! Это вторая часть хабростатьи Smart Engines про быструю фильтрацию изображений. Да-да, создавая топовый продукт по распознаванию документов, нам приходится разбираться в методах обработки изображений на экспертном уровне (иначе не получилось бы распознать изображение паспорта за 150 мс на мобильном телефон). В предыдущей части мы начали обсуждать быстрые аппроксимации гауссовского фильтра, которым была посвящена наша недавняя публикация в научном журнале MDPI Applied Sciences [1]. О том, как работает оригинальный фильтр Гаусса, мы уже писали, сейчас мы только напомним о его использовании всюду, где возникает обработка изображений: от редактирования фотографий на смартфоне – для размытия фона за объектом в режиме "портрет", до анализа рентгеновских снимков – чтобы убрать шум и улучшить читаемость изображения.

Читать далее

Threshold U-Net: как мы отказались от высокого разрешения и выиграли в скорости бинаризации

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров1K

Хоть современный ИИ уже почти в состоянии написать симфонию и превратить холст в шедевр, некоторые простые задачи все еще не так просты, если наложить ограничения на решение. Так как главной задачей у нас, в Smart Engines, является распознавание и оцифровка документов, то для нас ограничениями являются скорость работы и возможность запуска системы на вычислительно слабых конечных устройствах. В этой статье мы вспомним об одной классической задаче обработки изображений – бинаризации документов. А также расскажем, как нам удалось существенно оптимизировать нейросетевую модель бинаризации, сохранив исходное качество, и причем тут современные модели детекции текста.

Читать далее

BM YOLO: что, если вам не нужно умножать, чтобы распознавать?

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров2.9K

Современные технологии глубокого обучения проникают в самые разные области нашей жизни — от автономных автомобилей до систем видеонаблюдения. Однако высокая вычислительная сложность традиционных нейронных сетей остается серьёзным препятствием на пути к их широкому применению на мобильных устройствах и встраиваемых системах.

Группа исследователей из Smart Engines представила на международной конференции ICMV 2023 инновационное решение — биполярную морфологическую нейронную сеть YOLO (Bipolar Morphological YOLO, BM YOLO), которая сочетает в себе энергоэффективные вычислительные подходы и проверенную временем архитектуру YOLO для детектирования объектов.

Читать далее

Фильтр Гаусса на стероидах: секреты ускорения вычислений

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров5.2K

Привет, Хабр! Представьте, что вы пытаетесь обработать фотографию высокого разрешения на вашем смартфоне — добавить размытие, убрать шум или улучшить качество изображения. Кажется, задача проста, но за кулисами работает алгоритм, требующий немало вычислительных ресурсов. Речь идет о фильтре Гаусса – одной из самых популярных операций в области компьютерной обработки изображений.

Для каждого пикселя нужно выполнить множество операций сложения и умножения, особенно если размер фильтра велик. Это становится серьёзным препятствием, когда есть требования к работе в режиме реального времени, например, при обработке видео, адаптации для беспилотных летательных аппаратов и пр. Но что, если сказать, что такие вычисления можно ускорить в десятки раз с незначительной потерей качества?

Читать далее

Распознавание банковской карты для подтверждения личности

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров1.7K

В условиях стремительной цифровизации и активного развития дистанционных услуг подтверждение личности становится краеугольным камнем финансовых процессов. Задача быстрой и надежной идентификации уже день актуальна во всем мире. А сегодня мы поделимся с вами красивой идеей как можно с помощью современных технологий распознавания (на примере, естественно, продуктов Smart Engines) надежно реализовать автоматизированный процесс подтверждения личности без использования сторонних сервисов.

Читать далее

«Вы весь виски выпили?» — о чем говорили корифеи мира шахматных программ или как прошла ECAI-2024

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров2K

Три самолета, больше 12 часов в пути — и мы в Сантьяго-де-Компостела. Сюда выдающегося учёного и директора по науке Smart Engines Владимира Львовича Арлазарова пригласили выступить с небольшим докладом о том, как создавалась "Каисса". Хотите узнать, что ещё любопытного было на крупнейшей Европейской конференции по ИИ и причем тут виски? Заглядывайте под кат!

Причем тут виски??

Как мы перенесли распознавание на базе ИИ в веб и изменили веб-банкинг? А в Markswebb это оценили

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров1.3K

Привет, Хабр! Недавно аналитическое агентство Markswebb выкатило ежегодный рейтинг лучших веб-версий банковских приложений в 2024 году. Эксперты сравнили удобство и функциональность использования банковских услуг в браузере и выбрали банки с лучшими веб-приложениями по качеству клиентского опыта. Лидирующие позиции в обеих номинациях рейтинга - «Цифровой офис» (Digital Office) и «Цифровой банк для повседневных операций» (Daily Banking) - заняли наши клиенты!

Достичь крутых результатов удалось в том числе благодаря использованию систем распознавания Smart Engines. Рассказываем, как наши ИИ-решения помогли ведущим банкам поставить новые рекорды в сфере цифрового гостеприимства. 

Добро пожаловать!

Со вкусом ацетона: Как ИИ чуть не отравил программистов темным ПИВОМ

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров12K

Привет, Хабр! На связи Smart Engines с новым экспериментом. Помните, мы проверяли адекватность, реальность и убедительность советов искусственного интеллекта на примере рекомендаций светлого нефильтрованного пива? (Если не читали - бегом читать тут). Сегодня на очереди темное: выясним, что рекомендуют популярные нейросети и насколько выбор ИИ совпадает с человеческим.

В качестве подопытных кроликов - чат-боты от OpenAI, Яндекса и Сбера. В качестве независимого жюри, которому придется дегустировать пиво, - команда экспертов Smart Engines. Запасайтесь закусками, эксперименты начинаются!

Узнать подробности

Адские условия: Самый суровый краш-тест технологии распознавания паспорта

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров2.2K

Как вы знаете, в ситуациях, когда необходимо быстро и безопасно обработать данные паспорта и любых других документов, технологии распознавания Smart Engines творят настоящие чудеса. Качеству и надежности нашей технологии доверяют лидеры цифровой трансформации: госведомства, ведущие банки, аэропорты, промышленность и бизнес. Мы ценим доверие наших клиентов, а для вас, дорогие читатели, решили наглядно показать эффективность наших систем. Так сказать, лучше один раз увидеть, чем сто раз услышать. Летс гоу!

Читать далее

Какое пиво любит ИИ? Что советуют популярные чат-боты и нравится ли это программистам

Уровень сложностиПростой
Время на прочтение15 мин
Количество просмотров4.4K

Пусть прошлое раскрошитсяволною о причал, мы вспомним всё хорошее, забудем про печаль. Привет, Хабр! Сегодня поговорим о популярных чат‑ботах, их эффективности и… пиве! Кто‑кто, а уж за поводом выпить мы в Smart Engines в карман не полезем. На этот раз мы решили поддержать немецких коллег, устроить себе локальный Октоберфест, а заодно и протестировать известные нейросети: они будут помогать нам в выборе марок пива, а мы — проверять убедительность, реальность и адекватность их ответов.

Помните кейс про семью из Британии, отравившуюся грибами после прочтения пособия для грибников, написанного нейросетью? А что насчет жидкого золота?

Мы попросили генеративный ИИ от разных разработчиков составить свой топ-5 лучших видов светлого нефильтрованного пива. Нефильтрованного — в честь нашего нового Telegram‑канала «ИИ нефильтрованный». Вашему вниманию представляется пьеса в четырех частях. Главные герои: ChatGPT, Алиса Pro (она же YandexGPT), GigaChat от Сбера и команда независимых экспертов аналитического центра Smart Engines. 

Что было дальше?

Ближайшие события

Итоги ICDAR-2024: Как и зачем нужно делать распознавание объяснимым

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров832

В солнечных Афинах завершилась конференция ICDAR-2024. Причиной ли тому средиземноморское солнце или живой энтузиазм выступающих, но здесь было действительно жарко. Что неудивительно - ведь это главное международное мероприятие, посвященное вопросам распознавания. Одна из ключевых тем встречи – современные вызовы и перспективы OCR. Ведущие ученые со всего мира сошлись во мнении, что технологии распознавания жизненно необходимо сделать более понятными и интерпретируемыми. А для этого создать простую OCR явно недостаточно.

Нам в Smart Engines есть что добавить по этому поводу. Рассказываем, зачем нужно “объяснять” OCR и как это правильно сделать.

Объясняем тут

IDP и OCR в вопросах и ответах: Главное, что нужно знать

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров1.5K

Когда мы готовили этот материал, долго спорили, с какими персонажами можно было бы для наглядности сравнить OCR и IDP. Предлагались братья Коэны, Тор и Локи, Цезарь и Брут и много кто еще. Как видите, к одному мнению на этот счет мы в Smart Engines так и не пришли.

Зато абсолютное единство было достигнуто по другому вопросу - о природе OCR и IDP. И если с культурными сравнениями еще можно поспорить, то в технологическом аспекте мы знаем все по фактам. Опустим высокие метафоры и расскажем, что такое OCR и IDP и на чьей стороне правда.

Узнать, где правда 🔍

Выбираем систему распознавания: 20 вопросов, которые нужно задать вендору перед внедрением

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров793

Сориентироваться на рынке технологий распознавания документов – задача непростая. А отнестись к выбору системы стоит, между тем, ответственно: от надежности разработчика ПО зависит, будет ли решение функционировать без сбоев и будет ли работать вообще. 

Чтобы в дальнейшем дорогостоящее IT-решение не разочаровало – мы, Smart Engines, подготовили универсальный чек-лист. Он поможет вам минимизировать риски (спойлер: их немало) при выборе разработчика системы оптического распознавания текста и подобрать оптимальное решение.

Читать далее

Дубликат бесценного груза: История распознавания паспорта РФ от нулевых до наших дней

Уровень сложностиПростой
Время на прочтение15 мин
Количество просмотров1.9K

Сегодня технологиями распознавания паспорта никого не удивишь. Банки, операторы сотой связи, нотарусы и многие другие с их помощью упрощают и ускоряют рутинные процедуры: оформление кредита, приобретение полиса, покупку SIM-карты и так далее. Между тем, программные продукты для ввода данных из паспорта РФ за последние два десятилетия прошли большой путь. Мы в Smart Engines занимаемся этим не первый год и рассказываем, с чего все начиналось.

Окунуться в историю

Даешь киберспорт! 50 лет победе «Каиссы» в первом чемпионате мира по шахматам среди компьютерных программ

Время на прочтение10 мин
Количество просмотров1.7K

8 августа 2024 года исполняется полвека с момента победы советской шахматной программы в первом чемпионате мира по шахматам среди компьютерных программ. В честь этого события поговорим о феномене компьютерных шахмат, советском искусственном интеллекте и грандиозном триумфе «Каиссы».

Читать далее

Кручу, верчу, выровнять ось вращения хочу! Или о том, как ось вращения объекта автоматически выравнивается в STE

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров595

Хабр, жаркий июльский привет тебе от отдела компьютерной томографии компании Smart Engines! Раньше мы тебе рассказывали о задаче поиска положения смещенной и наклоненной оси вращения объекта в компьютерной томографии. Мы обещали рассказать о нами разработанном методе решения этой задачи, и вот, мы здесь! Мы вернулись к тебе с опубликованной статьей о нашем методе и с полученным патентом РФ!

Читать далее
1
23 ...