Как стать автором
Обновить
117.54
Smart Engines
Обработка изображений, распознавание в видеопотоке
Сначала показывать

Российской OCR – 30 лет. Как появилась технология, благодаря которой мы забыли про ручной ввод? (Часть 2. OCR CuneiForm)

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров3.1K

В честь 30-летия OCR мы продолжаем вспоминать, как появились первые отечественные технологии распознавания текста. На прошлой неделе мы рассказали про самую первую такую программу – OCR Tiger, предназначавшуюся для оцифровки книг с целью их дальнейшего переиздания.

Сегодня речь пойдёт про другую OCR-систему – CuneiForm. Она была более продвинутой и умела гораздо больше: распознавала символы различных алфавитов на основе латиницы и кириллицы для европейских языков и языков стран СНГ, работала со смешанными русско-английскими текстами. Самое главное – CuneiForm отличалась огромной по меркам того времени скоростью: 1 страницу она распознавала примерно за 10 секунд. Разберемся, какие алгоритмы использовались в OCR, где применялась CuneiForm и какое дальнейшее развитие получили системы распознавания.

Читать далее
Всего голосов 15: ↑14 и ↓1+14
Комментарии7

Российской OCR – 30 лет. Вспоминаем, как появилась первая отечественная технология распознавания (Часть 1. OCR Tiger)

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров3.6K

В 2023 году первой российской коммерческой технологии распознавания текста исполнилось ровно 30 лет. В честь этой знаковой даты мы решили подготовить серию материалов о том, когда появились и что из себя представляли первые отечественные OCR. Кто был главными участниками в гонке по созданию систем распознаванию? Как так вышло, что в середине 90-х OCR была признана второй по значимости софтовой разработкой после ОС? Как выглядела первая OCR-ка для Mac? Ответим на эти и многие другие вопросы, присаживайтесь поудобнее.

Во время подготовки текстов мы побеседовали с директором по науке и душой нашей компании, доктором технических наук, профессором, членом-корреспондентом РАН Владимиром Львовичем Арлазаровым. Он – как, кстати, и еще несколько членов нашей команды Smart Engines – принимал непосредственное участие в создании первых систем автоматического ввода текста.  

Сегодня речь пойдет про OCR Tiger и про то, как эта система работает.

Читать далее
Всего голосов 12: ↑11 и ↓1+14
Комментарии2

О простом методе быстрого обновления абсолютных центральных моментов

Время на прочтение5 мин
Количество просмотров2.1K

Привет, Хабр! Иногда сидишь, решаешь задачу, и, в процессе решения, чтобы продвинуться на следующий шаг, нужно придумать как сделать что-то очень простое - ну, то что наверняка уже делалось тысячи раз другими людьми. Кинувшись в поисковик перелопачиваешь какое-то количество литературы и вдруг понимаешь что либо ты просто искать не умеешь, либо это действительно никто до тебя не делал, или делал но об этом не писал. В какой-то момент проще просто взять и решить задачу самому…

В этой заметке мы расскажем об одной такой задаче - простой, но которая нам понадобилась для кое-чего другого. Задача - придумать, как при увеличении наблюдаемой выборки быстро пересчитать ее абсолютный центральный момент.

Читать далее
Всего голосов 12: ↑11 и ↓1+16
Комментарии12

Рассеяние вокруг нас: что это такое и какое место оно занимает в компьютерной томографии?

Уровень сложностиПростой
Время на прочтение14 мин
Количество просмотров1.6K

Мы в компании Smart Engines разрабатываем томографическое программное обеспечение и стараемся делать это как можно качественнее, без появления на изображении реконструкции визуальных искажений, так называемых артефактов. Одной из причин возникновения артефактов является несоответствие модели  формирования изображения в измерениях и модели описания данных для алгоритмов томографической реконструкции.

 В классической постановке КТ описанием внутренней структуры образца служит пространственное распределение коэффициента ослабления рентгеновского излучения, причем зондирующее излучение считается монохроматическим. Однако в реальных установках это не так, существенное влияние на изменение модели формирования изображений оказывают эффекты второго порядка. Одним из которых является рассеянное излучение. Что такое рассеяние, каким оно бывает и как выглядят артефакты рассеяния в томографии, -  расскажем в сегодняшней нашей статье.

Читать далее
Всего голосов 6: ↑5 и ↓1+8
Комментарии3

Сладость или гадость?  Что покажет Smart Tomo Engine

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров915

Всем привет! Страшно соскучились по нашим читателям и решили порадовать вас очередной порцией ужасно красивых видео, которую мы подготовили к Хэллоуину. В этом году мы предлагаем вам погрузиться в атмосферу Хэллоуина с помощью нашей программы для томографической реконструкции и визуализации Smart Tomo Engine. В статье мы продемонстрируем удивительные реконструкции тыквы и других атрибутов праздника. А напоследок покажем самый что ни на есть хэллоуинский томографический кошмар – реконструкцию с тысячью артефактами, с которыми, кстати, мы уже умеем бороться!  Заинтриговали? Тогда вперед под каст.

Читать далее
Всего голосов 1: ↑1 и ↓0+1
Комментарии0

Искусственный кадровик: как ИИ может ускорить найм сотрудников, не подвергая их данные угрозе

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров1.3K

Число утечек персональных данных в России все время растет: новости об очередных инцидентах выходят так часто, что уже перестают вызывать удивление. Чаще всего жертвами утечек становятся клиенты компаний. Но иногда под ударом оказываются и их сотрудники. Такие случаи уже происходили

В этом тексте рассказываем, как с помощью ИИ можно ускорить процесс найма сотрудников в несколько раз, не подвергая их данные ненужным рискам, и почему в таких целях ни в коем случае нельзя прибегать к сервисам распознавания.

Читать далее
Всего голосов 4: ↑1 и ↓3-2
Комментарии2

Оценка пространственного разрешения при помощи фантомов

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров1.2K

В прошлой нашей статье про томографию мы задались вопросом: "А знаете, кто получает самую большую дозу при томографии?" Конечно, ответ мы получили: медицинские тестово‑калибровочные фантомы, специальные объекты, моделирующие структуру органов и тканей человека и используемые при разработке и тестировании медицинских приборов". В ней мы начали знакомство с медицинскими тестово-калибровочными фантомами, но тема оказалась настолько обширной, что этой статьей мы продолжаем серию публикаций. Сегодня отвечаем на вопрос: "Что такое пространственное разрешение и как его померить?"

Читать далее
Всего голосов 5: ↑5 и ↓0+5
Комментарии2

AI – это путь в топ: как региональный банк покорил крупный рейтинг

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров1.6K

Сотрудничество Банка «Кубань Кредит» и AI‑разработчика систем распознавания Smart Engines началось в прошлом году. Тогда Банк внедрил ряд технологий компьютерного зрения, которые усовершенствовали обслуживание клиентов в офисах и дистанционных каналах. Поставку технологий Smart Engines в Банк осуществляют специалисты компании АО «ФИНСИС».

В 2023 году журнал «Банковское обозрение» включил мобильное приложение «Кубань Кредит Онлайн» в число значимых IT‑ и ИБ‑проектов в финансовом секторе за 2022 год.

Как Банк «Кубань Кредит» достиг таких высоких результатов и что позволяет ему оставаться ведущей кредитной организацией Краснодарского края, мы расскажем в этом материале.

Читать далее
Всего голосов 7: ↑3 и ↓4+3
Комментарии3

Экспресс-курс по настройке распознавания форм: показываем, как это сделать за 2 минуты

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров1.4K

Привет, Хабр! Мы в Smart Engines постоянно пополняем список документов, которые под силу распознать нашим системам Smart ID Engine и Smart Document Engine. На сегодняшний день их количество исчисляется тысячами, но и это не предел. Новые документы на бумажных носителях продолжают возникать, а мы все так же успешно их распознаем. Причем распознаем очень быстро.

Добавлением новых документов, то есть настройкой всех подсистем для распознавания новых типов, мы обычно занимаемся сами. Ведь кто еще так хорошо знает, какую ручку нужно покрутить у нашей системы, чтобы все работало идеально. Однако в некоторых случаях пользователю может понадобиться самостоятельно добавить документы, которые требуется распознать. Например, если количество типов форм растет быстро, а распознавать их хочется уже сразу по мере появления. Или же когда по каким‑либо причинам пользователь не может нам предоставить даже один пример нужного документа. О том, что такое настройка распознавания формы и как это можно сделать самостоятельно буквально за пару минут, в этом тексте.

Читать далее
Всего голосов 4: ↑2 и ↓2+3
Комментарии2

Виртуальное облучение рентгеном

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров1.8K

Привет, Хабр! Как ты уже знаешь, в Smart Engines мы разрабатываем томографическое программное обеспечение. Компьютерная томография (КТ) – это неинвазивный метод исследования внутренних особенностей предмета. На сегодняшний день КТ является одним из основных томографических методов исследования внутренних органов человека, также КТ это перспективный инструмент для контроля качества в промышленности.

В рамках данной статьи читатель ознакомится с подходом к моделированию поглощения рентгеновского излучения в КТ и узнает роль линейных интегралов в синтезе трансмиссионных изображений.

Читать далее
Всего голосов 3: ↑3 и ↓0+3
Комментарии5

Банк в кармане: как МКБ применяет решения для распознавания Smart Engines

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров939

Московский кредитный банк (МКБ) уже три года применяет систему распознавания QR-кодов Smart Engines на смартфоне. Внедрение было визионерским: банк предвосхитил тренд на этот способ оплаты товаров и услуг.

Сегодня мы расскажем, как МКБ выбирал партнера по технологии распознавания, а также о том, каким образом банку удалось одним из первых в стране внедрить в мобильное приложение сканер номера телефона и как сейчас ИИ применяется в обслуживании клиентов вне офиса.

Читать далее
Всего голосов 1: ↑1 и ↓0+1
Комментарии0

Усы, лапы и QR-код – вот мои документы. Заменит ли цифровой паспорт бумажный и чем это обернется для компаний?

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров2.5K

На этой неделе президент РФ Владимир Путин подписал указ о цифровом паспорте. Хотя электронные документы, как уточнили в Минцифры, будут использоваться только в “отдельных” случаях, компаниям и организациям, похоже, вскоре придется всерьез озадачиться. Ведь новые цифровые паспорта, равно как и другие электронные документы вроде водительского удостоверения, необходимо как-то проверять. 

Разбираемся, что такое цифровой паспорт и когда его можно будет использовать, а также показываем, какое решение мы, компания Smart Engines, придумали для компаний. 

Читать далее
Всего голосов 2: ↑1 и ↓1+1
Комментарии4

Двухракурсная томография. Теперь — у вас в голове

Время на прочтение9 мин
Количество просмотров1.5K

Привет, Хабр! Всем давно известно, что мы в Smart Engines занимаемся компьютерной томографией (КТ) и развиваем Smart Tomo Engine (STE) - программу для томографической реконструкции и визуализации.

Результирующее томографическое изображение в КТ получается с использованием вычислительно затратных алгоритмов реконструкции, которые применяются к набору зарегистрированных двумерных рентгеновских изображений. Однако сегодня мы хотим рассказать не об алгоритмах КТ, а о том как можно попытаться обойтись без них, но все же увидеть объемное реконструированное изображение внутренней структуры изучаемого объекта. В статье мы расскажем, как с помощью правильно выбранных двумерных проекций построить в голове человека трехмерное изображение. А исходить мы будем из физических принципов восприятия человеком объемных изображений. Картинки прилагаются! По ним можно не только убедиться, что теория работает, но и вспомнить детство со стереопарами и анаглифом. Запасайтесь попкорном и 3D очками. Приятного прочтения.

Читать далее
Всего голосов 6: ↑5 и ↓1+8
Комментарии4

Близится старт продаж iPhone 15. Почему блокировка банковских приложений не должна вас останавливать?

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров4.9K

Презентация iPhone 15 – главное технологическое событие сентября. И чем ближе старт продаж – тем больше дискуссий на тему целесообразности покупки нового яблочного смартфона. В этом году в числе стоп-факторов оказался весьма любопытный пункт – блокировка мобильных приложений банков, попавших под санкции. 

Действительно, скачать приложения банков из App Store сейчас нельзя. Пытаться перенести их с одного устройства Apple на другое или установить его в обход магазина – тот еще квест, причем не самый безопасный. Но у нас для вас хорошая новость: выход есть. Если вам интересно узнать, как банки (правда, не все) о вас позаботились и решили эту проблему, а также причем тут мы, компания Smart Engines – заглядывайте под кат. 

Читать далее
Всего голосов 12: ↑3 и ↓9-3
Комментарии48

Распознаем паспорт РФ в PWA: быстро, качественно, без сервисов/без утечек

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров5.9K

Утечки персональных данных в России бьют все рекорды. За два года их совокупное число выросло – только вдумайтесь – в 40 раз. В 2021-м году таких инцидентов было всего четыре, в 2022 – свыше 140, а за первые семь месяцев 2023 года – уже 150.

Одним из возможных путей утечки является передача персональных данных на обработку третьей стороне. По сути, компания передает изображения удостоверяющих документов (паспортов или любых других) своих клиентов незнакомым людям, а что дальше происходит с данными – неизвестно.

Между тем, есть еще один способ ввода данных из документов – прямо на устройстве, без необходимости отправлять куда-то картинку. Он полностью исключает риск любой утечки. Речь идет о нашем мобильном SDK для распознавания паспорта. О том, как мы внедрили наш SDK в PWA (progressive web app), читайте под катом.

Читать далее
Всего голосов 8: ↑7 и ↓1+9
Комментарии15

Путешествие внутрь сундука знаний с помощью компьютерной томографии

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров1.3K

Привет, Хабр! Сегодня особый праздник – День знаний! Это день, пропитанный радостью и волнением, когда миллионы учеников возвращаются в стены образовательных учреждений. В честь этого мы хотим поделиться красивыми видео внутренней структуры объектов из школьного рюкзака. Мы увидели много интересного: от микросхемы калькулятора до того, какая игрушка находится в киндере и живут ли фиксики в точилке. В этом нам помогла наша программа Smart Tomo Engine (STE 2.0), в которой есть не только модуль томографической реконструкции, но и модули анализа и визуализации, с помощью которых были проведены эксперименты и сделаны те самые видео. Сегодня мы поделимся с вами историей о том, как маленькая девочка Даша попала в мир компьютерной томографии – мир, в котором можно «проникать» внутрь предметов без их разрушения. Интересно, как объекты из ее рюкзака оказались у нас?

Читать далее
Всего голосов 3: ↑3 и ↓0+3
Комментарии3

Кого первого исследуют при помощи нового томографа?

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров2.6K

В ходе прошедшей пандемии COVID-19 (помните такого?) стандартом в диагностике стала компьютерная томография лёгких. Многие делали её по нескольку раз и, конечно, возник вопрос в дозе, получаемой человеком при этой процедуре. А знаете, кто получает самую большую дозу при томографии? Это медицинские тестово-калибровочные фантомы, специальные объекты, моделирующие структуру органов и тканей человека, и используемые при разработке и тестировании медицинских приборов. В данной статье мы начнем рассказ о таких фантомах.

Читать далее
Всего голосов 6: ↑6 и ↓0+6
Комментарии4

Как встроить сканер баркодов от Smart Engines в браузер

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров1.1K

В последнее время наша компания серьёзно сосредоточилась на развитии распознавания документов в браузере - такой подход позволяет переложить часть проблем (например, с кроссплатформенностью и интеграцией) на плечи разработчиков браузера, позволяет полностью изменить подход к сохранности персональных данных (пользователь не выгружает свои данные на сервер для распознавания, а наоборот, загружает к себе модуль для распознавания изображений, содержащих его данные), а так же позволяет быстро реализовать фронтэнд-интеграцию силами web-разработчиков - в общем, всем хорош. Подобные плюсы уже оценили наши партнёры, нацеленные на развитие своих интернет-сервисов.

Одним из самых востребованных направлений в OCR сейчас является распознавание кодифицированных объектов, таких как баркоды, номера телефонов, банковских карт и прочие машиночитаемые зоны. В своё время мы выделили распознавание таких объектов в отдельный продукт Smart Code Engine для того, чтобы иметь возможность гибче работать с различными сценариями распознавания, а так же иметь возможность пойти дальше в деле оптимизации скорости и размера библиотеки. В результате появился Smart Code Engine 2.0 - продукт получил новый интерфейс и возможность максимально гибко настраивать поведение для получения лучшего качества распознавания. О том, как с его помощью развернуть распознавание баркодов в браузере, мы сейчас и расскажем.

Читать далее
Всего голосов 3: ↑3 и ↓0+3
Комментарии0

Платежи по QR-кодам бьют все рекорды — 40 млн трансакций в месяц. Текст про технологию, которую вы используете ежедневно

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров3.7K

Привет, Хабр! На связи Smart Engines.

Мы разрабатываем софт для распознавания документов, банковских карт и баркодов. Если у вас установлено мобильное приложение одного из этих банков – Альфа-Банка, ВТБ, Газпромбанка, МКБ, банка "Открытие", Райффайзенбанка, Росбанка или Тинькофф – и вы хоть раз расплачивались с помощью QR-кода, то вы пользовались нашими технологиями. 

Вместе с упомянутыми банками, в мобильных приложениях или интернет-банках которых интегрирован сканер QR-кодов Smart Engines, мы установили, что платежи по QR-кодам пользуются сегодня колоссальной популярностью. Только в июле клиенты этих банков с помощью нашего сканера QR-кодов совершили свыше 40 млн платежей. Мы ожидаем, что по итогам 2023 года совокупное количество таких трансакций и вовсе перевалит за 0,5 млрд. 

Рассказываем больше про этот платежный инструмент и, конечно, про нашу разработку для считывания QR-кодов. 

Читать далее
Всего голосов 10: ↑3 и ↓70
Комментарии25

Скрытая угроза: критерии классификации атак на нейронные сети

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров1.6K

Нейронные сети являются неотъемлемой частью нашей повседневной жизни и находят широкое применение в различных областях, включая системы распознавания (банковской, идентификационной и другой чувствительной информации), а также различные системы управления и обеспечения безопасности. Однако нейронные сети – всего лишь мощный инструмент обработки данных, у которого, как и у всякого инструмента, есть недостатки.

Узнать, какие
Всего голосов 3: ↑3 и ↓0+3
Комментарии1

Информация

Сайт
smartengines.ru
Дата регистрации
Дата основания
Численность
51–100 человек
Местоположение
Россия