Как стать автором
Обновить
72
25.8

Пользователь

Отправить сообщение

Продукт нашей компании - автономный SDK, который работает непосредственно на устройстве и осуществляет быстрый ввод данных при помощи распознавания. Ваши ценности и стандарты безопасности очень похвальны и совпадают с нашими принципами, а сравнение с Apple в чем-то даже льстит :)

Наши SDK по запросу клиента уже проходили внешний аудит у международной компании и были признаны безопасными. Но на самом деле и простой пользователь может убедиться в автономности нашей распознавалки - установив демо-программу на устройство, включив авиарежим перед первым запуском, проведением тестирования исключительно без сети, и удалив демо-программу до выключения авиарежима обратно.

Добрый день!

Мы не устанем повторять, что программное обеспечение Smart Engines НЕ сохраняет никакие данные, НЕ передает личные данные клиентов на обработку в сторонние сервисы и/или третьим лицам для ручного ввода — все обработка ведется в локальной оперативной памяти устройства, НЕ требует сетевого соединения. 

Чтобы убедиться в этом, проведите тестирование, скачав наше демострационное приложение и включив "Авиарежим" на своем смартфоне.

Smart Engines для iPhone;

Smart Engines для Android в Google;

Smart Engines для Android в RuStore.

Спасибо за ответ. Мы прокомментируем некоторые мысли:

1)  Покритикуем тезис  «идея ну совсем естественная». Для слов одной длины естественно применять что-то вроде метрики Хэмминга. Для сравнения двух слов длины K потребуется ровно K операций сравнения (вызовов функции substCost). В реализации Вашей идеи потребуется: преобразование каждого слова в матрицу и операции над матрицами (умножение матриц). Это будет существенно медленнее, чем с применением метрики Хэмминга, то есть для программиста не совсем естественно.

2)  «Более-менее понятно, как поступить с опечатками или "похожими" буквами типа И и Й или I, l, 1.» - было бы интересно узнать, что Вы предлагаете для множественных опечаток (нескольких подряд идущих опечаток)?

3)  «Непростой кажется процедура сравнения слов разной длины» - без такой процедуры отождествлять слова вряд ли получится. Если у Вас есть подробные соображения, было бы интересно их прочесть.

Здравствуйте. Мы поставляем SDK, который отдает мультиспектральные изображения в информационную систему нашего клиента – например, банка. Этот клиент, в свою очередь, может самостоятельно создавать свою базу данных мультиспектральных изображений.

Сначала прокомментируем последний абзац вашего ответа. Современные системы распознавания лиц упомянутой вами схемой никак не провести. Есть публичные отчеты – можете посмотреть, какое там качество. Такие "умельцы" уже давно отловлены.

Теперь перейдем к потребительскому кредитованию, когда представитель банка сидит в каком-то крупном магазине и дает кредиты за 5 минут. Какие документы он видит? Паспорт, анкету, права и, если повезет, справку о доходах физического лица. И все. Других документов нет. А рядом сидят другие банки и тоже хотят дать кредит.

Конечно, банк перекладывает все риски на потребителя, закладывая их в ставку. Но, позвольте, у нас же сейчас не один банк, и человек может выбирать, у кого взять деньги. И человек выбирает, ища более выгодные условия. Меньший процент, например. Соответственно, тот банк, который может предложить лучшие условия, будет выглядеть в глазах клиента более выигрышно.

Наверняка банк запросит кредитную историю того человека, которому принадлежит паспорт по реквизитам, и получит вполне симпатичного заемщика. Кроме того, у этого человека будет скорее всего нормальная соцсеть и все остальное, только придет за кредитом другой человек с модифицированным документом. Это кейс переклейки.

Теперь о подделке паспорта. Качественные подделки не так распространены, как переклейка, но если их делают, то обычно создают для снятия крупных депозитов. И когда мошенник приходит в банк, он знает все о своей жертве, а актерскому мастерству могут позавидовать звезды театров.

Добрый день!

В нашем программном продукте имеется специальный детектор для обнаружения следов фотошопа в цифровом канале.

Однако для сверки важно только лицо. Если на исходной фотографии не было изменений лица, а была изменена только одежда – в этом нет ничего страшного.

Но если человек вносит какие-либо изменения в паспорте — решение это увидит и об этом сообщит.

Вы или сами не до конца понимаете, или сознательно вводите людей в заблуждение.

Начнем с того, что для тех, кому нужно проверять паспорт, все изменилось кардинально. Если раньше было в общем-то все равно, как именно проверять подлинность документа, поскольку был расчет на сервис МВД, то сейчас это не работает. Нужно внимательно проверять каждый паспорт не только на подлинность бланка, но и, что самое важное, выявлять подмену фотографии. Если полная подделка сегодня – это редкость, то второй кейс – вообще-то уже обыденность.

Раньше если ваш паспорт украли или вы его потеряли, то МВД его автоматически помечало как недействительный и АБС (автоматизированная банковская система) поднимала тревогу. Теперь этого нет.

Более того, после появления паспорта в базе автоматически активировался процесс блокировки операций и банк обращался к клиенту с просьбой обновить данные. Теперь этого нет, и банк не может предотвратить мошеннические действия.

Наша система как раз и помогает банкам снизить накал страстей, а именно автоматически проверять паспорт на подлинность и на предмет переклейки фотографий. Кроме того, она позволяет банку предотвращать сговор сотрудника и мошенника. 

Добрый день!

Будет очень здорово, когда такая межбанковская база появится, но "жаль только – жить в эту пору прекрасную уж не придется – ни мне, ни тебе".

Здравствуйте!

Тут возможны два варианта. Первый – это сговор с оператором, потому что лицо-то в паспорте другое и система сверки лиц не может на это не указать. Второй – переклейка фото, а это мгновенно обнаружит уже наш софт Smart ID Engine 2.0.

Добрый день!

Среди наших клиентов, к счастью, идиотов нет. Наши клиенты прекрасно понимают, когда речь идет об одном и том же, а когда – о разном.

Приветствуем!

В ряде случаев проверить действительность паспорта можно не только через сервис МВД. 

Возьмем случай, когда паспорт недействителен ввиду смерти его владельца. Если человек с таким паспортом приходит в офис открывать счет или брать кредит, то возможны два варианта: либо мы имеем дело с чудом (тогда, конечно, разговор другой), либо с мошенником, который переклеил фотографию. Переклейка фотографии мгновенно обнаруживается нашим софтом Smart ID Engine 2.0. То же самое – если паспорт украден.

Конечно, если паспорт считается утерянным, а с ним в офис пришел тот же человек – отловить этот момент, к сожалению, не удастся. Но все же лучше, чем ничего.

В случае с цифровыми каналами – все аналогично. 

Добрый день! 

Все зависит от банковского продукта. Например, для осуществления денежного перевода от вас не потребуется ничего кроме паспорта. А для оформления кредита нужны паспорт, анкета, а также справка о доходах физлица (ранее 2-НДФЛ), которая в свою очередь «рисуется» элементарно. Поэтому, безусловно, панацеи нет, однако есть способы уменьшения боли.

Кроме того, может быть, вы не знали, но есть довольная распространенная практика – накрутка кредитного рейтинга. В этом случае мошенники по поддельному паспорту берут несколько маленьких кредитов и возвращают их, наращивая таким образом кредитный рейтинг, а затем берут уже крупную сумму денег и просто исчезают.

Добрый день! Благодарим за интерес к материалу.

1. Длины слов V и W - это |V| и |W|, соответственно. i  и j - это индексы от 0 до длины соответствующей строки.

2. Другим способом вычисления расстояния между словами является применение расстояния мультимножества. Если задан набор кодов всех возможных символов (алфавит), то любое слово можно представить в виде мультимножества, носителем которого является алфавит. Слово в виде мультимножества представляет собой не матрицу, а вектор. В этом векторе значение 0 в некоторой компоненте означает отсутствие соответствующего символа в слове. А ненулевая компонента – сколько раз символ присутствующих в слове. Расстояние (метрика) мультимножества для двух слов вычисляется как сумма абсолютных значений разностей значений компонент двух описанных векторов. Действительно, Это - стандартный подход к сравнению слов. Однако при применении метрики мультимножества оказываются идентичными слова с перестановками символов. Например, по этой метрики идентичны все слова: XYZ, XZY, YXZ, YZX, ZXY, ZYX.

Если Вы можете написать формулы для оценки близости слов с помощью сингулярного разложения матриц, мы можем обсудить эту идею подробно. Нам такой подход неизвестен.

Добрый день! Большое спасибо за ваш вопрос.

Отличие технологии контролируемой томографической реконструкции от низкодозовой компьютерной томографии (НДКТ) заключается в самом протоколе проведения томографического исследования.

В НДКТ протокол проведения исследования такой. Заранее заданное (фиксированное) количество томографических проекций снимается при “низкодозовом” режиме источника рентгеновского излучения, в измерительной схеме, минимизирующей дозовую нагрузку на каждый локальный объем зондируемого объекта. После того, как все проекции зарегистрированы, выполняется реконструкция цифрового изображения объекта. Качество такого изображения гораздо хуже, чем при съемке в “полнодозовом” режиме. На протяжении нескольких десятков лет после предложения использовать НДКТ ведется разработка специализированных алгоритмов реконструкции, способных повысить качество цифрового изображения, реконструированного из проекций при использовании “низкодозового” режима съемки. Если пролистать научные публикации, вышедшие в текущем году, то можно найти не одну работу на эту тему.

В предложенной нами технологии контролируемой томографической реконструкции использован иной подход. Перед началом съемки проекций мы не знаем, сколько проекций будет снято. Решение об окончании съемки принимается мониторинговой системой автоматически. Реконструкция цифрового изображения выполняется каждый раз после съемки очередной серии проекций. Если мониторинговая система сообщает о достижении требуемой точности реконструкции, съемка останавливается.

Решение об окончании съемки может быть принято в одном из трех случаев: достигнута требуемая точность реконструкции, “что-то пошло не так” или достигнут предел по дозовой нагрузке. “Что-то пошло не так” может означать сбой в работе оборудования или движение пациента, но главное – проблемный момент будет зафиксирован и сбор проекций будет остановлен в этот момент.

Ранее, если точность восстановленного изображения была признана недостаточной из-за наличия незадетектированных вовремя проблем, приходилось переснимать все проекции целиком, т.е. удваивать радиационную нагрузку.

Обратите внимание, что в нашей новой технологии все преимущества НДКТ (оптимизированные режим источника и измерительная схема) могут использоваться, при этом дозовая нагрузка может еще сократиться.

Добрый день! Благодарим за интерес к нашей публикации.

X-ray - это тип зонда, т.е. светят рентгеном. Рентгеновская компьютерная томография - это метод изучения внутренней структуры, в котором цифровое изображение внутренней структуры трехмерного исследуемого объема восстанавливается из набора двумерных изображений, зарегистрированных от объекта под разными углами. 

Из публикации, ссылку на которую Вы дали, за что большое Вам спасибо, не очень ясно: новая X-ray machine снимает одну или несколько рентгенограмм под разными углами. Если несколько, то это уже "томография". Мы в статье говорим о том, что траектория движения источника рентгена-регистратора для снятия рентгенограмм от объекта с разных сторон может быть произвольной.

Здравствуйте. Выводы прекрасны. И маленькое «но». Количество вокселей изменится в двух случаях:

  1. Если в конусно-круговой геометрии при повторном измерении вы установите ось вращения дальше от детектора или ближе к нему по сравнению с первоначальным положением.

  2. Если геометрия измерения осталась прежней, но часть объекта куда-то делась (откололась, растворилась, биорезорбировалась и т.л.).

Приветствуем! Спасибо за ваш комментарий!

Ваш опыт сопоставления слов распознанного текста с текстом из pdf очень интересен! Было бы интересным почитать или провести эксперименты, связанные с тем, что слова модель тоже могут содержать ошибки.

У нас цена удаления/вставки равна 1, поскольку удаление/вставка символа в распознанном слове чаще проявляется из-за ошибок распознавания нескольких подряд  идущих символов. То есть не было необходимости особым образом реагировать на такие ошибки.

В статье не рассмотрены ошибки поиска слов: когда слово при распознавании разбито на части (лишние пробелы) или когда объединились несколько слов (потеря пробела). Кстати, такие случаи возможны не только из-за распознавания, иногда в деловых документах между словом статического текста и словом заполнения в самом деле отсутствует пробел.

Добрый день! Благодарим!

Было бы интересно узнать, какую задачу анализа текстов Вы решали? Предложения уже были выделены или извлекались динамически?

В некоторых задачах мы ищем n-граммы (n – от 2-х до 5-ти) в строке с удаленными пробелами. Наш опыт показывает, что без штрафов f(G(V), W) здесь не обойтись.

Службы безопасности наших клиентов проводят проверку ПО на наличие закладок, вредоносного кода и отсутствие связи с внешним миром. Более того, мы сами заказываем аудит наших программ для выявления возможных рисков.

Информация

В рейтинге
Не участвует
Работает в
Зарегистрирован
Активность