Прям готового продукта по созданию «идеальной» фотографии без бликов и других артефактов у нас нет. Зато у нас есть технология создания интегрированных результатов распознавания по нескольким фото. Кроме того, мы уже сделали качественную склейку панорамы. Если надо именно собирать результирующее изображение — обращайтесь.
Тут все очень просто. Мы собрали небольшой датасет и оценили своё решение и два известных открытых. Кроме того, наш движок, хоть на миллиарде фото из интернета, можете самостоятельно испытать, просто скачав мобильное приложение — https://apps.apple.com/ru/app/smart-idreader/id1157877082
1. Все наши продукты умеют распознавать видеопоток в режиме реального времени. Не исключение и Smart Code Engine.
2. В данном случае мы сравнивали качество работы разных систем распознавания на отдельных кадрах.
3. Теперь насчет качества и количества ошибок. Из таблицы видно, что Smart Code Engine ошибается на 1% изображений, а Zxing — на 19% изображений.
Это хорошие алгоритмы, и мы их не просто используем, но и успешно развиваем. Сама по себе картинка от применения алгебраического метода лучше, конечно, не станет. Но в них можно использовать регуляризацию, и это действительно помогает. Мы первыми в свое время предложили использование нелинейного фильтра в качестве косвенного регуляризатора в алгебраике. В любом случае, алгебраические методы чрезвычайно вычислительно затратны. Мы работаем над получением высокоточных реконструкций быстрыми алгоритмами, в т.ч. комбинацией быстрого дискретного преобразования Радона и нелинейных нейросетевых сверток (доложено на международной конференции, ждем выхода просидингов). Вот это уж точно нынешний век. А обратная проекция (20-ые годы), о которой сказали вы, но не используем мы, свертка и обратная проекция (60-ые), о которой говорим мы, и алгебраические методы (Кочмарж — 37-ой, ART — 70-ый) — это все прошлый век без исключений. Что же касается Астры — спасибо, «до слез». Мы обязательно передадим ваши слова Йосту Батенбургу и Яну Сиберсу, они порадуются.
GUI делали сами, на Qt. Так как все библиотеки кроссплатформенные (и наш движок, и QT) — собираем под разные ОС (начиная с MS Windows и заканчивая ОС Эльбрус)
У нас такая стратегия продаж, мы привлекаем и конкурируем не ценой, а качеством. Вообще, это привычная практика для b2b, когда в сложном продукте есть масса нюансов и прайс без консультации может ввести в заблуждение.
Да, в какой-то мере это является следствием растрового формата. Тем не менее, в векторе или же при предобратке картинок/звуков/чего угодно чем-то проблема, вероятно, сохранится.
Нет, и вряд ли будет, так как сети будут обучать дальше, увидят ваши свежие «отравленные» фото и тогду уже и на них обучат. К тому же, вот вы, допустим, на все свои фото добавили какой-то триггер (например, штамп на лбу), мешающий классификации, а другой человек такой же триггер добавил лишь на часть своих фото, и вот уже сеть знает, что триггер не важен.
Про зашумленность, если она бывает, автомат знать должен, иначе обучающая выборка у вас была нерепрезентативная. Понимание окружающего мира, вероятно, необходимо для человека (хотя не факт, спросите нескольких знакомых, что нынче творится в мире и вряд ли услышите одинаковые ответы), но точно не обязательно в искусственном интеллекте, направленном на решение конкретной задачи.
Условно, Вы, конечно, правы. Все нейросети можно, в целом, представить как многослойный перцептрон, и многие из них используются для обработки самых разных сигналов, в том числе, изображений.
Вот только все широко используемые методы машинного обучения — это детерминированные от входа функции, и для всех них используются ограниченные выборки, а значит, перечисленные атаки опасным для них всех. Дело лишь в простоте подбора и очевидности таких атак.
Мы не используем внешних пакетов кроме EML, а версия компилятора указана в табличке, как и версия ОС. Версию EML попробуем уточнить, но мы всегда используем рекомендованную МЦСТ под тип процессора. А скорость — коллеги работают над оптимизацией своих библиотек, что похвально.
Вы абсолютно правы! Кроме прочего, мы готовим к публикации расширение формата DICOM-CT-PD, позволяющего хранение сырых данных и необходимой для реконструкции мета-информации. Что касается мгновенности обработки, то это верно только для линейных моделей реконструкции. «Безартефактные» алгоритмы бывают очень ресурсоемкими.
Для отрисовки, однозначно, лучше всего подходят GPU — они для этого созданы. А вот для вычислений все зависит от алгоритмов(упс) и часть алгоритмов хорошо «ложится» на GPU, а многие совсем нет. В своих работах мы используем ресурсы GPU, по мере необходимости и если это эффективно. Но ориентироваться только на них мы считаем глупостью.
Отдельно здесь тоже выкладываем: habr.com/ru/company/smartengines/blog/539956
Тут все очень просто. Мы собрали небольшой датасет и оценили своё решение и два известных открытых. Кроме того, наш движок, хоть на миллиарде фото из интернета, можете самостоятельно испытать, просто скачав мобильное приложение — https://apps.apple.com/ru/app/smart-idreader/id1157877082
2. В данном случае мы сравнивали качество работы разных систем распознавания на отдельных кадрах.
3. Теперь насчет качества и количества ошибок. Из таблицы видно, что Smart Code Engine ошибается на 1% изображений, а Zxing — на 19% изображений.
Вот только все широко используемые методы машинного обучения — это детерминированные от входа функции, и для всех них используются ограниченные выборки, а значит, перечисленные атаки опасным для них всех. Дело лишь в простоте подбора и очевидности таких атак.