Как стать автором
Обновить
0
0

Пользователь

Отправить сообщение

ИИ-система по извлечению информации со сканов счетов: от разметки до реализации

Время на прочтение6 мин
Количество просмотров1K

Для автоматизации бизнес-процессов часто требуется обработка бумажных документов со сложной структурой — например, счетов, накладных и так далее. Частый сценарий: есть почтовый ящик, на который поступают сканы оплаченных счетов. Этот почтовый ящик разбирается, и информация о счете и дате оплаты вносится в ERP. Однако разбирать такие документы вручную — процесс длительный и трудоемкий. Решение в данном случае может предложить искусственный интеллект.

В этой статье мы подробно рассмотрим наш подход к разработке системы, которая распознает информацию с бумажных счетов с помощью технологий компьютерного зрения и машинного обучения.

Читать далее
Всего голосов 6: ↑6 и ↓0+8
Комментарии0

Внешняя видеокарта backend-разработчика, или как заставить лучшего друга перестать тупить и начать помогать (часть 2)

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров5K

В первой части статьи я описывал свой опыт использования локальных моделей при разработке кода. В частности, столкнулся с тем, что без видеокарты скорость работы ollama была достаточно низкой. Далее постараюсь рассказать про техническую часть подключения внешней видеокарты к ноутбуку, работающему на Linux.

Читать далее
Всего голосов 33: ↑31 и ↓2+36
Комментарии28

Редактор изображений для Arduino

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров3.6K

В этой статье я расскажу, как из проекта по созданию метеостанции на Arduino родился проект графического редактора для подготовки bitmap-картинок.

Если в ваших Arduino-проектах используется монохромный OLED-дисплей (например, SSD1306), эта статья поможет вам упростить процесс подготовки картинок для него.

Читать далее
Всего голосов 14: ↑14 и ↓0+18
Комментарии3

Автоматизация набора воды в чайник и кофемашину

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров11K


Зачем всё это?


Я пью много кофе и мне хотелось бы минимизировать свои временные затраты на приготовление напитка автоматизировав набор воды в чайник и кофемашину.

Требования:
  • Минимум организационных вопросов, максимальная автономность.
  • Минимум физических усилий.
  • Чистая вода.
  • Простое решение без вмешательства в электронику техники.
  • Защита от протечек.
  • Простота реализации.
Читать дальше →
Всего голосов 30: ↑28 и ↓2+36
Комментарии98

Софт на диете: как мы в DCAP OCR разгоняли

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров599

Привет!

Мы в «СёрчИнформ» 20 лет создаем софт для защиты информации и постоянно его оптимизируем. Например, последовательно работаем над ресурсоемкостью продуктов (низкая нагрузка на оборудование – важное преимущество для заказчиков), и придумали в этом направлении много удачных (не только наше мнение) решений.

Запускаем серию постов об этом. Сегодня – о том, как пересобрали архитектуру OCR в нашей DCAP-системе (файловом аудиторе), чтобы ускорить анализ изображений, не перегружая серверы и пользовательские ПК. 

Читать далее
Всего голосов 4: ↑4 и ↓0+5
Комментарии0

Итоги ICDAR-2024: Как и зачем нужно делать распознавание объяснимым

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров566

В солнечных Афинах завершилась конференция ICDAR-2024. Причиной ли тому средиземноморское солнце или живой энтузиазм выступающих, но здесь было действительно жарко. Что неудивительно - ведь это главное международное мероприятие, посвященное вопросам распознавания. Одна из ключевых тем встречи – современные вызовы и перспективы OCR. Ведущие ученые со всего мира сошлись во мнении, что технологии распознавания жизненно необходимо сделать более понятными и интерпретируемыми. А для этого создать простую OCR явно недостаточно.

Нам в Smart Engines есть что добавить по этому поводу. Рассказываем, зачем нужно “объяснять” OCR и как это правильно сделать.

Объясняем тут
Всего голосов 6: ↑6 и ↓0+6
Комментарии0

Компьютерное зрение в автотестах. Поиск элемента по фото

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров2.3K

В автотестах для web-приложений, мы привыкли искать элементы по селектору. Это обязывает наделять html-элементы уникальными атрибутами, будь то класс или data-атрибут. Но когда проект становится достаточно большим, команда начинает задумываться над сокращением размера index.html, чтобы переходя по ссылке пользователь как можно быстрее получил полезную для него информацию. Тут-то и начинается гонка за каждый байт и каждую миллисекунду и необходимость любого «лишнего» символа в html разметке ставится под сомнение. В такие моменты data-атрибуты для автотестов это первые кандидаты на удаление из конечного html. Уже довольно давно я думал о том как же находить элементы на странице не привязываясь к DOM-дереву, результатом этих поисков является плагин, который я написал для Cypress. О нем, и о подходе, который в нем применяется, пойдет речь в данной статье.

Читать далее
Всего голосов 2: ↑2 и ↓0+6
Комментарии1

Делаем умный кондиционер еще умнее

Уровень сложностиПростой
Время на прочтение16 мин
Количество просмотров13K

В статье расскажу как можно отправлять текущую температуру с внешнего датчика кондиционеру и как можно управлять обычным кондиционером через умный дом с помощью ESPHome и HomeAssistant.

Читать далее
Всего голосов 8: ↑8 и ↓0+12
Комментарии32

Практическое применение эффекта полного внутреннего отражения с потерями

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров8.8K
Картинка Quality House Life Store, ZHIQIAO Glowing Party Store, Youtube-канал «Techmoan»

Задумывались ли вы о том, что вокруг нас, в технике широко применяется интересное физическое явление, на базе которого вы и сами сможете собрать множество интересных самоделок?

И именно об этом и будет наш рассказ…
Читать дальше →
Всего голосов 57: ↑56 и ↓1+82
Комментарии23

Как научить компьютер различать цвета?

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров1.2K

Привет, Хабр!

Думаю, все заметили, что технологии компьютерного зрения и искусственного интеллекта появились во многих сферах нашей жизни. Аналитика изображений применяется на производстве, в медицине, в системах управления, в географии.

В сфере спорта также не обошлось без компьютерного зрения. Современные технологии используются для анализа игр и стратегий, предоставляя тренерам и спортсменам ценную информацию, которую сложно или невозможно получить вручную. В частности, в футболе компьютерное зрение используется для трекинга, детектирования действий игроков, вычисления их скоростей и решения многих других задач. Аналитика матча вручную может занимать много времени и требует внимания квалифицированных специалистов, а технологии компьютерного зрения позволяют значительно автоматизировать и оптимизировать процессы.

Одна из задач, которая была поставлена в рамках нашего проекта по футбольной аналитике, заключается в определении команды, к которой принадлежит конкретный игрок. Для человеческого глаза эта задача — проще некуда. Достаточно посмотреть на цвет формы игрока, чтобы понять, в какой он команде. Однако как научить компьютер автоматически понимать цвет? Оказалось, что в общем случае эта задача совсем не тривиальна.

Изначально были попытки обучить на размеченных данных классические детекторы объектов, например, YOLO. Однако оказалось, что модель сильно усложняет задачу — начинает ориентироваться на расстановку игроков, и из-за этого точность становится невысокой. Поэтому возникла идея попробовать более классические и, соответственно, более простые алгоритмы.

Читать далее
Всего голосов 7: ↑7 и ↓0+14
Комментарии3

«По вертикали и по горизонтали»: как перенести бумажные сканворды в онлайн, чтобы решать с друзьями на удаленке

Время на прочтение9 мин
Количество просмотров12K

Несмотря на развитие технологий, журналы с кроссвордами, сканвордами и судоку до сих пор актуальны. Бумажную версию удобно разгадывать или в одиночку, или с людьми, которые непосредственно рядом. Но что делать, если хочется разделить процесс с друзьями, которые находятся далеко? Обратиться к технологиям, конечно.

Как оцифровать сканворд по фотографии? Насколько сложно сделать систему общего доступа? Действительно ли интересно разгадывать бумажные сканворды на электронном устройстве? Ответы на эти и другие вопросы — под катом.
Читать дальше →
Всего голосов 71: ↑71 и ↓0+89
Комментарии9

Локальное голосовое управление

Время на прочтение4 мин
Количество просмотров4.8K

Я не художник...

Привет. В очередной раз задумался о локальном голосовом управлении устройствами умного дома, а тут как раз наткнулся на статью @CyberexTech "Моя безумная колонка" - https://habr.com/ru/companies/timeweb/articles/772080. Их там две части. Я тоже запускал на распбери готовые проекты типа voice2json, но все это оказалось не о том, речь распознавалась, но дальше никакого движения. А тут статья от Кибертеха (мне проще его так называть). Очень интересный проект показался, особенно после видео довольно быстрого распознавания воксом голоса, но дочитав до конца я понял, что это опять не то, нам-то нужно чтобы включалось/крутилось всякое железо, навешанное на умный дом, типа лампочек и кондиционеров, а в статье это оказалось как-то очень усложненно и неявно. В общем решил сам попробовать что-нить запилить. А самая хохма в том, что я не программист и писать код не умею, но у нас теперь есть программист от бога, которого называют ChatGPT. Пришлось обращаться к нему.

Читать далее и так далее
Всего голосов 7: ↑4 и ↓3+3
Комментарии6

Создание плагина для распознавания текста на иврите: мой опыт и решения

Время на прочтение3 мин
Количество просмотров1.3K

Всем привет! Хочу поделиться недавним проектом, в котором я разрабатывал плагин для распознавания текста на иврите. Задача была непростая, особенно учитывая, что клиент уже пытался использовать Tesseract OCR, но точность распознавания оставляла желать лучшего. В этой статье расскажу о том, с какими трудностями я столкнулся и как их преодолел.

Читать далее
Всего голосов 6: ↑4 и ↓2+3
Комментарии9

Демистифицируем парсинг PDF: конвейерная обработка

Время на прочтение22 мин
Количество просмотров3.6K

Преобразование неструктурированных документов, таких как PDF-файлы и отсканированные изображения, в структурированные или полуструктурированные форматы является важной составляющей искусственного интеллекта. Однако из-за замысловатой природы PDF-файлов и сложности задач, связанных с парсингом PDF, этот процесс не кажется на первый взгляд таким уж очевидным.

Этот цикл статей посвящен демистификации парсинга PDF. В предыдущей статье мы описали основную задачу парсинга PDF, классифицировали существующие методы и дали краткое описание каждого из них.

В этой статье мы сосредоточимся на конвейерном подходе. Мы начнем с обзора самого метода, затем продемонстрируем несколько стратегий по его реализации на примере готовых фреймворков, специализирующихся на этой задаче и, наконец, проанализируем полученные результаты.

Читать далее
Всего голосов 11: ↑9 и ↓2+7
Комментарии3

Управляем нашей лодкой прямо с веб-страницы на телефоне

Уровень сложностиСредний
Время на прочтение21 мин
Количество просмотров2.5K

Итак, мы будем делать автопилот для лодки, который будет содержать довольно простую механическую часть, а все вычисления будут производиться прямо в веб-приложении браузера.

Короче, идем под кат, я все расскажу.
Всего голосов 6: ↑6 и ↓0+10
Комментарии7

Каждая капля на счету или как я счетчик умным делал

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров15K


Привет, Хабр!

В предыдущей статье я уже описывал бюджетное решение для интеграции электросчетчика в системы умного дома, где всё было реализовано на базе своего DIY устройства. Но не только из электросчетчика состоит «домашний» учет энергоресурсов, поэтому в данной статье хочу поделиться личным опытом разработки аппаратного устройства для интеграции бытовых счетчиков воды в системы домашней автоматизации. Присоединяйтесь, будет интересно!
Читать дальше →
Всего голосов 36: ↑36 и ↓0+46
Комментарии58

Улучшение зрения роботов: саккады

Время на прочтение15 мин
Количество просмотров3.7K


Современный мир пока сложно назвать эпохой робототехники. Да, есть много роботизированных устройств, помогающих как в быту, так и на производстве, множество разработок и идей, но для полноценной реализации роботов в стиле Айзека Азимова предстоит преодолеть немало сложностей. Одной из таких является зрение. Современные камеры, хоть и обладают невероятными возможностями, все же несравнимы с человеческим глазом. Наши глаза совершают мелкие непроизвольные движения (саккады), дабы поддерживать четкое и стабильное изображение с течением времени. Ученые из Мэрилендского университета (Колледж-Парк, США) разработали камеры, имитирующие саккады, что разительным образом улучшает их способность отслеживать передвигаемые объекты. Из чего сделаны новые камеры, как именно они работают, и насколько они эффективны? Ответы на эти вопросы мы найдем в докладе ученых.
Читать дальше →
Всего голосов 28: ↑28 и ↓0+37
Комментарии4

И снова клон десктопного клиента Telegram

Время на прочтение5 мин
Количество просмотров11K

Казалось бы, сколько их уже есть, зачем еще один? Но случилось совпадение многих вещей - у меня было свободное время, желание что-то сделать, неудовлетворенность работой официального клиента и нежелание изучать существующие альтернативные версии и перечень их отличий. В результате я реализовал свой Луна-парк, с нужными мне фичами. Подробнее под катом.

Читать далее
Всего голосов 8: ↑7 и ↓1+7
Комментарии14

Как обновить ноутбук при помощи 3-d принтера

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров21K

Здравствуйте меня зовут Дмитрий. Как известно модернизировать можно только десктопы. Ноутбуки-же в случае устаревания просто выбрасываются на помойку. Но сегодня я расскажу вам про свой опыт модернизации ноутбука. И мне для этого понадобился всего лишь 3-d принтер.

Знаете многие люди ругают фирму Intel за то что она каждые два года выпускает новый сокет, аргументируя это тем, что энергопотребление новых процессоров выросло столь значительно, что старый сокет просто неспособен передать достаточную мощность на новый процессор. Но некоторые люди видят в этом запланированное устаревание для материнских плат, что-бы люди почаще покупали новые платы, а не сидели из года в год на одной и той-же.

Дак вот ситуация с ноутбуками ещё более ужасна. Если у вас устарел ноутбук, то нельзя поменять процессор с материнской платой, надо выкинуть старый ноутбук и купить новый. И это ужас, ведь например у меня остался старый ноутбук в котором работает матрица и клавиатура и SSD, и все это я получается должен выкинуть на свалку. Но благодаря тому что у нас есть 3-d принтер мы можем разорвать этот ужасный порочный круг. Итак давайте приступим.

Читать далее
Всего голосов 68: ↑66 и ↓2+84
Комментарии58

Атрибутивное распознавание документов

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров3.1K

Многие компании, несмотря на переход на электронный документооборот, всё равно сталкиваются с задачами автоматизации ввода информации с бумажных документов. Все они хотят избавиться от этой рутинной операции, и внедряют системы атрибутивного распознавания. На практике, часто оказывается, что такие системы не всегда соответствуют ожиданиям. Сегодня хочу обсудить подходы к решению задачи атрибутивного распознавания, а также проблемы с которыми я сталкивался за 10 лет практики в этой области. 

Многие забывают, что само распознавание документов не является конечной целью. Главная задача - это сократить человеческие трудозатраты на ввод информации с бумажных документов. т.е. в теории, если производительность человека на ввод информации магическим образом вырастет, то и распознавать ничего не надо.  Скорее всего, для этой магии нам конечно понадобится распознавание, но это лишь один из инструментов. 

Так как же сократить трудозатраты?
Всего голосов 1: ↑1 и ↓0+3
Комментарии2

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность