VoiceReader — читаем вслух

Делаем на c# репетитора по чтению вслух на 20+ языках.
Идея простая: открываем текст на (почти) любом интересующем языке, и читаем в микрофон. Все распознанные слова в тексте помечаются цветом.
User

Делаем на c# репетитора по чтению вслух на 20+ языках.
Идея простая: открываем текст на (почти) любом интересующем языке, и читаем в микрофон. Все распознанные слова в тексте помечаются цветом.

Привет, Хабровчане!
Это продолжение моего дневника разработки DIY струйного принтера предыдущая часть:
DIY Open Source принтер. Часть 0
В прошлый раз одной из поднятых проблем стал интерфейс между ПК и устройством. В данной статье я постараюсь решить вопрос подключения STM32 по USB и убедить Windows и Linux что это принтер.
Содержание
§1. Кратко о USB
§2. Поиск реализаций USB Printer Class для STM32
§3. Реализация USB Printer Class для STM32
§4. Тест на Windows
§5. Тест на Linux
§6. Как добавить поддержку печати изображений?

Информация об этой ошибке в интернете есть, но она крайне разрозненная. Где-то — только часть советов, а в большинстве случаев — обсуждение заканчивается ничем. Пара примеров: здесь и здесь. Поэтому захотелось собрать всё в одном месте. Даже если я частично повторю чью-то статью или мысль, считаю, что подобные посты стоит обновлять, чтобы актуальные и работающие решения всегда были под рукой.
Поэтому решил собрать здесь всё, что узнал — чтобы и у тех, кто столкнется с этим, процесс прошёл безболезненнее и самому через следующие 7 лет обратиться к рабочему (на данный момент😃) способу и понять, изменилось ли что-то.
Для каждого пункта выведена рабочая рекомендация

Где взять пару миллионов документов с разметкой для обучения модели ИИ? Сгенерировать синтетически! Меня зовут Никита, я работаю в ИСП РАН и веду блог по ИИ. Выложил в открытый доступ проект, который поможет дата-саентистам самостоятельно создавать датасеты сканированных документов с разметкой, используя только CPU. Подойдет для предобучения мультимодальных трансформеров, OCR и проч.

PTTJS - plain text table javascript, формат разработанный из личной необходимости и острой нужды.
Главная цель формата PTTJS - получить текстовый формат таблиц, который позволяет хранить более сложные таблицы, нежели существующие форматы, но при этом сохранять читаемость и текстовую основу.
Уже написаны JS библиотека с парсером и сериализатором, а также Obsidian плагин.

Разрабатываем робота с нуля - от ИИ-дизайна до полного проектирования и реализации всех компонентов устройства.
Зачем? Ради фана, конечно - этот проект практически квинтессенция моих увлечений - электроника, 3d-печать, программирование микроконтроллеров, ИИ и в целом все, что можно включить в сферу DIY.
Но если уж придумывать практическое обоснование - то было бы удобно иметь возможность из отпуска покататься по квартире и проверить, выключен ли утюг, не заливают ли квартиру соседи. Но ключевое, конечно - покататься.

В одном из комментариев к статье о приложении SMD CODES было предложено сделать отдельное приложение о микросхемах питания DC-DC (импульсные преобразователи напряжения).
В мире электроники и проектирования устройств DC-DC преобразователи играют ключевую роль. Они позволяют эффективно преобразовывать напряжение, что особенно важно для портативных устройств и бытовой технике. Однако, выбор подходящей микросхемы DC-DC преобразователя может быть сложной задачей, особенно для начинающих инженеров. Именно для таких случаев было разработано новое приложение для Android — мощный справочник по DC-DC микросхемам с функцией подбора по параметрам.

Когда я начал свой путь в парсинге, мне в голову сразу пришла идея написать клиент для удобного взаимодейстия со школьным дневником. В последствии я решил оформить его в виде Telegram-бота.
...

Профессия «плотник» полезна в обычной жизни, а что можно сказать о «программисте»? Когда государственной политикой является цифровизация, то правительство должно понимать: цифра она везде цифра! И в обычной жизни придется учитывать и такие истории.
Но сначала, чтоб не тратить время «продвинутых» хабберчан, краткое резюме:
1. уровень технической информации = junior
2. стек = python, ultralytics, YOLO (различных версий)
3. тема = распознование объектов, обучение модели
4. социальная польза = забота об экологии в городе Москва
История эта началась в нулевых, когда в очередной раз проходя мимо круга разворота автобусов, что находится у дома, я заплутал между громадного их количества, стоящих с включенными двигателями и чадящим прямо под окнами жителей.

Что-то, а китайцы впереди планеты всей по части удешевления техники. Я до сих помню тот шок, который испытал, приобретя свой первый USB-брелок RTL-SDR за 3 $. Чувствительностью и селективностью он не особо отличался. Тем не менее это был девайс, позволявший видеть, что происходит в эфире на соседних частотах. А еще он отлично работал с любыми антеннами.
Совсем недавно на многих маркетплейсах Поднебесной появился еще один любопытный приемник, который чем-то напомнил знаменитую Belka-DX. Я не смог удержаться и протестил его, тем более, что базируется он на чипе Si4732-A10. Сегодня опишу свой опыт работы с ним и расскажу, какие у него подводные камни.

О применении датчика расстояния в автоматизации дома. Что если отличать домашних животных от людей по росту?
Как? Просто измеряем расстояние от потолка путем ловли фотонов. Датчик способный это сделать — есть практически в каждом современном смартфоне. Возьмем его старшего брата, добавим проводков, соединим с ардуинкой. Можно пользоваться.

В этой статье мы разберёмся, как подключать самодельные устройства к умному дому Яндекс с Алисой (далее - УДЯ). В качестве такого самодельного устройства у нас выступит Wi-Fi-метеостанция на ESP8266, обладающая следующими функциями:
* вывод уровня углекислого газа, температуры и влажности с датчика Sensirion SCD-30
* передача данных этих данных в УДЯ через наше облако по Wi-Fi
* вывод курсов криптовалют на встроенный экран
Содержание статьи:
1. Разработка аппаратной части устройства на ESP8266 / ESP32
2. Написание прошивки устройства в среде Ардуино
3. Создание сервиса в облаке на Python и Django для подключения устройства к УДЯ и хранения данных, выгрузки статистики
4. Подключение нашего проекта к УДЯ через Яндекс.Диалоги, учим Алису Яндекса работать с нашим устройством
5. Обсудим варианты доработок, подключение устройства к Home Assistant, создание сценариев автоматизации (управление кондиционером по показаниям с нашего устройства) и т.д.


Хочу поделиться подходом к проектированию корпуса для электронной самоделки.
Вам потребуется немного свободного времени, установленные OpenSCAD, Kicad и доступ к 3D принтеру чтобы материализовать результат.

Для автоматизации бизнес-процессов часто требуется обработка бумажных документов со сложной структурой — например, счетов, накладных и так далее. Частый сценарий: есть почтовый ящик, на который поступают сканы оплаченных счетов. Этот почтовый ящик разбирается, и информация о счете и дате оплаты вносится в ERP. Однако разбирать такие документы вручную — процесс длительный и трудоемкий. Решение в данном случае может предложить искусственный интеллект.
В этой статье мы подробно рассмотрим наш подход к разработке системы, которая распознает информацию с бумажных счетов с помощью технологий компьютерного зрения и машинного обучения.

В первой части статьи я описывал свой опыт использования локальных моделей при разработке кода. В частности, столкнулся с тем, что без видеокарты скорость работы ollama была достаточно низкой. Далее постараюсь рассказать про техническую часть подключения внешней видеокарты к ноутбуку, работающему на Linux.

В этой статье я расскажу, как из проекта по созданию метеостанции на Arduino родился проект графического редактора для подготовки bitmap-картинок.
Если в ваших Arduino-проектах используется монохромный OLED-дисплей (например, SSD1306), эта статья поможет вам упростить процесс подготовки картинок для него.


Привет!
Мы в «СёрчИнформ» 20 лет создаем софт для защиты информации и постоянно его оптимизируем. Например, последовательно работаем над ресурсоемкостью продуктов (низкая нагрузка на оборудование – важное преимущество для заказчиков), и придумали в этом направлении много удачных (не только наше мнение) решений.
Запускаем серию постов об этом. Сегодня – о том, как пересобрали архитектуру OCR в нашей DCAP-системе (файловом аудиторе), чтобы ускорить анализ изображений, не перегружая серверы и пользовательские ПК.

В солнечных Афинах завершилась конференция ICDAR-2024. Причиной ли тому средиземноморское солнце или живой энтузиазм выступающих, но здесь было действительно жарко. Что неудивительно - ведь это главное международное мероприятие, посвященное вопросам распознавания. Одна из ключевых тем встречи – современные вызовы и перспективы OCR. Ведущие ученые со всего мира сошлись во мнении, что технологии распознавания жизненно необходимо сделать более понятными и интерпретируемыми. А для этого создать простую OCR явно недостаточно.
Нам в Smart Engines есть что добавить по этому поводу. Рассказываем, зачем нужно “объяснять” OCR и как это правильно сделать.