Как стать автором
Обновить
54
21

LegalTech, ML, ROS

Отправить сообщение

Vosk vs Whisper — сравнение на raspberry pi 4b

Время на прочтение7 мин
Количество просмотров1.9K

В статье предлагается рассмотреть работу младших моделей преобразования речи в текст на edge устройстве — raspberry pi 4b. Фраза будет непростая, хоть и короткая — в ней будут элементы и русской, и английской речи. В соревновательный состав войдут представители семейства whisper: whisper, whisper-cpp, whisper-jax и vosk. Будет проведена оценка скорости и точности работы. Также, в качестве бонуса, будет предпринята попытка перевести фразу с таджикского языка на русский с помощью vosk.
Читать дальше →
Всего голосов 5: ↑5 и ↓0+7
Комментарии3

Склейка фото как отдельный вид искусства (как распознать мерцающую строку)

Время на прочтение2 мин
Количество просмотров1.7K


Размышляя над прикладной задачей «как прочитать мерцающую строку с номером электробуса» с помощью обычной камеры можно прийти к совершенно неожиданным результатам. Например, получить футуристические снимки окружающего ландшафта и вещей. Решение данной задачи с помощью python, а также несколько инопланетных изображений далее в статье.
Читать дальше →
Всего голосов 7: ↑7 и ↓0+13
Комментарии18

Создавая remote rc_car. Часть 1

Время на прочтение3 мин
Количество просмотров2.7K


Идея создания rc-car, которой можно управлять из любой точки земного шара по интернету (4g), была реализована в железе и софте. Однако, в дальнейшем проект вошел в фазу «а что дальше с этим делать» и был заморожен. Кроме того, остались некоторые моменты, которые необходимо еще «доработать напильником». Возможно, данный проект вдохновит кого-то, а автор «передаст свою соль в поезде», как в старом анекдоте.

Итак, как переделать rc-car для управления через интернет? Да и еще «чтобы видео смотреть»?
Читать дальше →
Всего голосов 4: ↑4 и ↓0+9
Комментарии14

Как определять объекты с ptz камеры

Время на прочтение10 мин
Количество просмотров2.5K


В статье предлагается рассмотреть практические моменты применения ptz камеры (на примере модели Dahua DH-SD42C212T-HN) для детектирования и классификации объектов. Рассматриваются алгоритмы управления камерой через интерфейс ONVIF, python. Применяются модели (сети): depth-anything, yolov8, yolo-world для детектирования объектов.
Читать дальше →
Всего голосов 6: ↑6 и ↓0+10
Комментарии13

Как перевести игру 'The Lamplighters League'

Время на прочтение7 мин
Количество просмотров1.9K

На данном примере предлагается разобрать перевод .wem файлов аудио одного языка (англ.) на другой язык (русский) с последующей упаковкой в .wem и использования в игре. В качестве инструментов будут использоваться python, нейросети, а также программа Wwise. Из интересного — также будет использоваться сеть, определяющая пол (gender) говорящего, чтобы перевод получился двухголосым.
Читать дальше →
Всего голосов 12: ↑12 и ↓0+12
Комментарии5

Перевод игры The Invincible на другой язык

Время на прочтение6 мин
Количество просмотров3.1K

Относительно недавно вышедшая игра «The Invincible» не имеет альтернативной озвучки — только чопорный английский. Возможно ли силами одного человека за относительно короткий срок (1-2 дня) перевести игру (сделать «озвучку»), например, на «великий, могучий, правдивый и свободный» язык? Попробуем.
Читать дальше →
Всего голосов 8: ↑8 и ↓0+8
Комментарии1

Проверка авто по vin, устройство на raspberry pi

Время на прочтение7 мин
Количество просмотров3.6K
Предлагается рассмотреть рабочий концепт устройства, которое делает фото (не без помощи человека естественно), распознает vin номер авто на фото, проверяет номер по базе ГИБДД РФ, самостоятельно посещая сайт. Никаких взломов, бэкдоров и т.п., только законные действия.


Читать дальше →
Всего голосов 2: ↑2 и ↓0+2
Комментарии9

Разрезать и залить видео на Яндекс.диск — бесплатно

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров5.3K


Предлагается рассмотреть программу на python, которая позволит в рамках бесплатного тарифа «Яндекс.диска» нарезать и заливать видеофайлы, размеры которых превышают 1 Гб (требование тарифа), получать ссылки на них. Никакой магии — только api «yandex.диска» и немного python.
Читать дальше →
Всего голосов 6: ↑3 и ↓3+2
Комментарии3

Вторая жизнь tello dji

Время на прочтение12 мин
Количество просмотров5.1K


В статье предлагается взглянуть на дополнительные возможности, которые предоставляет квадрокоптер tello dji. Благодаря наличию открытого api и паяльника возможно немного расширить применение аппарата, подружить его с ROS(robot operation system), а также по-новому взглянуть даже на его неисправных собратьев.
Читать дальше →
Всего голосов 6: ↑6 и ↓0+6
Комментарии2

Калибровка камеры-imu с Kalibr

Время на прочтение19 мин
Количество просмотров3.6K

В данной публикации хотелось бы познакомить с пакетом калибровки камеры Kalibr, в том числе для целей его использования в пакете визуальной навигации ORB_SLAM3. Будет продемонстрирован процесс калибровки камеры fish-eye для raspberry pi. Камера будет калиброваться совместно с гироскопом/акселерометром imu-650 (GY-521). Предполагается, что данная пошаговая инструкция облегчит понимание процесса калибровки в случае возникновения необходимости в таковой.
Читать дальше →
Всего голосов 3: ↑3 и ↓0+3
Комментарии0

ORB_SLAM3 на raspberry pi 4

Время на прочтение15 мин
Количество просмотров8.2K

Рассматриваются нюансы установки ORB_SLAM3 на одноплатном пк — raspberry pi 4 c ОС Raspbian buster, проводится поверхностный анализ возможностей алгоритма с учетом ограничений raspberry, показаны возможные пути оптимизации производительности, используется помимо прочего ROS noetic как связующее звено между imu, csi камерой raspberry pi и ORB_SLAM3. Статья не претендует на научность, излагается мнение автора с опорой на экспериментальную базу.
Читать дальше →
Всего голосов 6: ↑6 и ↓0+6
Комментарии9

Контроль уровня заряда батарей raspberry pi с выводом аудио оповещения

Время на прочтение5 мин
Количество просмотров4.9K
Возникла ситуация, когда необходимо выводить звук-предупреждение о разряде ибп raspberry pi.
В статье предлагается решение с использованием датчика напряжения (Voltage Sensor), arduino nano и «любимой аудио колонки школьника» — портативной «jbl go».

*c 26 секунды
Читать дальше →
Всего голосов 3: ↑3 и ↓0+3
Комментарии14

Как добавить в датасет Microsoft COCO свои классы и обучить модель YOLOX. Часть 2

Время на прочтение4 мин
Количество просмотров2.1K


В предыдущей статье нам удалось конвертировать custom датасет, доставшийся от yolov5 из формата Pascal VOC в coco формат. Также из датасета Microsoft COCO 2017 (80 классов) были удалены «ненужные» классы, а также присоединены классы из custom датасета (двери и лестницы). В «сухом остатке» 46 классов, из которых 2 вновь добавленных. Осталось дело за малым: обучить модель yolox на вновь созданном датасете, а так же проверить как она работает.
Но для начала yolox необходимо установить.
Читать дальше →
Всего голосов 4: ↑2 и ↓20
Комментарии3

Как добавить в датасет Microsoft COCO свои классы и обучить модель YOLOX

Время на прочтение9 мин
Количество просмотров5.8K

В интернете достаточно статей на тему «как обучить custom dataset на yolo».
Что скрывается за этими словами?

Ничего сверхестественного. Собираем или находим где-нибудь датасет, размечаем его, создаем файл аннотаций к картинкам. Далее берем одну из предобученных моделей yolo, обучаем эту модель на собственном датасете и далее наслаждаемся результатом.

Есть конечно, свои нюансы от yolo к yolo (которые уже определяются семействами в своих версиях, например, той же yolov5 порядка десяти вариантов моделей), но, в целом, порядок действий такой.

Все так. Однако модель, обученная на собственном датасете, будет определять только те классы, которые в нее заложили. Например, только дым и огонь.
Читать дальше →
Всего голосов 1: ↑1 и ↓0+1
Комментарии3

Pandas vs dask vs sqlite на raspberry pi

Время на прочтение7 мин
Количество просмотров3.8K
Возникла необходимость поработать с базой штрихкодов (barcode) на одноплатнике raspberry pi. Задача простая — открыть базу данных (~700 Мб), найти штрихкод и сделать это «достаточно быстро». Как оказалось, эти действия могут вылиться в захватывающее путешествие как в части того, как в базе быстро найти нужный код, так и в части того, как эту базу быстро открыть, чтобы найти. В работе помогали фреймворки pandas, dask, а также инструмент sqlite. Кто из них справился и какие есть нюансы — в данной статье.
Читать дальше →
Всего голосов 7: ↑1 и ↓6-5
Комментарии19

Вывод аудио на несколько источников на raspberry pi

Время на прочтение2 мин
Количество просмотров5.9K


В статье пойдет речь о том как вывести аудио, проигрываемое на raspberry pi на несколько источников (проигрывателей) одновременно. В частности, аудио будет параллельно транслироваться по hdmi, на audio jack, bluetooth устройство (устройства).
Читать дальше →
Всего голосов 8: ↑8 и ↓0+8
Комментарии6

Arduino + encoder — обработка высоких оборотов

Время на прочтение5 мин
Количество просмотров13K


Небольшой очерк как решить простую практическую задачу по обработке показаний с инкрементарного энкодера (E6B2 -CWZ1X) на arduino. Данная задача возникла в связи с необходимостью точного измерения пройденного расстояния в помещении. Энкодер соединен с колесом достаточно большого диаметра через редуктор. Размеры колеса, редуктора для целей задачи пока не имеют значение. Первично — считывать показания энкодера на достаточно больших оборотах.
Читать дальше →
Всего голосов 19: ↑7 и ↓12-4
Комментарии94

Электронная медицинская карта -собираем анализы

Время на прочтение6 мин
Количество просмотров7.3K

Небольшой пост о том, как собрать в единый pdf все записи о сданных анализах в поликлинике из электронной медицинской карты. Данные располагаются на сайте (https://lk.emias.mos.ru/medical-records), однако пользоваться ими неудобно, так как на сайте все свалено в несколько pdf куч. И, чтобы посмотреть, все позиции по анализам, сданным, например, в один день, необходимо заходить в каждую из этих куч и смотреть только эту одну позицию. Итого можно посмотреть до 15 pdf с анализами, сданных в один день. А уж если хочется за несколько дней посмотреть результаты анализов, умножай на n и затем вручную сравнивай!

В качестве опции также будет осуществлен вывод табличных данных из pdf в excel.
Читать дальше →
Всего голосов 6: ↑6 и ↓0+6
Комментарии2

Сравнить две таблицы excel

Время на прочтение5 мин
Количество просмотров20K
Решим достаточно тривиальную задачу с помощью языка python — сравним две таблицы excel и выведем результат в третью. Что может быть проще, и почему просто не использовать средства самой программы, входящей в пакет office? Попробуем разобраться.


Читать дальше →
Всего голосов 2: ↑1 и ↓10
Комментарии16

Esp32-машинка с камерой. Проект для быстрой сборки

Время на прочтение21 мин
Количество просмотров33K


Среди проектов небольших управляемых машинок, оснащенных камерой, особое место занимают те, которые позволяют быстро, с минимумом деталей собрать нечто управляемое по wi-fi. Но, как правило, сложности здесь возникают даже на этапе подборки компонентов, определения их совместимости. В данном проекте мы попробуем в бою esp32-cam и драйвер двигателя — tb6612fng.

Машинка будет управляться со смартфона либо стационарного ПК и, разумеется, будет максимально бюджетная. Помимо прочего в статье предпринята попытка уйти от arduin, уменьшить размеры платформы.

Проект рассчитан на начинающих, а также немного продолжающих.
Читать дальше →
Всего голосов 12: ↑12 и ↓0+12
Комментарии31

Информация

В рейтинге
328-й
Откуда
Москва, Москва и Московская обл., Россия
Зарегистрирован
Активность