Pull to refresh
57
0.1

LegalTech, ML, ROS

Send message

Vosk vs Whisper — сравнение на raspberry pi 4b

Reading time7 min
Views2.2K

В статье предлагается рассмотреть работу младших моделей преобразования речи в текст на edge устройстве — raspberry pi 4b. Фраза будет непростая, хоть и короткая — в ней будут элементы и русской, и английской речи. В соревновательный состав войдут представители семейства whisper: whisper, whisper-cpp, whisper-jax и vosk. Будет проведена оценка скорости и точности работы. Также, в качестве бонуса, будет предпринята попытка перевести фразу с таджикского языка на русский с помощью vosk.
Читать дальше →
Total votes 5: ↑5 and ↓0+7
Comments3

Склейка фото как отдельный вид искусства (как распознать мерцающую строку)

Reading time2 min
Views1.8K


Размышляя над прикладной задачей «как прочитать мерцающую строку с номером электробуса» с помощью обычной камеры можно прийти к совершенно неожиданным результатам. Например, получить футуристические снимки окружающего ландшафта и вещей. Решение данной задачи с помощью python, а также несколько инопланетных изображений далее в статье.
Читать дальше →
Total votes 7: ↑7 and ↓0+13
Comments18

Создавая remote rc_car. Часть 1

Reading time3 min
Views2.8K


Идея создания rc-car, которой можно управлять из любой точки земного шара по интернету (4g), была реализована в железе и софте. Однако, в дальнейшем проект вошел в фазу «а что дальше с этим делать» и был заморожен. Кроме того, остались некоторые моменты, которые необходимо еще «доработать напильником». Возможно, данный проект вдохновит кого-то, а автор «передаст свою соль в поезде», как в старом анекдоте.

Итак, как переделать rc-car для управления через интернет? Да и еще «чтобы видео смотреть»?
Читать дальше →
Total votes 4: ↑4 and ↓0+9
Comments14

Как определять объекты с ptz камеры

Reading time10 min
Views2.7K


В статье предлагается рассмотреть практические моменты применения ptz камеры (на примере модели Dahua DH-SD42C212T-HN) для детектирования и классификации объектов. Рассматриваются алгоритмы управления камерой через интерфейс ONVIF, python. Применяются модели (сети): depth-anything, yolov8, yolo-world для детектирования объектов.
Читать дальше →
Total votes 6: ↑6 and ↓0+10
Comments13

Как перевести игру 'The Lamplighters League'

Reading time7 min
Views1.9K

На данном примере предлагается разобрать перевод .wem файлов аудио одного языка (англ.) на другой язык (русский) с последующей упаковкой в .wem и использования в игре. В качестве инструментов будут использоваться python, нейросети, а также программа Wwise. Из интересного — также будет использоваться сеть, определяющая пол (gender) говорящего, чтобы перевод получился двухголосым.
Читать дальше →
Total votes 12: ↑12 and ↓0+12
Comments5

Перевод игры The Invincible на другой язык

Reading time6 min
Views3.2K

Относительно недавно вышедшая игра «The Invincible» не имеет альтернативной озвучки — только чопорный английский. Возможно ли силами одного человека за относительно короткий срок (1-2 дня) перевести игру (сделать «озвучку»), например, на «великий, могучий, правдивый и свободный» язык? Попробуем.
Читать дальше →
Total votes 8: ↑8 and ↓0+8
Comments1

Проверка авто по vin, устройство на raspberry pi

Reading time7 min
Views3.6K
Предлагается рассмотреть рабочий концепт устройства, которое делает фото (не без помощи человека естественно), распознает vin номер авто на фото, проверяет номер по базе ГИБДД РФ, самостоятельно посещая сайт. Никаких взломов, бэкдоров и т.п., только законные действия.


Читать дальше →
Total votes 2: ↑2 and ↓0+2
Comments9

Разрезать и залить видео на Яндекс.диск — бесплатно

Level of difficultyEasy
Reading time5 min
Views5.4K


Предлагается рассмотреть программу на python, которая позволит в рамках бесплатного тарифа «Яндекс.диска» нарезать и заливать видеофайлы, размеры которых превышают 1 Гб (требование тарифа), получать ссылки на них. Никакой магии — только api «yandex.диска» и немного python.
Читать дальше →
Total votes 6: ↑3 and ↓3+2
Comments3

Вторая жизнь tello dji

Reading time12 min
Views5.3K


В статье предлагается взглянуть на дополнительные возможности, которые предоставляет квадрокоптер tello dji. Благодаря наличию открытого api и паяльника возможно немного расширить применение аппарата, подружить его с ROS(robot operation system), а также по-новому взглянуть даже на его неисправных собратьев.
Читать дальше →
Total votes 6: ↑6 and ↓0+6
Comments2

Калибровка камеры-imu с Kalibr

Reading time19 min
Views3.7K

В данной публикации хотелось бы познакомить с пакетом калибровки камеры Kalibr, в том числе для целей его использования в пакете визуальной навигации ORB_SLAM3. Будет продемонстрирован процесс калибровки камеры fish-eye для raspberry pi. Камера будет калиброваться совместно с гироскопом/акселерометром imu-650 (GY-521). Предполагается, что данная пошаговая инструкция облегчит понимание процесса калибровки в случае возникновения необходимости в таковой.
Читать дальше →
Total votes 3: ↑3 and ↓0+3
Comments0

ORB_SLAM3 на raspberry pi 4

Reading time15 min
Views8.5K

Рассматриваются нюансы установки ORB_SLAM3 на одноплатном пк — raspberry pi 4 c ОС Raspbian buster, проводится поверхностный анализ возможностей алгоритма с учетом ограничений raspberry, показаны возможные пути оптимизации производительности, используется помимо прочего ROS noetic как связующее звено между imu, csi камерой raspberry pi и ORB_SLAM3. Статья не претендует на научность, излагается мнение автора с опорой на экспериментальную базу.
Читать дальше →
Total votes 6: ↑6 and ↓0+6
Comments9

Контроль уровня заряда батарей raspberry pi с выводом аудио оповещения

Reading time5 min
Views5K
Возникла ситуация, когда необходимо выводить звук-предупреждение о разряде ибп raspberry pi.
В статье предлагается решение с использованием датчика напряжения (Voltage Sensor), arduino nano и «любимой аудио колонки школьника» — портативной «jbl go».

*c 26 секунды
Читать дальше →
Total votes 3: ↑3 and ↓0+3
Comments14

Как добавить в датасет Microsoft COCO свои классы и обучить модель YOLOX. Часть 2

Reading time4 min
Views2.3K


В предыдущей статье нам удалось конвертировать custom датасет, доставшийся от yolov5 из формата Pascal VOC в coco формат. Также из датасета Microsoft COCO 2017 (80 классов) были удалены «ненужные» классы, а также присоединены классы из custom датасета (двери и лестницы). В «сухом остатке» 46 классов, из которых 2 вновь добавленных. Осталось дело за малым: обучить модель yolox на вновь созданном датасете, а так же проверить как она работает.
Но для начала yolox необходимо установить.
Читать дальше →
Total votes 4: ↑2 and ↓20
Comments3

Как добавить в датасет Microsoft COCO свои классы и обучить модель YOLOX

Reading time9 min
Views6.1K

В интернете достаточно статей на тему «как обучить custom dataset на yolo».
Что скрывается за этими словами?

Ничего сверхестественного. Собираем или находим где-нибудь датасет, размечаем его, создаем файл аннотаций к картинкам. Далее берем одну из предобученных моделей yolo, обучаем эту модель на собственном датасете и далее наслаждаемся результатом.

Есть конечно, свои нюансы от yolo к yolo (которые уже определяются семействами в своих версиях, например, той же yolov5 порядка десяти вариантов моделей), но, в целом, порядок действий такой.

Все так. Однако модель, обученная на собственном датасете, будет определять только те классы, которые в нее заложили. Например, только дым и огонь.
Читать дальше →
Total votes 1: ↑1 and ↓0+1
Comments3

Pandas vs dask vs sqlite на raspberry pi

Reading time7 min
Views3.9K
Возникла необходимость поработать с базой штрихкодов (barcode) на одноплатнике raspberry pi. Задача простая — открыть базу данных (~700 Мб), найти штрихкод и сделать это «достаточно быстро». Как оказалось, эти действия могут вылиться в захватывающее путешествие как в части того, как в базе быстро найти нужный код, так и в части того, как эту базу быстро открыть, чтобы найти. В работе помогали фреймворки pandas, dask, а также инструмент sqlite. Кто из них справился и какие есть нюансы — в данной статье.
Читать дальше →
Total votes 7: ↑1 and ↓6-5
Comments19

Вывод аудио на несколько источников на raspberry pi

Reading time2 min
Views5.9K


В статье пойдет речь о том как вывести аудио, проигрываемое на raspberry pi на несколько источников (проигрывателей) одновременно. В частности, аудио будет параллельно транслироваться по hdmi, на audio jack, bluetooth устройство (устройства).
Читать дальше →
Total votes 8: ↑8 and ↓0+8
Comments6

Arduino + encoder — обработка высоких оборотов

Reading time5 min
Views14K


Небольшой очерк как решить простую практическую задачу по обработке показаний с инкрементарного энкодера (E6B2 -CWZ1X) на arduino. Данная задача возникла в связи с необходимостью точного измерения пройденного расстояния в помещении. Энкодер соединен с колесом достаточно большого диаметра через редуктор. Размеры колеса, редуктора для целей задачи пока не имеют значение. Первично — считывать показания энкодера на достаточно больших оборотах.
Читать дальше →
Total votes 19: ↑7 and ↓12-4
Comments94

Электронная медицинская карта -собираем анализы

Reading time6 min
Views7.4K

Небольшой пост о том, как собрать в единый pdf все записи о сданных анализах в поликлинике из электронной медицинской карты. Данные располагаются на сайте (https://lk.emias.mos.ru/medical-records), однако пользоваться ими неудобно, так как на сайте все свалено в несколько pdf куч. И, чтобы посмотреть, все позиции по анализам, сданным, например, в один день, необходимо заходить в каждую из этих куч и смотреть только эту одну позицию. Итого можно посмотреть до 15 pdf с анализами, сданных в один день. А уж если хочется за несколько дней посмотреть результаты анализов, умножай на n и затем вручную сравнивай!

В качестве опции также будет осуществлен вывод табличных данных из pdf в excel.
Читать дальше →
Total votes 6: ↑6 and ↓0+6
Comments2

Сравнить две таблицы excel

Reading time5 min
Views21K
Решим достаточно тривиальную задачу с помощью языка python — сравним две таблицы excel и выведем результат в третью. Что может быть проще, и почему просто не использовать средства самой программы, входящей в пакет office? Попробуем разобраться.


Читать дальше →
Total votes 2: ↑1 and ↓10
Comments16

Esp32-машинка с камерой. Проект для быстрой сборки

Reading time21 min
Views34K


Среди проектов небольших управляемых машинок, оснащенных камерой, особое место занимают те, которые позволяют быстро, с минимумом деталей собрать нечто управляемое по wi-fi. Но, как правило, сложности здесь возникают даже на этапе подборки компонентов, определения их совместимости. В данном проекте мы попробуем в бою esp32-cam и драйвер двигателя — tb6612fng.

Машинка будет управляться со смартфона либо стационарного ПК и, разумеется, будет максимально бюджетная. Помимо прочего в статье предпринята попытка уйти от arduin, уменьшить размеры платформы.

Проект рассчитан на начинающих, а также немного продолжающих.
Читать дальше →
Total votes 12: ↑12 and ↓0+12
Comments31

Information

Rating
3,491-st
Location
Москва, Москва и Московская обл., Россия
Registered
Activity