Как стать автором
Обновить
54
21

LegalTech, ML, ROS

Отправить сообщение

через vpn работает, только вот youtube-видео по ссылке не загружает.
зато аудиофрагменты анализирует. загрузил ему первый абзац "Демона" Лермонтова:

В отрывке из "демон.wav" описывается Печальный Демон, который находится в изгнании. Он вспоминает о своем прошлом, когда был "чистым херувимом" и жил в "жилище света". В те времена он испытывал радость и любовь, верил и не знал сомнений.

Основные характеристики Демона:

  • Печальный: Его нынешнее состояние полно грусти и тоски.

  • Изгнанник: Он изгнан из "жилища света" и вынужден летать над "грешной землей".

  • Полон воспоминаний: Его мучают воспоминания о счастливом прошлом, которое контрастирует с его нынешним состоянием.

Контраст между прошлым и настоящим:

  • Прошлое: Жизнь в "жилище света", чистота, вера, любовь, счастье, отсутствие сомнений.

  • Настоящее: Изгнание, печаль, мучительные воспоминания.

Автор использует выразительные средства, чтобы подчеркнуть трагедию Демона. Например, "бегущая комета" символизирует быстротечность счастья, а "качущие караваны в пространстве брошенных светил" создают образ одиночества и заброшенности.

from faster_whisper import WhisperModel from time import time model_size = "tiny" or run on CPU with INT8

model = WhisperModel(model_size, device="cpu", compute_type="int8")

ts=time()
segments, info = model.transcribe("welcome_.wav",language="ru", beam_size=5)
print("Detected language '%s' with probability %f" % (info.language, info.language_probability))

for segment in segments:
print("[%.2fs -> %.2fs] %s" % (segment.start, segment.end, segment.text))

print(time() -ts)

Detected language 'ru' with probability 1.000000
[0.00s -> 2.26s] Добро пожаловать в синтез речи.
[2.26s -> 4.26s] В welcome to the World of the Switch синтез.
4.705834627151489

Действительно, хороший результат!

p.s.

с '3' в конкретно данном случае тоже все неоднозначно, но остальные символы будут прочитаны ocr.

@xpbim3_xpbim3
| Вообще говоря cv тут нафик не нужна, это и в контексте numpy отлично сработает:

не нужна, если просто сложением заниматься и не делать снимки с камеры. но их приходится делать.

да и результат, не отличается от того, что предложил SquareRootOfZero -

  1. а как вы выберете лучший ?

взял 2 снимка, идущие подряд. т.е. даже не через кадр и не из середины видеоряда:

получилось следующее:

это будет сложнее распознать. а так, идея хорошая.

я не совсем вас понимаю. в коде можете продемонстрировать ?

  1. При сложении снимков получается снимок, на котором возможно гарантированно детектировать box с номером.

  2. Про дичь: слипаются в безумном танце 3 кадра.

  3. Если "разобрать" видео на кадры, действительно на одном из кадров можно "поймать" box, где более-менее отчетливо виден номер. Однако, для этого нужно: записать видео, разобрать видео на кадры, проанализировать несколько кадров, отбраковывая плохие. Это дорого для одноплатника. Кроме того, это не будет работать, если мерцающая строка длинная, т.е. нужен не только номер, но и надписи и т.п.

Нет, конструкция не подразумевает полностью автономное управление.
Мысли добавить зарядное устройство были, но размер солнечной панели не устроил. Да и цели не те.
Про симку постараюсь во второй части не забыть.
За врезаться в ближайший wifi по ссылке в статье, если он к тому же чужой, можно получить а-та-та.

Нормально ездить получилось, но есть нюанс. Камера, не высокоскоростная, это факт. А что про энкодер вы имели в виду ?

с чего вы взяли, что не имеет отношения ? вот провод от драйвера (esc) на серву.

Если не ошибаюсь, то видел ваш проект. Но там teensy, которую и раньше не просто было достать и tensorflow 1x версий.
Возможно, он (проект) уже шагнул дальше. А так - задел большой!

да, наложение вышло.
истинный inference:
83.86762912159325 fps
--- 0.012818336486816406 seconds ---

он, конечно, прыгает от 60 до 90 fps, но тем не менее.

143 fps https://www.youtube.com/watch?v=37PwrRVP9j4 исходя из 7мс per image.
правда, с coral.
понятно, что будущее за npu, но и старое железо летать умеет.

realtime не планируется, т.к. нет необходимости. пк любой, кроме edge устройств.

Ознакомились с аналитикой. Интересно. Но некоторые моменты спорны. Например насчет того, что yolov8 зависает на raspberry. Не должна - https://youtu.be/6B-c-N5mJVg

openvino возможно запустить на raspberry, но нужен NCS - https://youtu.be/LsGTOReoMrI

Предполагалось, что камера должна охватить пространство сразу с 4х сторон от пола до потолка. Т.к. ориентация помещения неизвестна изначально (попытка сделать универсальный алгоритм), камера должна "дотягиваться" и в отдаленные участки помещения на расстояние до 10м. На таком расстоянии не всякая камера "прочитает" ценник, те более если он в морозильной камере.
Да, есть решения дешевле, но там либо нет антивандального купола, либо дребезг при движении, либо одноплатники нужны.

скобка не закрыта - input_name = next(iter(net_PVB.input_info)

1
23 ...

Информация

В рейтинге
328-й
Откуда
Москва, Москва и Московская обл., Россия
Зарегистрирован
Активность