понятно. про сеть - имелась в виду нейросеть, которая бы снимала птиц, если птицы и людей, если люди. или вам нравится отсматривать полные записи видеорегистратора ?
{'id': 'chatcmpl-82b38207-b93b-4d48-931b-118ad2363af4', 'object': 'chat.completion', 'created': 1714044543, 'model': 'OmniFusion-1.1-Q5_K_M.gguf', 'choices': [{'index': 0, 'message': {'role': 'assistant', 'content': ' a man with long hair and a beard, wearing a black suit and tie\n\nassistant'}, 'logprobs': None, 'finish_reason': 'stop'}], 'usage': {'prompt_tokens': 608, 'completion_tokens': 19, 'total_tokens': 627}}
да базе raspberry pi zero v2 + imx485 + rtc clock можно все организовать. настроить сеть, чтобы людей писала на sd, а не потоки ветра. и про "пресс качат" не забудьте.
@kuznetsoff87 Подскажите, вот я запустил omnifusion на raspberry pi - https://youtu.be/mD5SVY2NPq8 Но на вопрос она отвечает с какими-то "хвостами", которых не было в вопросе. И как картинку ей "скормить" ?
"навигировать" ...нда. по теме: Arduino Nano 33 BLE Sense куда-то все пропали в РФ и заметно поднялись в цене на всем известном ресурсе. Из arduino ide library manager изъяли библиотеку tensorflow tflite tinyml. есть только от Harward, но там даже hello world не работает. Тем не менее ее еще можно найти. не стоит обольщаться, что даже Arduino Nano 33 BLE с ее возможностями будет работать с полноразмерным кадром изображения наравне с raspberry pi и т.п.
Тоже tesseract. Smalklapu spinati, 1.8k. 100g 1 gab X 1,09 EUR Tomati Latvijas 1.3kira kg 0,310 kg X 2,09 EUR/kg Atl. -0,16 Gala cena 0,49 Bumbieri Conference 70+ mm 1. Skira kg 0,760 kg X 1,69 EUR/kg Liellopu aknu pastéte Lido svétku 120g 1 gab X 1,05 EUR Atl. -0,10 Gala cena 0,95 Piparmétras téja 30g 1 gab X 1,90 EUR Nidéles Santa Maria Ramen 200g 1 gab X 2,79 EUR Atl. -0,50 Gala cena 2,29 1,09 0,65
Вопрос скорее дискуссионный. "ЦОДД" тоже с планшетами ходит, выглядят они (планшеты), разумеется, более эстетично. Быстрее и точнее работают ? Возможно. Но по рег. номерам. В части тачскрина - возможно он громоздкий, но доступен и устойчив к небрежности.
Здесь скорее решаются прикладные задачи/эксперименты: text recognition in natural scenes; оценивается производительность доступных мобильных пк; интеграция нейросетей и т.п. В плане полезности: случайно найти машину в розыске, проверить историю машины на месте и т.п.
В части мобильного приложения: да, было бы удобнее. Пожалуйста: интегрируйте trocr и все остальное в мобильное приложение, с удовольствием приду оценить его.
1.Пытливый читатель заметит, что функция read_image не полностью приведена в данной статье, часть от оригинала потерялась. 2. "извлечения свойств" лучше наверно на "извлечения признаков", а "функцию энергии" на "целевую функцию". Но это все мелочи. Самое главное, что код все равно не заработает, даже если вернуться к версии keras, под которую он написан. Скорее всего, автор оригинала сам откуда-то переписывал статью и допустил опечатки.
У меня была похожая задача, но я ее решил другим способом: камера пишет в csv файл распознанный код прямо на месте прогоняя видеопоток, а далее, по завершении процесса, отправляет на базовый пк. Все на одноплатниках. Но не такие, конечно, бешеные скорости как у вас.
llamafile - упрощенный способ запустить модель. https://github.com/Mozilla-Ocho/llamafile
https://youtu.be/FzeW-FoirBk
но и здесь модель добавляет в промт много лишнего "от себя".
ответ не совсем верный (длина волос) и не на русском. уточнять промт ?
ps. пример с картинкой на github проекта не смог запустить - cuda out of memory. (8 гб недостаточно оказалось).
понятно. про сеть - имелась в виду нейросеть, которая бы снимала птиц, если птицы и людей, если люди. или вам нравится отсматривать полные записи видеорегистратора ?
mmproj-model-f16.gguf - пришлось позаимствовать у llama - https://huggingface.co/mys/ggml_llava-v1.5-7b/tree/main
на выводе:
ну и сам снимок -
в общем, вот так все это будет выглядеть:
Обычно не увеличивается количество камер и все остается "как есть".
Про сеть - где вы будете разворачивать ее ?
Так у вас всего 2 камеры. Да сеть едва ли на видеорегистратор зайдет.
да базе raspberry pi zero v2 + imx485 + rtc clock можно все организовать. настроить сеть, чтобы людей писала на sd, а не потоки ветра.
и про "пресс качат" не забудьте.
Хорошо, спасибо!
@kuznetsoff87 Подскажите, вот я запустил omnifusion на raspberry pi - https://youtu.be/mD5SVY2NPq8
Но на вопрос она отвечает с какими-то "хвостами", которых не было в вопросе.
И как картинку ей "скормить" ?
"навигировать" ...нда.
по теме:
Arduino Nano 33 BLE Sense куда-то все пропали в РФ и заметно поднялись в цене на всем известном ресурсе.
Из arduino ide library manager изъяли библиотеку tensorflow tflite tinyml. есть только от Harward, но там даже hello world не работает. Тем не менее ее еще можно найти.
не стоит обольщаться, что даже Arduino Nano 33 BLE с ее возможностями будет работать с полноразмерным кадром изображения наравне с raspberry pi и т.п.
Тоже tesseract.
Smalklapu spinati, 1.8k. 100g 1 gab X 1,09 EUR Tomati Latvijas 1.3kira kg 0,310 kg X 2,09 EUR/kg Atl. -0,16 Gala cena 0,49 Bumbieri Conference 70+ mm 1. Skira kg 0,760 kg X 1,69 EUR/kg Liellopu aknu pastéte Lido svétku 120g 1 gab X 1,05 EUR Atl. -0,10 Gala cena 0,95 Piparmétras téja 30g 1 gab X 1,90 EUR Nidéles Santa Maria Ramen 200g 1 gab X 2,79 EUR Atl. -0,50 Gala cena 2,29 1,09 0,65
Ролик youtube в начале. Или вас сами .wem интересуют ?
Вопрос скорее дискуссионный. "ЦОДД" тоже с планшетами ходит, выглядят они (планшеты), разумеется, более эстетично. Быстрее и точнее работают ? Возможно. Но по рег. номерам. В части тачскрина - возможно он громоздкий, но доступен и устойчив к небрежности.
Здесь скорее решаются прикладные задачи/эксперименты: text recognition in natural scenes; оценивается производительность доступных мобильных пк; интеграция нейросетей и т.п.
В плане полезности: случайно найти машину в розыске, проверить историю машины на месте и т.п.
В части мобильного приложения: да, было бы удобнее. Пожалуйста: интегрируйте trocr и все остальное в мобильное приложение, с удовольствием приду оценить его.
а как быть, если либо D либо 0 ?
p.s. не знаю, как автор оригинала статьи получил accuracy 0.9779092702169625 на 13 эпохах, в лучшем случае 0,8 получается
1.Пытливый читатель заметит, что функция read_image не полностью приведена в данной статье, часть от оригинала потерялась.
2. "извлечения свойств" лучше наверно на "извлечения признаков", а "функцию энергии" на "целевую функцию".
Но это все мелочи.
Самое главное, что код все равно не заработает, даже если вернуться к версии keras, под которую он написан.
Скорее всего, автор оригинала сам откуда-то переписывал статью и допустил опечатки.
и модель создается так:
На современной версии keras (2.11.0) код будет выглядеть так:
ключ не валиден уже. *http://wiki.ros.org/noetic/Installation/Ubuntu
У меня была похожая задача, но я ее решил другим способом:
камера пишет в csv файл распознанный код прямо на месте прогоняя видеопоток, а далее, по завершении процесса, отправляет на базовый пк. Все на одноплатниках. Но не такие, конечно, бешеные скорости как у вас.
А какое расстояние от камеры до объекта ? И, правильно, ли я понимаю, что камера делает снимки по триггеру, а не гонит видеопоток на сервер ?