Nail@SurMaster
Пользователь
Информация
- В рейтинге
- 4 047-й
- Зарегистрирован
- Активность
Специализация
Фулстек разработчик, ML разработчик
Ведущий
От 3 000 $
Git
PostgreSQL
Linux
Python
Английский язык
Разработка программного обеспечения
Базы данных
Django
FastAPI
ООП
богатая однако компания. ну и выбор моделей вызывает вопросы
ХХ помойкой стало в последнее время. Очень много фейковых вакансий, много всякого мусора и откровенного фуфла
И где ответ на вопрос-то из заголовка? Тема топика явно не раскрыта
бета тестирование только резидентам США доступно
У вас сколько по итогу потребляет VRAM весь этот комбайн?
Супер. Осталось только достать видеокарту на 24 Gb VRAM из ящика стола, стряхнуть с нее пыль и всё заверте...
Строил подобное - обработка сканов жд накладных для таможенных брокеров, но у меня обработкой занимается GPT (разные модели для разных полей для оптимизации стоимости/качества), только предобученная YOLO выдирает нужные поля. Потом данные пишутся в таблицу и скрипт перекидывает их уже в другую в нужный момент и в нужное место. В целом обработка одного файла занимает примерно 30 секунд, стоимость - меньше цента USD.
DeepSeek-OCR пробовал - не лезет в память, к сожалению. PaddleOCR, TesseractOCR, EasyOCR в полной мере с задачей не справлялись из-за жуткого качества исходников. Пришлось выкручиваться так
я и не утверждаю, что Geely скопирована полностью как платформа, но многое от нее. Прямой “клон” конкретной серийной китайской модели — нет, но тестовые машины строились на базе кузова Geely Geometry E, а комплектуха и партнёры в значительной степени китайские.
Пруфы: https://autoreview.ru/articles/svoimi-glazami/mul-atoma
https://китайские-автомобили.рф/2024/02/06/atom-geely/
платформа - взята от Geely Geometry E, но у Geely в два раза слабее двигатель. И цена тоже ниже, даже с учетом растаможек и доставки... Ну и комплектующие, естественно Китай, как отметили выше
API пока что недоступна, к сожалению. а так надо будет заценить
да, пользуюсь. удобно
Злободневная для меня тема. Как раз бьюсь над решением проблемы с распознаванием кропов определенных полей в ЖД накладных с рукописным текстом, причем не всегда он русский, а может быть английским, китайским, вьетнамским.
Добился распознавания почти всех 6 необходимых для извлечения полей до 95-99% точности, кроме одного (где не могу перейти планку в 85%), где могут присутствовать: печати и штампы разных цветов, зачеркнутый разными ручками текст (который нужно извлечь и не весь, а частично по определенным паттернам), артефакты сканирования, необычные способы написания чисел и букв. Из этого поля надо извлечь только одно число. Испробованы: DeepSeek-OCR, GPT-5, Gemini, PaddleOCR, Tesseract и еще куча менее известных. Построен довольно хитрый конвейер из обученной YOLO - специализированной OCR - LLM - постпроцессинг (эвристика+regex).
Если добьюсь 95% точности на оставшемся поле, это можно будет считать победой. Пожелайте удачи ))
Есть мысль обучить отдельный доп классификатор на рукописных цифрах, но мне кажется что эта овчинка не стоит выделки по затратам время/качество.
Что ж так в ЖД все сложно-то и не структурировано!
у меня в кубунту пока версия 7.6, обновлений не было. А браузер понравился.
Upd: пришло...
И сколько по времени она генерирует ответ на cpu? По полчаса "привет" пишет? Там же уснуть можно пока ответит. Не говоря уж о том, чтобы с ней несколько юзеров работать будут...
Думаю, что ИИ рано или поздно часть профессий заменит, это неизбежно и уже видно по текущей ситуации. На коне останутся либо разработчики такого ИИ, либо люди "ручных" профессий - условного сантехника никакой ИИ не заменит. Весь вопрос в оценке такого труда