Pull to refresh
8K+
4
16,1
Rating
3
Subscribers
Send message

OCR в кармане: как HunyuanOCR на 1B параметров потеснил гигантов в задачах парсинга документов

Level of difficultyEasy
Reading time8 min
Reach and readers11K

Всем привет! Меня зовут Артем, я Data Scientist в компании Raft Digital Solutions. В этой статье расскажу про свой опыт работы с HunyuanOCR end-to-end моделью от Tencent для распознавания текста на 1B параметров. Несмотря на громкие заявления о «SOTA-результатах» и компактности, в публичных обзорах практически не описано, как эта модель ведет себя в реальных задачах: с чем приходится столкнуться при настройке окружения, почему она может уйти в бесконечное зацикливание и как заставить её эффективно парсить сложные таблицы на обычном «железе».

Поделюсь результатами своих экспериментов, покажу боевые промпты и объясню, в каких сценариях этот OCR-инструмент реально помогает экономить время, а где лучше даже не пытаться его использовать.

Читать далее

Как заставить LLaMA генерировать продающие SEO‑описания для ритейла

Level of difficultyEasy
Reading time20 min
Reach and readers8.4K

Зачем изучать генерацию SEO‑описаний? Представьте, что вам нужно разом загрузить на сайт сотни товаров: ручками каждое описание не напишешь, а универсальный шаблон выдаёт скучные списки характеристик, которые никто не читает. Что, если эту работу делегировать LLaMA и получить не просто текст, а продающий контент, готовый к выкладке в карточку товара?

Читать далее

Wan 2.1: генерация видео по тексту на практике

Level of difficultyEasy
Reading time14 min
Reach and readers14K

В этой статье расскажу, как я решил поэкспериментировать с библиотекой Wan 2.1 — моделью для генерации коротких видео по текстовым описаниям. Несмотря на открытость проекта и наличие моделей с 1.3 B и 14 B параметров, в публичных статьях практически не описано, как они работают на практике: что реально влияет на скорость, какие параметры важны и что происходит на разных GPU.

Читать далее

Information

Rating
505-th
Works in
Registered
Activity