Обновить
8K+
4

Пользователь

16,1
Рейтинг
3
Подписчики
Отправить сообщение

OCR в кармане: как HunyuanOCR на 1B параметров потеснил гигантов в задачах парсинга документов

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели12K

Всем привет! Меня зовут Артем, я Data Scientist в компании Raft Digital Solutions. В этой статье расскажу про свой опыт работы с HunyuanOCR end-to-end моделью от Tencent для распознавания текста на 1B параметров. Несмотря на громкие заявления о «SOTA-результатах» и компактности, в публичных обзорах практически не описано, как эта модель ведет себя в реальных задачах: с чем приходится столкнуться при настройке окружения, почему она может уйти в бесконечное зацикливание и как заставить её эффективно парсить сложные таблицы на обычном «железе».

Поделюсь результатами своих экспериментов, покажу боевые промпты и объясню, в каких сценариях этот OCR-инструмент реально помогает экономить время, а где лучше даже не пытаться его использовать.

Читать далее

Как заставить LLaMA генерировать продающие SEO‑описания для ритейла

Уровень сложностиПростой
Время на прочтение20 мин
Охват и читатели8.4K

Зачем изучать генерацию SEO‑описаний? Представьте, что вам нужно разом загрузить на сайт сотни товаров: ручками каждое описание не напишешь, а универсальный шаблон выдаёт скучные списки характеристик, которые никто не читает. Что, если эту работу делегировать LLaMA и получить не просто текст, а продающий контент, готовый к выкладке в карточку товара?

Читать далее

Wan 2.1: генерация видео по тексту на практике

Уровень сложностиПростой
Время на прочтение14 мин
Охват и читатели14K

В этой статье расскажу, как я решил поэкспериментировать с библиотекой Wan 2.1 — моделью для генерации коротких видео по текстовым описаниям. Несмотря на открытость проекта и наличие моделей с 1.3 B и 14 B параметров, в публичных статьях практически не описано, как они работают на практике: что реально влияет на скорость, какие параметры важны и что происходит на разных GPU.

Читать далее

Информация

В рейтинге
512-й
Работает в
Зарегистрирован
Активность