User
GLM-OCR тоже тестил на своем бенче. По скорости модель реально хорошая, разворачивается проще HunyuanOCR, но по таблицам качество пока среднее: структуру иногда ловит, но столбцы путает, ячейки дробит и теряет часть текста.
Но в финале этого квеста результат оказывается вполне достойным))
К сожалению, не могу делиться финальным промптом. Но в статье я постарался подробно описать принципы, из которых его можно собрать
тесты проводил на Llama 3.3 70B, развернутой в Yandex Cloud
А так, да, мы используем нейросети для обработки статей)
Если вас что-то не устраивает то вместо бесполезного "потока сознания" я бы посоветовал написать что-то конструктивное
GLM-OCR тоже тестил на своем бенче.
По скорости модель реально хорошая, разворачивается проще HunyuanOCR, но по таблицам качество пока среднее: структуру иногда ловит, но столбцы путает, ячейки дробит и теряет часть текста.
Но в финале этого квеста результат оказывается вполне достойным))
К сожалению, не могу делиться финальным промптом. Но в статье я постарался подробно описать принципы, из которых его можно собрать
тесты проводил на Llama 3.3 70B, развернутой в Yandex Cloud
А так, да, мы используем нейросети для обработки статей)
Если вас что-то не устраивает то вместо бесполезного "потока сознания" я бы посоветовал написать что-то конструктивное