Попробуйте везде где возможно поменять мультиагнтность на одного агента с несколькими скиллами. Тогда агент будет работать с одним контекстом, сохраняя состояние.
Извините, может быть вы уже использовали этот трюк, но вторая половина статьи у вас - нередактированная генерация, я не могу это читать
Судя по формату входных данных, DeepSeek-OCR спилена у Google, я в Gemini API такие промпты писал. И Gemini как раз читает документы этих форматов: pdf, doc и картинки. Возможно, DeepSeek-OCR -- это урезанная Gemma 3 4B. Только у Gemma контекст 128K. Я ее тоже на 24GB GPU ставил и тюнил
Попробуйте везде где возможно поменять мультиагнтность на одного агента с несколькими скиллами. Тогда агент будет работать с одним контекстом, сохраняя состояние.
Извините, может быть вы уже использовали этот трюк, но вторая половина статьи у вас - нередактированная генерация, я не могу это читать
Судя по формату входных данных, DeepSeek-OCR спилена у Google, я в Gemini API такие промпты писал. И Gemini как раз читает документы этих форматов: pdf, doc и картинки. Возможно, DeepSeek-OCR -- это урезанная Gemma 3 4B. Только у Gemma контекст 128K. Я ее тоже на 24GB GPU ставил и тюнил