Да, я понимаю, что за эту неделю новости про DeepSeek всем уже надоели. Но для меня за последние 1,5 месяца эта платформа стала мощным рабочим инструментом (и вовсе не в генерации дурацких статей, а в извлечении информации из плохо отсканированных документов!) Итак...
Одной из роскошных возможностей DeepSeek была возможность сфотографировать несколько листов нужной тебе книги в специальном приложении для смартфона, сохранить их в pdf и попросить DeepSeek вытащить нужную тебе информацию (он распознавал, OCR-ил текст!).
То же самое с плохо отсканированным форматом djvu (предварительно сконвертированным в pdf).
Например, так я сохранил в нужном формате (csv) множество названий глав и разделов десятков книг, закинул в аналог эксел (я перешел на линукс) и теперь могу искать нужное в названиях 4 тысяч глав и разделов простым поиском.
Однако, в прошлые выходные, с началом хайпа вокруг DeepSeek, распознавание pdf стало жутко тормозить, в редкие окна удавалось продолжить работу... И вот сейчас он отказался работать с pdf! (Как и с любыми другими документами - как в браузерной версии, так и в приложении!)
Вот попытка выяснить у самого DeepSeek, что произошло:
-------------------------------------------
Ты можешь работать с pdf-файлами?
Да, я могу работать с PDF-файлами! Вы можете загрузить PDF, и я помогу вам извлечь текст, ответить на вопросы по содержанию или выполнить другие задачи, связанные с документом. Чем могу помочь? 😊
Почему этот пдф не загрузился?
К сожалению, я не могу принимать или загружать файлы, включая PDF, напрямую. Однако вы можете скопировать текст из PDF и вставить его здесь, или описать, что именно вам нужно из документа, и я постараюсь помочь! Если есть конкретные вопросы или задачи, связанные с содержимым PDF, дайте знать, и я постараюсь ответить. 😊