CTO RD17
Спасибо за прекрасно разобранную тему с крутыми примерами. Давно тут не было такого годного контента
Thanks!
Thank you!
I'm using an LLC. It's a bit an offtopic, let's discuss it via e-mail (ilia@ipirozhenko.com)
I based in Moscow, Russia. I'm using PayPal for all my transactions.
Awesome! You can subscribe on the updates of my blog here -> https://ipirozhenko.com/blog/google-interview-2020/
Структура папок откуда взялась? Ее в Амбаре создавать можно, или откуда она берется?
Ambar сам строит структуру папок с помощью информации полученной от краулеров, а именно полных путей к файлу
И в прошлой версии нельзя было получить гиперссылку на найденный файл, чтоб кинуть на него линк другом человеку. Сейчас как-то можно это сделать?
В прошлой версии мы сохраняли исходные файлы и ее можно было получить из кнопки "Download", в этой версии такая возможность то же есть
Да это минимальные требования, такое железо необходимо чтобы запустился ElasticSearch и приемлемо работал OCR
Не понял про smb вариант, объясните пожалуйста
Можем вам лично предоставить, только расскажите что вы с кодом делать хотите.
Тщательно настроенный tesseract
Я вас не понял, про какой золотой образ вы говорите?
Да, получается так. И еще надо добавить место для поискового индекса
Русский распознается, также поддерживаются: Ita, Deu, Fra, Spa, Pl, Nld
Да вы правы, в настройках краулера можно указать расписание запуска в крон-формате
Ну если ваши секретари уже отсканировали все документы то все просто — натравливаете на эту папку Ambar, он автоматически распознает текст со сканов и позволяет по нему искать. Вот скриншот как это выглядит:
Нам удобней разворачивать и обновлять приложение через docker, поэтому выбрали его
Вы имеете ввиду debian пакеты?
Неплохо!
Спасибо!
Оно файлы к себе затягивает или просто строит индекс?
Ambar затягивает к себе все файлы и хранит у себя
Доступ к файлу напрямую осуществляется или проксируется?
Доступ к файлу через Ambar из его базы данных
Что если у пользователя нет праа на какую-то папку?
В настройках краулера можно указать из под какой учетки ходить. Во время поиска нет разделения файлов по правам
Один индекс, но хитро настроенный. Писали про его настройку:
Спасибо за прекрасно разобранную тему с крутыми примерами. Давно тут не было такого годного контента
Thanks!
Thank you!
I'm using an LLC. It's a bit an offtopic, let's discuss it via e-mail (ilia@ipirozhenko.com)
I based in Moscow, Russia. I'm using PayPal for all my transactions.
Awesome! You can subscribe on the updates of my blog here -> https://ipirozhenko.com/blog/google-interview-2020/
Ambar сам строит структуру папок с помощью информации полученной от краулеров, а именно полных путей к файлу
В прошлой версии мы сохраняли исходные файлы и ее можно было получить из кнопки "Download", в этой версии такая возможность то же есть
Да это минимальные требования, такое железо необходимо чтобы запустился ElasticSearch и приемлемо работал OCR
Не понял про smb вариант, объясните пожалуйста
Можем вам лично предоставить, только расскажите что вы с кодом делать хотите.
Тщательно настроенный tesseract
Я вас не понял, про какой золотой образ вы говорите?
Да, получается так. И еще надо добавить место для поискового индекса
Русский распознается, также поддерживаются: Ita, Deu, Fra, Spa, Pl, Nld
Да вы правы, в настройках краулера можно указать расписание запуска в крон-формате
Ну если ваши секретари уже отсканировали все документы то все просто — натравливаете на эту папку Ambar, он автоматически распознает текст со сканов и позволяет по нему искать. Вот скриншот как это выглядит:
Нам удобней разворачивать и обновлять приложение через docker, поэтому выбрали его
Вы имеете ввиду debian пакеты?
Спасибо!
Ambar затягивает к себе все файлы и хранит у себя
Доступ к файлу через Ambar из его базы данных
В настройках краулера можно указать из под какой учетки ходить. Во время поиска нет разделения файлов по правам
Один индекс, но хитро настроенный. Писали про его настройку: