Pull to refresh
35
0

CTO RD17

Send message

Спасибо за прекрасно разобранную тему с крутыми примерами. Давно тут не было такого годного контента

I'm using an LLC. It's a bit an offtopic, let's discuss it via e-mail (ilia@ipirozhenko.com)

I based in Moscow, Russia. I'm using PayPal for all my transactions.

Awesome! You can subscribe on the updates of my blog here -> https://ipirozhenko.com/blog/google-interview-2020/

Структура папок откуда взялась? Ее в Амбаре создавать можно, или откуда она берется?

Ambar сам строит структуру папок с помощью информации полученной от краулеров, а именно полных путей к файлу


И в прошлой версии нельзя было получить гиперссылку на найденный файл, чтоб кинуть на него линк другом человеку. Сейчас как-то можно это сделать?

В прошлой версии мы сохраняли исходные файлы и ее можно было получить из кнопки "Download", в этой версии такая возможность то же есть

Да это минимальные требования, такое железо необходимо чтобы запустился ElasticSearch и приемлемо работал OCR

Не понял про smb вариант, объясните пожалуйста

Можем вам лично предоставить, только расскажите что вы с кодом делать хотите.

Тщательно настроенный tesseract

Я вас не понял, про какой золотой образ вы говорите?

Да, получается так. И еще надо добавить место для поискового индекса

Русский распознается, также поддерживаются: Ita, Deu, Fra, Spa, Pl, Nld

Да вы правы, в настройках краулера можно указать расписание запуска в крон-формате

Ну если ваши секретари уже отсканировали все документы то все просто — натравливаете на эту папку Ambar, он автоматически распознает текст со сканов и позволяет по нему искать. Вот скриншот как это выглядит: image

Нам удобней разворачивать и обновлять приложение через docker, поэтому выбрали его

Вы имеете ввиду debian пакеты?

Неплохо!

Спасибо!


Оно файлы к себе затягивает или просто строит индекс?

Ambar затягивает к себе все файлы и хранит у себя


Доступ к файлу напрямую осуществляется или проксируется?

Доступ к файлу через Ambar из его базы данных


Что если у пользователя нет праа на какую-то папку?

В настройках краулера можно указать из под какой учетки ходить. Во время поиска нет разделения файлов по правам

Information

Rating
Does not participate
Registered
Activity