Comments / Profile of AlexSac / Habr

@AlexSac

User

ProfileArticlesPostsNewsComments14

Интеграция dovecot и Apache Solr

AlexSac Apr 24 2018 at 10:30

Спасибо!)

Интеграция dovecot и Apache Solr

AlexSac Apr 23 2018 at 06:39

Solr.Exception: Early Eof.
При том отваливается он не по тайм-ауту, т.к. ошибка выскакивает сразу же.

Конфиг — я так понимаю, там под 1000 строк. Это стандартный конфиг, который идет с 7.3.

Интеграция dovecot и Apache Solr

AlexSac Apr 20 2018 at 11:38

Вы не встречали ошибку вида
doveadm(mailbox@domain.ru): Info: Sent: Caching mails seq=1..125
doveadm(mailbox@domain.ru): Panic: file http-client-request.c: line 1106 (http_client_request_send_more): assertion failed: (req->payload_input != NULL)
Аварийное завершение

при попытке проиндексировать ящик вручную? Странность в том, что со второго-третьего раза все может нормально пройти.

Интеграция dovecot и Apache Solr

AlexSac Apr 20 2018 at 06:02

А что касательно конфига и AddSchemaFieldsUpdateProcessorFactory?

Интеграция dovecot и Apache Solr

AlexSac Apr 19 2018 at 14:48

Поскольку в этой теме впервые, что такое public namespaces?)

Интеграция dovecot и Apache Solr

AlexSac Apr 19 2018 at 14:30

Вот что пишут по второму
Use SynonymGraphFilterFactory instead, but be sure to also use FlattenGraphFilterFactory at index time (not at search time) as well.

И в то же время

public class FlattenGraphFilterFactory
extends TokenFilterFactory
Factory for FlattenGraphFilter.
WARNING: This API is experimental and might change in incompatible ways in the next release.

В общем, я так понимаю, проще синонимы отключить. Тем более, файл не заполнен, а заполнять его вручную — та ее идея…

Интеграция dovecot и Apache Solr

AlexSac Apr 19 2018 at 14:19

В schema.xml пара ворнингов про устаревшие плагины. TrieLongField и SynonymFilterFactory.
Из документации (https://lucene.apache.org/solr/guide/7_0/field-types-included-with-solr.html)
TrieLongField Deprecated. Use LongPointField instead.
Просто меняем?

А вот насчет второго пока не совсем понял…

Интеграция dovecot и Apache Solr

AlexSac Apr 19 2018 at 14:05

В 7.3 блок
updateProcessor class=«solr.AddSchemaFieldsUpdateProcessorFactory»
Выглядит как
updateProcessor class=«solr.AddSchemaFieldsUpdateProcessorFactory» name=«add-schema-fields»

После его удаления пишет, что
No such processor add-schema-fields

Я правильно понимаю, что надо удалить add-schema-fields из блока ниже^

<updateRequestProcessorChain name=«add-unknown-fields-to-the-schema» default="${update.autoCreateFields:true}"
processor=«uuid,remove-blank,field-name-mutating,parse-boolean,parse-long,parse-double,parse-date,add-schema-fields»

Интеграция dovecot и Apache Solr

AlexSac Apr 19 2018 at 13:45

filter class=«solr.StopFilterFactory» ignoreCase=«true» words=«lang/stopwords_en.txt»/

Тут, я так понимаю, lang/stopwords_ru.txt?

Интеграция dovecot и Apache Solr

AlexSac Mar 2 2018 at 11:12

Т.е. мы ставим отдельно Tika и указываем его в конфигах довкота? И перед тем, как отправить файл на идексацию, довкот его разберет с помощью Tika?
И и при этом это два независимых сервиса, правильно?

Интеграция dovecot и Apache Solr

AlexSac Mar 2 2018 at 11:01

Т.е. по содержимому вложений в письмах вида .doc и т.п. искать без Apache Tika не будет? Вот этого поиска оч. не хватает…

Интеграция dovecot и Apache Solr

AlexSac Mar 2 2018 at 09:41

И пару слов о неприменимости к эксплуатации schema.xml из комплекта dovecot можно? Почему?

Интеграция dovecot и Apache Solr

AlexSac Mar 2 2018 at 09:12

Т.е. архитектура такова, что прямого доступа к почтовым ящикам ему не надо? Если не секрет, какой объем почты у вас? Хотелось бы сопоставить цифры в статье к объему.
И, если я правильно понял, появляется контекстный поиск по вложениям в формате doc, pdf, etc?

Интеграция dovecot и Apache Solr

AlexSac Mar 2 2018 at 09:08

Я правильно понимаю, что его можно поставить на отдельный сервер и обращаться к нему по tcp?