Обновить
0
0

Пользователь

Отправить сообщение
Solr.Exception: Early Eof.
При том отваливается он не по тайм-ауту, т.к. ошибка выскакивает сразу же.

Конфиг — я так понимаю, там под 1000 строк. Это стандартный конфиг, который идет с 7.3.
Вы не встречали ошибку вида
doveadm(mailbox@domain.ru): Info: Sent: Caching mails seq=1..125
doveadm(mailbox@domain.ru): Panic: file http-client-request.c: line 1106 (http_client_request_send_more): assertion failed: (req->payload_input != NULL)
Аварийное завершение

при попытке проиндексировать ящик вручную? Странность в том, что со второго-третьего раза все может нормально пройти.
А что касательно конфига и AddSchemaFieldsUpdateProcessorFactory?
Поскольку в этой теме впервые, что такое public namespaces?)
Вот что пишут по второму
Use SynonymGraphFilterFactory instead, but be sure to also use FlattenGraphFilterFactory at index time (not at search time) as well.

И в то же время

public class FlattenGraphFilterFactory
extends TokenFilterFactory
Factory for FlattenGraphFilter.
WARNING: This API is experimental and might change in incompatible ways in the next release.

В общем, я так понимаю, проще синонимы отключить. Тем более, файл не заполнен, а заполнять его вручную — та ее идея…
В schema.xml пара ворнингов про устаревшие плагины. TrieLongField и SynonymFilterFactory.
Из документации (https://lucene.apache.org/solr/guide/7_0/field-types-included-with-solr.html)
TrieLongField Deprecated. Use LongPointField instead.
Просто меняем?

А вот насчет второго пока не совсем понял…
В 7.3 блок
updateProcessor class=«solr.AddSchemaFieldsUpdateProcessorFactory»
Выглядит как
updateProcessor class=«solr.AddSchemaFieldsUpdateProcessorFactory» name=«add-schema-fields»

После его удаления пишет, что
No such processor add-schema-fields

Я правильно понимаю, что надо удалить add-schema-fields из блока ниже^

<updateRequestProcessorChain name=«add-unknown-fields-to-the-schema» default="${update.autoCreateFields:true}"
processor=«uuid,remove-blank,field-name-mutating,parse-boolean,parse-long,parse-double,parse-date,add-schema-fields»
filter class=«solr.StopFilterFactory» ignoreCase=«true» words=«lang/stopwords_en.txt»/

Тут, я так понимаю, lang/stopwords_ru.txt?
Т.е. мы ставим отдельно Tika и указываем его в конфигах довкота? И перед тем, как отправить файл на идексацию, довкот его разберет с помощью Tika?
И и при этом это два независимых сервиса, правильно?
Т.е. по содержимому вложений в письмах вида .doc и т.п. искать без Apache Tika не будет? Вот этого поиска оч. не хватает…
И пару слов о неприменимости к эксплуатации schema.xml из комплекта dovecot можно? Почему?
Т.е. архитектура такова, что прямого доступа к почтовым ящикам ему не надо? Если не секрет, какой объем почты у вас? Хотелось бы сопоставить цифры в статье к объему.
И, если я правильно понял, появляется контекстный поиск по вложениям в формате doc, pdf, etc?
Я правильно понимаю, что его можно поставить на отдельный сервер и обращаться к нему по tcp?

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность