Comments 5
А снятие омонимии не используется?
Проблемой омонимии мы пока не озадачивались - в обработке первичных событий ИТ-мониторинга этот вопрос не стоит остро, контекст довольно жесткий.
Во-первых, мы нигде не используем представления отдельных слов (embeddings), где имеет место проблема омонимов - и lda- и doc2vec-модели строятся на контексте, совокупностях слов. Во-вторых, в наших текстах (логи, события, ошибки) вообще врядли будут омонимы в одном собщении (документе) - нет нужды пытаться как-то их отлавливать и различать. Т.е. идёт речь о "ключе шифрования" или "замочном ключе", становится ясно по контексту и обе модели (lda и doc2vec) эту разницу увидят и выдадут разные векторные представления.
И где собственно алгоритмы мониторинга? Заголовок не соответствует содержанию
NLP алгоритмы для мониторинга и AIOps с использованием библиотек Python (часть 1)