NLP алгоритмы для мониторинга и AIOps с использованием библиотек Python (часть 1) / Комментарии / Хабр

NuGan 10 янв 2022 в 08:12

Проблемой омонимии мы пока не озадачивались - в обработке первичных событий ИТ-мониторинга этот вопрос не стоит остро, контекст довольно жесткий.

Во-первых, мы нигде не используем представления отдельных слов (embeddings), где имеет место проблема омонимов - и lda- и doc2vec-модели строятся на контексте, совокупностях слов. Во-вторых, в наших текстах (логи, события, ошибки) вообще врядли будут омонимы в одном собщении (документе) - нет нужды пытаться как-то их отлавливать и различать. Т.е. идёт речь о "ключе шифрования" или "замочном ключе", становится ясно по контексту и обе модели (lda и doc2vec) эту разницу увидят и выдадут разные векторные представления.

Комментарии 5

MaksimMukharev 8 янв 2022 в 05:57

А снятие омонимии не используется?

vasyash 10 янв 2022 в 08:10

И где собственно алгоритмы мониторинга? Заголовок не соответствует содержанию

NuGan 10 янв 2022 в 08:10

во второй части, опубликую на этой неделе

NuGan 13 янв 2022 в 10:03

https://habr.com/ru/post/645395/

Зарегистрируйтесь на Хабре, чтобы оставить комментарий