Как стать автором
Обновить

Комментарии 3

Спасибо, отличная статья!

Статья классная. Но складывается ощущение, что это быть как функция в кликхаусе

Процесс схождения EM любого алгоритма итеративный, а все функции должны выдавать результат сразу. Так что целиком алгоритм не получится. Да и не надо. Хорошо, что есть все составляющие (типа E2Distance) - и ядро алгоритма уложилось в 10 строк.

Такая же ситуация с полнотекстовым поиском - есть все компоненты (токенизатор, стемминг и проч), но нет самого обратного индекса. Но его можно сделать в виде таблички.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории