Pull to refresh

Comments 3

Статья классная. Но складывается ощущение, что это быть как функция в кликхаусе

Процесс схождения EM любого алгоритма итеративный, а все функции должны выдавать результат сразу. Так что целиком алгоритм не получится. Да и не надо. Хорошо, что есть все составляющие (типа E2Distance) - и ядро алгоритма уложилось в 10 строк.

Такая же ситуация с полнотекстовым поиском - есть все компоненты (токенизатор, стемминг и проч), но нет самого обратного индекса. Но его можно сделать в виде таблички.

Sign up to leave a comment.

Articles