Комментарии 3
Спасибо, отличная статья!
Статья классная. Но складывается ощущение, что это быть как функция в кликхаусе
Процесс схождения EM любого алгоритма итеративный, а все функции должны выдавать результат сразу. Так что целиком алгоритм не получится. Да и не надо. Хорошо, что есть все составляющие (типа E2Distance) - и ядро алгоритма уложилось в 10 строк.
Такая же ситуация с полнотекстовым поиском - есть все компоненты (токенизатор, стемминг и проч), но нет самого обратного индекса. Но его можно сделать в виде таблички.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
k-means in Clickhouse