Как стать автором
Обновить

Комментарии 7

Никогда такого не было и вот опять.

Для большей точности в Python лучше использовать не min_distance = 999999999, а min_distance = float('inf')

Спасибо. Исправлено

Интересно, познавательно, но в каком случае кластеризация может быть полезна, всё ещё пытаюсь понять. Сижу, читаю.

Эх .. автор хотябы ради прилия этот код хотя раз сам запустил... Видимо это перевод чего-то. так явно видны ошибки, которые вознимкли, возможно, в процессе перевода.

Возможно я ошибаюсь, но privious_cluster = cluster должен быть в цикле, иначе мы будем сравнивать положение центров кластеров не с их положением на предыдущей итерации, а с расположением начальных, рандомно сгенерированых, центров кластеров.

А в чём смысл статьи, если на практике эти выкладки заменит одна строчка: from sklearn.cluster import KMeans?

И такая красивая картинка получается только в синтетических датасетах, в реальности деление на кластеры вряд ли будет ярко выраженным.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории