Comments 7
Для большей точности в Python лучше использовать не min_distance = 999999999, а min_distance = float('inf')
Интересно, познавательно, но в каком случае кластеризация может быть полезна, всё ещё пытаюсь понять. Сижу, читаю.
Эх .. автор хотябы ради прилия этот код хотя раз сам запустил... Видимо это перевод чего-то. так явно видны ошибки, которые вознимкли, возможно, в процессе перевода.
Возможно я ошибаюсь, но privious_cluster = cluster должен быть в цикле, иначе мы будем сравнивать положение центров кластеров не с их положением на предыдущей итерации, а с расположением начальных, рандомно сгенерированых, центров кластеров.
А в чём смысл статьи, если на практике эти выкладки заменит одна строчка: from sklearn.cluster import KMeans
?
И такая красивая картинка получается только в синтетических датасетах, в реальности деление на кластеры вряд ли будет ярко выраженным.
Реализация кластеризации методом k-средних на Python (с визуализацией)