Хабр Курсы для всех
РЕКЛАМА
Практикум, Хекслет, SkyPro, авторские курсы — собрали всех и попросили скидки. Осталось выбрать!
вопрос: изначальная точка в к-средних выбиралась случайным образом или это одна из точек данных?
Кстати, интересно, есть ли модификация к-средних, где центроид на каждой итерации не просто считается как среднее точек кластера, а сначала считается среднее, а потом выбирается реальная точка, ближайшая к этой расчетной. Кажется логичным такой подход, чтобы избежать ситуации, изображенной на картинке.


Я слышал мнение, что кластеризация скорее метод визуализации, поскольку надо наперед задать или количество групп, или степень сходства. Не холивара для, а истины ради: насколько правильным Вы считаете такое мнение?

Интересные алгоритмы кластеризации, часть первая: Affinity propagation