Выполните кластеризацию данных вашего варианта с использованием K-Means и его "мягкой" версии. Найдите количество кластеров, которое дает наибольшую чистоту, используйте различные показатели расстояния: евклидово расстояние, манхэттенское расстояние, расстояние Чебышева. Постройте графики значений чистоты и DBI в зависимости от "K" (количества кластеров) для каждой из метрик расстояния.
Soft-K-Means:
K-means: