Комментарии 10
Спасибо, Николай, очень давно наблюдаю и пользуюсь вашими статьями, добра вам
Понравилась статья, очень большая работа была проделана, видео сразу ! Пишите чаще, будем наблюдать
PCA
не пробовали? Возможно, после PCA
кластеры лучше будут разделяться. Или чем вы 13 колонок к 2D виду приводили, было же какое-то преобразование 13 колонок в 2 координаты? ) Сходу вообще не очень понимаю, где там координаты у вас получаются )
PCA пробовали, но тут дело в другом. Мы брали 13 мерное пространство и там делали кластеризацию. После этого мы запоминали положения центроидов => можно осуществить классификацию каждой клетки, а уже потом рисовать в двумерном пространстве. PCA интересных и вменяемых результатов не дал(
Понятно. Да, возможно в многомерном пространстве кластеризовать действительно лучше. Но тогда я бы попробовал разные методы кластеризации, их же много: https://scikit-learn.org/stable/modules/clustering.html Или там уже в скорость/количество данных упиралось и не всякий метод бы справился? Просто разные методы могут давать довольно разные результаты.
Да, прям в точку, самые быстрые методы и те работают достаточно долго (около часа для пациентов). Была ещё интересная идея использовать количество кластеров (для unsupervised методов) как ФИЧУ!!! И это работает тоже неплохо. То есть мы делали несколько раз DBSCAN, но с разными параметрами и получали табличку: типо DBSCAN(30, 300) - 20 кластеров. И на удивление такой подход для большого количества кластеров дал хорошие метрики, но хуже чем наши более умные подходы, да и объяснить это достаточно непросто для врачей)
А зачем вы нарисовали карты активации для CNN? что они значат, тут вообще не сильно понятно, что и как сетка сочла важным..
Что общего между раком крови, лазерами и нейронными сетями?