Комментарии 3
Когда следующий митап?
Следующий митап будет 16 октября, зарегистрироваться можно по ссылке retentioneering.timepad.ru/event/1072918
Интересная тема. Если я верно понял:
1) берем матрицу (все_траектории)х(все_события)
2) делаем tf-idf
3) уменьшаем размерность до 2
4) проводим анализ (смотрим воронки, кластеризацию и т.п.)
На шаге 2 — учитывается ли длина траектории? Ведь tf-idf дает оценку без учета длины и это может дать ошибку при сравнении траектории из 10 различных событий и из 100 событий
1) берем матрицу (все_траектории)х(все_события)
2) делаем tf-idf
3) уменьшаем размерность до 2
4) проводим анализ (смотрим воронки, кластеризацию и т.п.)
На шаге 2 — учитывается ли длина траектории? Ведь tf-idf дает оценку без учета длины и это может дать ошибку при сравнении траектории из 10 различных событий и из 100 событий
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Retentioneering: как мы open-source инструменты для продуктовой аналитики на Python и Pandas написали