Comments 5
искали быстрое решение, пока лог nginx был доступен... задачу нужно было решить за короткий срок, как обычно это бывает...
Можно ли узнать что помешало восстановить базу из резервной копии? Это было бы не мне полезно узнать.
Дерево. Давайте представим что урок это точка в пространстве дерева а лучи между ними - это как раз максимально частотные переходы пользователей от урока А до урока Б потом В и т.д. Далее строим корректный путь между точками. Разочарование - собранная частотность не позволяла создать дерево, результат был похож на мусор
И далее
Собираем частотность пар, что в последовательности урок А, далее урок В смотрело N юзеров. Урок В далее С - смотрело Y и т.д. Не анализируем пары с минимальной частотностью.
Мне показалось или вы использовали тот же метод, просто во втором случае вы предварительно чистили данные избавляясь от "выбросов"?
Алгоритмы. Определение последовательности на сырых данных, или восстановление после аварии