Комментарии 4
мы использовали косинусное сходство (cosine similarity) как некую меру дистанции между фильмами, которая зависела от актеров, режиссеров, сценаристов и жанров. Чем меньше значение, тем сильнее фильмы похожи друг на друга.
косинусное сходство - чем ближе к 1 тем более похожи вектора. Косинусное расстояние - это другая мера.
а можно ссылочку на исходники пожалуйста?
The Movies Dataset (с признаками фильмов, в том числе с ключевыми словами) - https://www.kaggle.com/datasets/rounakbanik/the-movies-dataset
MovieLens Dataset (с рейтингами фильмов) - https://grouplens.org/datasets/movielens/
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Как сделать свою рекомендательную систему: история одной дипломной работы