Как стать автором
Обновить

Рекомендательная система: text mining как средство борьбы с холодным стартом

Время прочтения 5 мин
Просмотры 17K
Блог компании Surfingbird Алгоритмы *
В предыдущей статье я уже обозначил основные направления решения задачи холодного старта в рекомендательной системе веб-страниц. Напомню, что проблема холодного старта делится на холодный старт для пользователей (что показывать новым пользователям) и холодный старт для сайтов (кому рекомендовать вновь добавленные сайты). Сегодня я более подробно остановлюсь на методе семантического анализа текстов (text mining) как основном подходе к решению проблемы холодного старта для новых сайтов.
Читать дальше →
Всего голосов 30: ↑28 и ↓2 +26
Комментарии 8

Поиск похожих проектов на GitHub

Время прочтения 3 мин
Просмотры 17K
Разработка веб-сайтов *Open source *JavaScript *
Привет, Друзья!

Гитхаб — прекрасный сайт. Но представьте, что вы нашли проект А, и хотите узнать какие еще существуют похожие проекты. Как быть?

Именно с таким вдохновением уселся я разбирать API GitHub'a. Спустя пару недель свободного времени вот что получилось:



Для большинства проектов находится пара действительно интересных предложений. Вот несколько примеров: angular.js, front end bookmarks, three.js

Основная идея для построения рекомендаций — «Разработчики которые поставили звездочку этому проекту, также поставили звездочку...». А детали идеи, ее недостатки и ссылка на код — ниже.

читайте под катом
Всего голосов 68: ↑63 и ↓5 +58
Комментарии 33

Рекомендательная система на .Net или первые шаги с MyMediaLite

Время прочтения 6 мин
Просмотры 18K
Python *.NET *C# *Big Data *Машинное обучение *
Попробуй выбери, какая их них лучше? :)

Пошел я как-то на курсы по BigData, по рекомендации друзей и мне посчастливилось поучаствовать в соревновании. Не буду рассказывать об обучении на курсе, а расскажу о библиотеке MyMediaLite на .Net и о том, как я ее использовал.
Читать дальше →
Всего голосов 25: ↑17 и ↓8 +9
Комментарии 9

Рекомендации на потоке

Время прочтения 7 мин
Просмотры 12K
Блог компании E-Contenta Алгоритмы *Big Data *
Всем привет!

Сегодня мы расскажем о том, как с помощью потоковой обработки данных можно увеличить качество рекомендаций и снизить время отклика всей рекомендательной системы в 5 раз. Речь пойдет об одном из наших клиентов – сервисе потокового видео Rutube.


Читать дальше →
Всего голосов 18: ↑17 и ↓1 +16
Комментарии 12

Рекомендательные системы в онлайн-образовании. Адаптивное обучение

Время прочтения 6 мин
Просмотры 11K
Блог компании Stepik.org Data Mining *Алгоритмы *Машинное обучение *
Из песочницы

Не прошло и полгода, как мы завершаем цикл статей об адаптивном обучении на Stepik! А, нет, прошло… Но я рада наконец представить вашему вниманию заключительную статью о том, зачем вообще нужно адаптивное обучение, как оно реализовано на Stepik и причём тут шахматы.


Читать дальше →
Всего голосов 9: ↑8 и ↓1 +7
Комментарии 11

KDD 2018, день третий, основная программа

Время прочтения 16 мин
Просмотры 3.2K
Блог компании VK Data Mining *Big Data *Машинное обучение *


Сегодня, наконец, началась основная программа конференции. Acceptance rate в этом году составила всего 8 %, т.е. выступать должны лучшие из лучших из лучших. Явно разделены прикладные и исследовательские потоки, плюс идет несколько отдельных сопутствующих мероприятий. Прикладные потоки выглядят более интересно, там доклады, в основном, от мэйджоров (Google, Amazon, Alibaba и т.д.). Расскажу о тех выступлениях, на которых удалось побывать.
Читать дальше →
Всего голосов 17: ↑16 и ↓1 +15
Комментарии 2

People meet recommender systems. Factorization

Время прочтения 11 мин
Просмотры 13K
Алгоритмы *Математика *Машинное обучение *
Из песочницы

Машинное обучение довольно сильно проникло в нашу обыденную жизнь. Некоторые уже не удивляются, когда им рассказывают про нейронные сети в их смартфонах. Одной из больших областей в этой науке являются рекомендательные системы. Они есть везде: когда вы слушаете музыку, читаете книги, смотрите сериалы или видео. Развитие этой науки происходит в компаниях гигантах, таких как YouTube, Spotify и Netfilx. Конечно же, все научные достижения в этой области публикуются как на известных конференциях NeurIPS или ICML, так и на чуть менее известной RecSys, заточенной на эту тематику. И в этой статье мы поговорим, как развивалась эта наука, какие методы применяются в рекомендациях тогда и сейчас и какая математика за всем этим стоит.


Читать дальше →
Всего голосов 19: ↑19 и ↓0 +19
Комментарии 3

Как мы кратно улучшили качество рекомендаций в оффлайн ритейле

Время прочтения 11 мин
Просмотры 5K
Python *Data Mining *Big Data *Машинное обучение *Data Engineering *
🔥 Технотекст 2020

Всем привет! Меня зовут Саша, я CTO & Co-Founder в LoyaltyLab. Два года назад я с друзьями, как и все бедные студенты, ходил вечером за пивом в ближайший магазин у дома. Нас очень расстраивало, что ритейлер, зная, что мы придём за пивом, не предлагает скидку на чипсы или сухарики, хотя это так логично! Мы не поняли, почему такая ситуация происходит и решили сделать свою компанию. Ну и как бонус выписывать себе скидки каждую пятницу на те самые чипсы.


image


И дошло всё до того, что с материалом по технической стороне продукта я выступаю на NVIDIA GTC. Мы рады делиться наработками с коммьюнити, поэтому я выкладываю свой доклад в виде статьи.

Читать дальше →
Всего голосов 13: ↑12 и ↓1 +11
Комментарии 5

Разбор статей конференции RecSys 2021

Время прочтения 21 мин
Просмотры 3K
Блог компании Одноклассники Машинное обучение *

Привет, Хабр! Прошедший год был богат на интересные научные результаты в области рекомендательных систем. Крупнейшая конференция по рекомендательным системам RecSys 2021 в этом году приняла рекордные 49 статей в основную программу, 3 – в трек воспроизводимости и 23 исследования – в late breaking results.

В традиционном разборе RecSys в Одноклассниках в этом году приняли участие коллеги из других проектов VK. Вместе мы выбрали 10 самых интересных на наш взгляд статей и сделали их конспекты, а теперь как и в прошлом году, делимся ими с вами.

Вперед к статьям
Всего голосов 16: ↑15 и ↓1 +14
Комментарии 4

Эволюция рекомендаций ресторанов в Delivery Club. Часть 1

Время прочтения 11 мин
Просмотры 5.6K
Блог компании Delivery Club Tech Big Data *Машинное обучение *Управление e-commerce *Data Engineering *

Всем привет! Меня зовут Иван Максимов, я работаю Lead Data Scientist’ом в команде рекомендаций и A/B-тестирования Delivery Club. Это первая из серии статей про нашу рекомендательную систему. Я расскажу о том, как мы определили проблемы предыдущего подхода к рекомендациям, и как начали строить новый: с оптимизацией рекомендаций сразу под несколько бизнес-метрик. 

Статья будет интересна data scientist’ам и менеджерам продуктов, которые хотят с нуля построить систему рекомендации контента.

Читать далее
Всего голосов 17: ↑16 и ↓1 +15
Комментарии 0

Netflix. Архитектура системы персонализации и рекомендаций

Время прочтения 9 мин
Просмотры 3K
Анализ и проектирование систем *IT-инфраструктура *Big Data *Машинное обучение *Data Engineering *
Из песочницы

Перевод неточный, некоторые куски пропущены, так как показались мне повторением уже высказанных выше мыслей, некоторые - уточнены и дополнены примерами.

В предыдущих постах о персонализации в Netflix уже говорилось о том, что и данные, и алгоритмы их обработки одинаковы важны в задаче персонализации пользовательского опыта. Также важно вовлекать пользователя в систему рекомендаций - получать от него так больше откликов и данных. Сегодня мы поговорим о том, как может выглядеть архитектура, которая может максимизировать пользу от собираемых данных и поддерживает возможность быстрого внедрения нововведений.

Читать далее
Всего голосов 6: ↑5 и ↓1 +4
Комментарии 0