История о том, как суточный ETL-контур карабкался в реалтайм.
В рамках AdTech-подразделения холдинга Rambler&Co выделено отдельное направление Usermodel, которое занимается анализом и сегментацией аудитории, а также повышением конверсий на площадках. Один из проектов этого направления – Recommender (система рекомендаций), в котором искусственный интеллект подстраивается под интересы пользователей и из массы контента на площадке выбирает самые интересные новости и статьи персонально для каждого посетителя сайта.
Что вы узнаете из этой статьи?
• Зачем нам нужен Realtime-контур на Spark?
• Как правильно написать его так, чтобы он джойнил логи на лету?
• С какими подводными камнями можно столкнуться?