Pull to refresh
8
0
Лидия Храмова @equinoxmoon

Lead data scientist

Send message

Что в контенте тебе моем? Многовековая эволюция и основные принципы персонализации контента

Reading time9 min
Views1.2K
Привет, %username%! Сегодня мы поговорим об истории персонализации контента, принципах формирования “контентного пузыря” каждого из нас, как на основе личных предпочтений, так и на основе цифрового отпечатка пользователя. Ну а рассказывать будет Лидия Храмова, team lead data scientist в компании QIWI и преподаватель курса «Профессия‌ ‌Data‌ ‌Scientist‌» в Skillbox. Она постаралась рассказать о самых важных и интересных нюансах процессов формирования контента так, чтобы эта статья была понятна всем, а не только специалистам.

Все самое интересное — под катом!
Читать дальше →
Total votes 4: ↑4 and ↓0+4
Comments0

Скрытая угроза — анализ уязвимостей при помощи графа новостей

Reading time5 min
Views4.2K
Когда вы сталкиваетесь с новой уязвимостью, какая мысль приходит первой? Конечно, отреагировать как можно быстрее. Однако, скорость — всего лишь одно из условий эффективной борьбы с ИБ-угрозами. Когда речь идет о корпоративной безопасности, не менее важно безошибочно определять, на что стоит реагировать в первую очередь. Недооцененная угроза может стать причиной серьезных убытков или потери деловой репутации. Но если число уязвимостей постоянно растет, как быстро оценить их значимость и не упустить важные детали?


Динамика числа уязвимостей по группам CVSS (источник — vulners.com)
Читать дальше →
Total votes 17: ↑16 and ↓1+15
Comments4

Персонализируй это: как мы в QIWI работаем с рекомендациями

Reading time4 min
Views2.3K
Всем привет!

Меня зовут Лидия, я тимлид небольшой DataScience-команды в QIWI.

Мы с ребятами довольно часто сталкиваемся с задачей исследования потребностей клиентов, и в этом посте мне бы хотелось поделиться мыслями о том, как начать тему с сегментацией и какие подходы могут помочь разобраться в море неразмеченных данных.

Кого сейчас удивишь персонализацией? Отсутствие персональных предложений в продукте или сервисе уже кажется моветоном, и мы ждем те самые, отобранные только для нас, сливки везде – от ленты в Instagram до личного тарифного плана.

Однако, откуда берется тот самый контент или предложение? Если вы впервые погружаетесь в темные воды машинного обучения, то наверняка столкнетесь с вопросом – с чего начать и как выявить те самые интересы клиента. Чаще всего при наличии большой базы пользователей и отсутствии знаний об оных возникает желание пойти по двум популярным путям:

1. Разметить вручную выборку пользователей и обучить на ней модель, которая позволит определять принадлежность к этому классу или классам – в случае мультиклассового таргета.

Вариант неплохой, но на начальном этапе может заманить в ловушку – ведь мы еще не знаем, какие в принципе сегменты у нас есть и насколько они будут полезны для продвижения новых продуктовых фич, коммуникаций и прочего. Не говоря уже о том, что ручная разметка клиентов – дело достаточно затратное и иногда непростое, ведь чем больше у вас сервисов, тем большее количество данных нужно просмотреть для понимания, чем живет и дышит этот клиент. Большая вероятность, что получится нечто такое:



2. Обжегшись на варианте #1, часто выбирают вариант unsupervised-анализа без обучающей выборки.
Читать дальше →
Total votes 16: ↑14 and ↓2+12
Comments12

Information

Rating
Does not participate
Registered
Activity