Pull to refresh

Учёные научились предсказывать по ЭЭГ, какие люди нравятся испытуемому

Reading time 2 min
Views 2.4K
Algorithms *Machine learning *Popular science Brain Health

Исследователи Копенгагенского и Хельсинкского университетов обучили алгоритмы предсказывать выбор пациента по показателям электроэнцефалографии (ЭЭГ) при помощи методов машинного обучения и коллаборативной фильтрации. 

Читать далее
Total votes 10: ↑10 and ↓0 +10
Comments 11

Системы рекоммендаций: введение в гибридные системы

Reading time 6 min
Views 2.7K
Data Mining *
Системы рекомендаций:
Советы от машины
Холодное начало
— Введение в гибридные системы
искусственные имунные системы и эффект идиотипов


Продолжим с того момента, на котором мы остановились в прошлый раз: мы рассмотрели несколько способов решения проблемы холодного начала, теперь я предлагаю рассмотреть другие проблемы систем рекомендаций (далее просто СР) и подумать, как разные типы СР могут дополнять друг-друга. Сразу оговорюсь, что я не буду подробно рассматривать способы решения той или иной проблемы. Цель этой статьи — лишь помочь разработчикам ориентироваться в разновидностях СР и в связанных с ними проблемах.

Для начала все-таки придется дополнить классификацию СР. Przemyslaw Kazienko и Pawel Kolodziejski предложили разделить все СР на пять типов: статистические, коллективные, ассоциативные и информационные. Начнем с самых простых.
Читать дальше →
Total votes 37: ↑35 and ↓2 +33
Comments 10

OBOOBS.RU // Open B(.)(.)BS Project — небольшой проект про сиськи (женские)

Reading time 1 min
Views 35K
Self Promo
OBOOBS.RU

Привет, хабралюди. Сегодня вдруг уже пятница — идеальный день для показывания вам достаточно необычного ресурса про сиськи. Сделали мы его с другом ещё в прошлом году, но как-то всё допиливали всякие мелочи. А сейчас вдруг решили, что всё, пора рассказать о себе.

Главной целью было сделать неотвратительный ресурс про обнажённых девушек — нам было очень странно от того, что на эту тему не нашлось ничего простого, минималистичного и без невозможного количества порнобаннеров. И мы решили заполнить этот пробел.

Сайт копирует модель коллективной фильтрации от bash.org.ru — состоит из двух разделов: Сигнал (отобранные и разбитые по категориям картинки) и Шум (огромное количество картинок, добавленных самими пользователями, выдаётся пользователям рандомно). Время от времени, самые популярные картинки из Шума уходят в Сигнал, «попадают на главную» (заодно и в RSS валятся). Вот и всё. Можно только добавить, что крутится всё на django (nginx, apache+mod_wsgi), postgresql и prototype.

Приходите к нам смотреть на красивые сиськи!
Total votes 372: ↑306 and ↓66 +240
Comments 187

Расширение базы для коллаборативной фильтрации

Reading time 2 min
Views 649
Lumber room
Идея коллаборативной фильтрации проста и изящна – на основании списка предпочтений пользователя система ищет людей с похожими предпочтениями, сопоставляет списки и выдает рекомендации по их пополнению. Слово «предпочтение» здесь не совсем подходит, обычно список содержит названия объектов какого-либо контентного типа — книги, музыка, фильмы. Но если допустим блог-платформа или соцсеть подыскивает вам френдов? Тогда в качестве элементов списка могут служить указанные в профиле интересы пользователя, теги к его постам, список уже имеющихся френдов и т. п. Если задаться целью максимально расширить область применения коллаборативной фильтрации, то возникают два вопроса: что в принципе может быть элементом списка и что в принципе может стимулировать пользователя эти списки создавать.
Читать дальше →
Total votes 2: ↑2 and ↓0 +2
Comments 2

Мне, пожалуйста, Интернет с фильтром

Reading time 2 min
Views 750
Self Promo
Cкоро веб-сервисы будут рекомендовать нам не только музыку для прослушивания, но и страну для проживания, и партнера для замужества. При этом, что характерно, всегда угадывать. Механизм с зубодробительным названием “коллаборативная фильтрация” — на самом деле довольно простая идея. Она основывается на следующем допущении: те, кто соглашался в прошлом, будут соглашаться с подобным и в будущем. Например, Last.Fm способен довольно точно прогнозировать, какая песня понравится пользователю, имея неполный список его симпатий и антипатий в музыке.

Обратите внимание: данный прогноз абсолютно индивидуален, хотя информация собирается от многих участников. Такой подход принципиально отличается от более примитивного, дающего для каждого объекта интереса “среднюю температуру по больнице”, то есть усреднённую оценку большинства — так делает, например, IMDB.
Читать дальше →
Total votes 11: ↑8 and ↓3 +5
Comments 6

Рекомендательные системы: постановка задачи

Reading time 5 min
Views 30K
Surfingbird corporate blog
Всем привет! Меня зовут Сергей, я математик, и я определяю развитие рекомендательной системы Surfingbird. Этой статьёй мы открываем цикл, посвящённый машинному обучению и рекомендательным системам в частности – пока не знаю, сколько в цикле будет инсталляций, но постараюсь писать их регулярно. Сегодня я расскажу вам, что такое рекомендательные системы вообще, и поставлю задачу чуть более формально, а в следующих сериях мы начнём говорить о том, как её решать и как учится наша рекомендательная система Tachikoma.

image

Читать дальше →
Total votes 32: ↑27 and ↓5 +22
Comments 22

Рекомендательные системы: user-based и item-based

Reading time 5 min
Views 37K
Surfingbird corporate blog
Итак, в прошлый раз мы немного поговорили о том, что такое вообще рекомендательные системы и какие перед ними стоят проблемы, а также о том, как выглядит постановка задачи коллаборативной фильтрации. Сегодня я расскажу об одном из самых простых и естественных методов коллаборативной фильтрации, с которого в 90-х годах и начались исследования в этой области. Базовая идея очень проста: как понять, понравится ли Васе фильм «Трактористы»? Нужно просто найти других пользователей, похожих на Васю, и посмотреть, какие рейтинги они ставили «Трактористам». Или с другой стороны: как понять, понравится ли фильм «Трактористы» Васе? Нужно просто найти другие фильмы, похожие на «Трактористов», и посмотреть, как Вася их оценивал.


Читать дальше →
Total votes 25: ↑25 and ↓0 +25
Comments 17

Новый тулбар

Reading time 1 min
Views 2K
Surfingbird corporate blog
Алоха, юзернейм!

Меня зовут Сергей Шалаев, я руководитель Surfingbird. В нашем проекте я выполняю роль разнорабочего и занимаюсь тем, что не хотят делать остальные. Например, уборкой крыши или написанием текстов о новых штуках на нашем проекте.

Итак, я расскажу тебе, юзернейм, об одном небольшом, но очень важном обновлении Surfingbird, над которым мы работали последний месяц.

Мы зарелизили новый тулбар!
Вот он, тулбар нашей мечты — http://surfingbird.ru/surf


Читать дальше →
Total votes 25: ↑3 and ↓22 -19
Comments 22

Рекомендательные системы: SVD, часть I

Reading time 3 min
Views 59K
Surfingbird corporate blog
Продолжаем разговор о рекомендательных системах. В прошлый раз мы сделали первую попытку определить схожесть между пользователями и схожесть между продуктами. Сегодня мы подойдём к той же задаче с другой стороны – попытаемся обучить факторы, характеризующие пользователей и продукты. Если Васе из предыдущего поста нравятся фильмы о тракторах и не нравятся фильмы о поросятах, а Петру – наоборот, было бы просто замечательно научиться понимать, какие фильмы «о поросятах», и рекомендовать их Петру, а какие фильмы – «о тракторах», и рекомендовать их Васе.

image
Читать дальше →
Total votes 17: ↑15 and ↓2 +13
Comments 5

Рекомендательные системы: SVD и базовые предикторы

Reading time 3 min
Views 29K
Surfingbird corporate blog
В прошлый раз я рассказал, пока в самых общих чертах, о сингулярном разложении – главном инструменте современной коллаборативной фильтрации. Однако в прошлый раз мы в основном говорили только об общих математических фактах: о том, что SVD – это очень крутая штука, которая даёт хорошие низкоранговые приближения. Сегодня мы продолжим разговор об SVD и обсудим, как же, собственно, использовать всю эту математику на практике.
image

Читать дальше →
Total votes 10: ↑9 and ↓1 +8
Comments 5

Рекомендательные системы: SVD на perl

Reading time 3 min
Views 13K
Surfingbird corporate blog
В предыдущих сериях мы обсудили, что такое сингулярное разложение (SVD), и сформулировали модель сингулярного разложения с базовыми предикторами. В прошлый раз мы уже довели дело до конкретных формул апдейта. Сегодня я продемонстрирую очень простую реализацию очень простой модели, мы применим её к уже знакомой матрице рейтингов, а потом обсудим, какие получились результаты.


Читать дальше →
Total votes 7: ↑7 and ↓0 +7
Comments 3

Рекомендательные системы: оверфиттинг и регуляризация

Reading time 3 min
Views 13K
Surfingbird corporate blog
Постоянно падающая популярность предыдущих публикаций побуждает предпринимать поступки, помогающие популярность поддержать. Приметил – популярность первых публикаций порядочно превышает последующие; поэтому попробую перезагрузиться.

На протяжении предыдущих серий мы тщательно рассмотрели метод SVD и даже довели его до программного кода; начиная с этого текста, я буду рассматривать более общие вещи. Вещи эти, конечно, всегда будут тесно связаны с рекомендательными системами, и я буду рассказывать о том, как они в рекомендательных системах возникают, но постараюсь делать упор на более общих концепциях машинного обучения. Сегодня – об оверфиттинге и регуляризации.

Читать дальше →
Total votes 17: ↑16 and ↓1 +15
Comments 17

Парадокс выбора: больше не значит лучше

Reading time 3 min
Views 11K
Студия Михаила Кечинова corporate blog
Представьте, что вы пришли в интернет-магазин купить водонагреватель. В каталоге выводится набор из двух сотен вариантов. Вы не специалист в этом виде техники и не знаете, чем они отличаются и какие характеристики важны. Тем более, что большинство из них по параметрам весьма похожи. Насколько легко будет сделать выбор?

Люди теряются, когда им сразу предлагают слишком много вариантов. Зачастую они уходят туда, где выбор меньше и проще определиться. Широкий ассортимент делает нас не только пассивнее, но и мешает получить удовлетворение от хорошей сделки — заявил американский психолог Бэрри Шварц в своей книге “Парадокс выбора. Почему «больше» значит «меньше”.
Читать дальше →
Total votes 13: ↑10 and ↓3 +7
Comments 7

Похожие поисковые запросы в hh.ru

Reading time 7 min
Views 21K
HeadHunter corporate blog Search engines *Data Mining *
У большинства крупных поисковиков и сервисов есть механизм похожих поисковых запросов, когда пользователю предлагаются варианты, тематически близкие к тому, что он искал. Так делают в google, yandex, bing, amazon, несколько дней назад это появилось и у нас на hh.ru!



В этой статье я расскажу о том, как мы добывали похожие поисковые запросы из логов сайта hh.ru.
Читать дальше →
Total votes 55: ↑48 and ↓7 +41
Comments 13

Item-based коллаборативная фильтрация своими руками

Reading time 10 min
Views 18K
Онлайн-кинотеатр Иви corporate blog Python *Algorithms *
Робот-рекомендатель

Одной из наиболее популярных техник для построения персонализированных рекомендательных систем (RS, чтобы не путать с ПиСи) является коллаборативная фильтрация. Коллаборативная фильтрация бывает двух типов: user-based и item-based. User-based часто используется в качестве примера построения персонализированных RS [на хабре, в книге Т.Сегаран,...]. Тем не менее, у user-based подхода есть существенный недостаток: с увеличением количества пользователей RS линейно увеличивается сложность вычисления персонализированной рекомендации.

Когда количество объектов для рекомендаций большое, затраты на user-based подход могут быть оправданы. Однако во многих сервисах, в том числе и в ivi.ru, количество объектов в разы меньше количества пользователей. Для таких случаев и придуман item-based подход.

В этой статье я расскажу, как за несколько минут можно создать полноценную персонализированную RS на основе item-based подхода.
Читать дальше
Total votes 36: ↑35 and ↓1 +34
Comments 13

Как работают рекомендательные системы. Лекция в Яндексе

Reading time 11 min
Views 128K
Яндекс corporate blog Algorithms *Mathematics *

Привет, меня зовут Михаил Ройзнер. Недавно я выступил перед студентами Малого Шада Яндекса с лекцией о том, что такое рекомендательные системы и какие методы там бывают. На основе лекции я подготовил этот пост.





План лекции:


  1. Виды и области применения рекомендательных систем.
  2. Простейшие алгоритмы.
  3. Введение в линейную алгебру.
  4. Алгоритм SVD.
  5. Измерение качества рекомендаций.
  6. Направление развития.

Под катом вы найдете конспект лекции и презентацию
Total votes 63: ↑56 and ↓7 +49
Comments 42

Как нельзя делать рекомендации контента

Reading time 9 min
Views 22K
Surfingbird corporate blog Data Mining *Big Data *Machine learning *
Recovery mode

Во время общения с медиа мы в Relap.io часто сталкиваемся с массой заблуждений, в которые все верят, потому что так сложилось исторически. На сайте есть блоки типа «Читать также» или «Самое горячее» и т.п. Словом, всё то, что составляет обвязку статьи и стремится дополнить UX дорогого читателя. Мы расскажем, какие заблуждения есть у СМИ, которые делают контентные рекомендации, и развеем их цифрами.
 
HAbr1
 
 
Читать дальше →
Total votes 50: ↑41 and ↓9 +32
Comments 29

Городской АД: школьники и студенты

Reading time 11 min
Views 10K
Проектная школа программирования GoTo corporate blog Hackathon Studying in IT


Привет, Хабр. В этом году у нас довольно успешно прошли эксперименты по вовлечению юных программистов в АД:


  • затеяли хакатон, где школьники и студенты соревновались на равных (выиграли школьники), помогли организовать олимпиаду НТИ по большим данным.


  • открыли направление АДских чудес в летних школах. О том, как школьники написали рекомендательную систему ленты новостей Дождя, освоили параметрическое моделирование, осваивали азы социнженерии по Митнику, расскажем в следующей статье.


  • организовали митапы для "укушенных" в Яндексе с Ежом. Ёж (Александр Панин) не устоял перед обаянием юных "датасайнтистов" на хакатоне, с тех пор каждую субботу одна из переговорок превращается в Малый АД под звуки арфы, на которой Ёж играет в перерывах.

Школа


Воодушевленные упорством ребят, решили начать вовлекать студентов постарше. Задумали школу прямо в Москве, пройдет она с 1 по 8 августа на факультете компьютерных наук ВШЭ, к участию приглашаются все желающие возрастом до 22 лет.


Программа школы состоит из двух блоков: интенсива с разбором кейсов от ведущих специалистов отрасли и работы в командах над проектом с опытным куратором.


Отбор


Для участия необходимо пройти отбор – решить реальную задачу, с которой столкнулся наш партнер E­-Contenta при разработке рекомендательного движка для Tviz.tv. До 25 июля принимаем решения любым способом – интересно посмотреть на нестандартные идеи, возможно, кто переплюнет решение партнера. Опытные участники имеют возможность заявить о себе и выиграть грант на бесплатное обучение.


Наша цель — дать возможность молодёжи погрузиться в Data Science не за 180 тысяч на "взрослых" курсах. Отбор нацелен прежде всего на проверку мотивации.

Читать про задание, матричные разложения и получение приближения k-го порядка
Total votes 6: ↑6 and ↓0 +6
Comments 6

Рекомендательные системы: идеи, подходы, задачи

Reading time 11 min
Views 39K
Инфосистемы Джет corporate blog System Analysis and Design *Algorithms *Machine learning *


Многие привыкли ставить оценку фильму на КиноПоиске или imdb после просмотра, а разделы «С этим товаром также покупали» и «Популярные товары» есть в любом интернет- магазине. Но существуют и менее привычные виды рекомендаций. В этой статье я расскажу о том, какие задачи решают рекомендательные системы, куда бежать и что гуглить.
Читать дальше →
Total votes 34: ↑33 and ↓1 +32
Comments 7

Как мы разрабатываем персональные товарные рекомендации

Reading time 8 min
Views 6.7K
Mindbox corporate blog Algorithms *Machine learning *Internet marketing *

image
Наши клиенты-магазины хотят делать крутой маркетинг. Чтобы люди больше покупали, они регулярно шлют им email-рассылки. И каждый раз думают: “Что же написать в письме?”.




Можно писать просто: “Покупайте у нас почаще!”, но это не очень-то работает. Идея получше — вставлять в письмо рекламу товаров. Желательно, рекламу товаров, которые заинтересуют покупателей.


Дальше расскажу о том, как мы с нуля делали настоящие персональные рекомендации.

Читать дальше →
Total votes 13: ↑9 and ↓4 +5
Comments 13
1