Феерический финал конкурса Netflix / Хабр

5100 программистских коллективов из 185 стран приняли участие в сугубо гиковском конкурсе Netflix Prize с главным призом в миллион долларов.

Конкурс завершился вчера в 18:42:37 UTC, ровно через 30 суток после того, как один из претендентов добился требуемого результата (RMSE меньше 0,8563). Финиш получился поистине феерическим: сразу после первого претендента появился второй, между ними разгорелась жесточайшая борьба. Буквально в последние часы претенденты несколько раз менялись местами друг с другом!

Многие из нас с азартом следили в реальном режиме времени за развязкой этого увлекательного состязания. В итоге победителя от второго призёра разделило всего 0,0001 балла. Судьба миллиона долларов была решена только за 4 минуты до дедлайна — это при том, что конкурс продолжался с 2 октября 2006 года. Кто сказал, что математические конкурсы не могут быть драматическими?

Компания Netflix занимается прокатом кинофильмов, как в онлайне, так и в оффлайне. Основой их бизнеса является уникальная система рекомендаций Cinematch. Она предсказывает, какие фильмы могут понравиться человеку на основе его прошлых оценок других фильмов. Как известно, именно системы рекомендаций являются чашей Грааля для современных приложений электронной коммерции.

По правилам конкурса Netflix, на главный приз в миллион долларов могла претендовать команда разработчиков, которая сможет улучшить эффективность Cinematch минимум на 10%. Для настройки конкурсных алгоритмов был опубликован набор исходных пользовательских данных: это 100 млн оценок (от 1 до 5 баллов) по 18 тыс. фильмам от 480 тыс. случайно выбранных юзеров. Для проверки результатов был опубликован набор из пар пользователей и фильмов, а алгоритм должен был максимально точно предсказать выставленные оценки, при этом подсчитывалась средняя ошибка RMSE (root mean squared error). Она должна была минимум на 10% улучшить показатель алгоритма Cinematch (0,9525). То есть нужно было показать 0,8572 или меньше.

Конкурс продолжался почти три года. Разработчики демонстрировали всё лучший результат, и в конце концов несколько команд программистов решили объединить усилия и совершить рывок. Так появилась команда BellKor's Pragmatic Chaos, которой 26 июня 2009 года наконец-то удалось улучшить результат на заветные 10,08%. По правилам, после этого у остальных участников было 30 суток, чтобы улучшить результат. И конкуренты воспользовались шансом. Менее чем за 24 часа до дедлайна команда The Ensemble улучшила результат до 10,09%.

Программисты из BellKor тоже не спали в шапку. Видимо, они были готовы к этому, и за 24 минуты до дедлайна они выложили новую заявку, с результатом таким же, как у конкурента.

Но и команда The Ensemble подготовила «двухходовку». Они ответили буквально двадцать минут спустя, то есть за четыре (!) минуты до дедлайна, результатом 10,10%, и у BellKor уже банально не оставалось времени.

Таким образом, конкурс завершился победой команды The Ensemble. После проверки результатов они должны получить свой заслуженный миллион.