Как стать автором
Обновить

Комментарии 5

Не воспринимайте вопрос как провокационный, реально интересно — если сформировалось такое сильное и уникальное сообщество, то почему не появляются реальные применения в бизнесе? Пока осведомленность где-то на уровне 'давайте проведем хакатон, чтобы прощупать почву'. Бума вакансий тоже нет, отдельные случаи только. Кейсов успешного внедрения тоже мало по моему мнению. Не слышно про какие-то бомбовые проекты, которые взорвали App Store/Google play. Стаканием xgboost'ов особо никого не впечатлишь же.

Интересно откуда берется предубеждение что нету реальных применений в бизнесе? :) Взять хотя-бы несколько видеозаписей с проведенных нами DS кейс-клубов — как и что работает в играх, телекоме, ритейле и тяжелой индустрии. Вдовесок к этому, в ноябре буду презентовать в другом месте архитектурную карту из нескольких десятков кейсов и применений в одном только банкинге (которые тоже будут широко доступны). Применения поискать не сложнее чем писать что их нет :)


Про бум вакансий — опять же — ищущий да обрящет :) За последнюю неделю у нас опубликованы вакансии Одноклассников, EMBL, "МаксимаТелеком", iPavlov, Game Insight, Datalytica и Сколтеха. Если их не искать то действительно ни бума ничего не найти. О том что их раз в 5 больше чем 2 года назад думаю говорить бессмысленно — никто же проверять не будет.


И еще, кажется Вы путаете людей которые "давайте проведем хакатон чтобы прощупать почву" и несколько тысяч видавших виды землекопов этой самой почвы.

Предубеждение основывается на инфопотоке, в основном Хабр, несколько групп в ВК, чат ML Boot camp. В этих местах новостей про успешные кейсы практически нет. Курс на слуху, вопросов нет, сам проходил — понравилось!
Если кейсы есть, и есть чем парировать вопрос, это очень хорошо, но опять же тема для размышлений открывается, если идея популяризация сообществу не чужда — если интересующийся темой (я) видит мало, то много ли видит обыватель?

По поводу обучения решающих деревьев на gpu — на самом деле, уже довольно давно большая часть формул ранжирования яндекса учится как раз на gpu (чтобы понять, насколько давно вот статья про это аж 2013 года www.osp.ru/os/2013/08/13037858 Ускоряется обучение при переходе на gpu в десятки раз (ускорение зависит от функции потерь), это как раз связано с тем, что большую часть времени при обучении деревьев занимают весьма маленькие и локальные задачи: посчитать производные, построить гистограмки, обратить матрицу. А за счет того, что поставить N видеокарт можно в одну систему, они еще и заметно проще масштабируются — не нужно собирать CPU кластер с отличной сетью и/или RDMA.
Совсем-совсем скоро будет большой анонс gpu версии нашего catboost, но бета версию уже можно найти в репозитори: github.com/catboost/catboost/tree/master/catboost/cuda
Так это же статья на Великом и Могучем. Янки ее и прочесть-то не смогли бы)
Зарегистрируйтесь на Хабре , чтобы оставить комментарий