Обновить
5
0

Пользователь

Отправить сообщение
Стали искать причину и выяснили, что магазины отправляли клиентам сообщения в определенный мессенджер, а его пользователи в нашем сегменте изначально покупали меньше по сравнению с другими клиентами. Об этом не знали даже маркетологи заказчика. Так что эксперимент получился некорректным, но по его результатам мы добавили в модель параметр «пользователь мессенджера»

Вам бы вообще стоило начать с корректной постановки задачи для A/B и A/A тестов, прежде чем фичи добавлять.

Напомните ценник, пожалуйста? Даже с учётом того, что может оплатить компания, выходили дороговато. Лично я хотел пойти, отношусь к целевой аудитории сей конфы, но вы даже не удосужились вывесить названия половины докладов. А после таких отмен, вообще ноль доверия к таким мероприятиям.Яндекс организовывает встречи постоянно разного уровня по DS и бесплатно. В прошлом году РАН провёл неплохую встречу и тоже бесплатно.Профит в чём от вашей конфы? Попить смузи за счёт компании?

Вы просто переворачиваете сказанное, то что вы написали вообще о частном применении нейронок, а вы в тексте посмели утверждать, что ТОЛЬКО нейронки способны работать с большими данными, это демагогия. При этом про Catboost упомянули. Не заметили, что нейронки в принципе требуют на порядок больше данных для получения удовлетворительного качества? Не знаю чего вы там разработчик, но с теорией точно не ладно в статье, о чем вам выше также указали, ещё и лезете учить новичков.

Обычно предпочитаю не комментировать, но от такой ереси глаза лезут на лоб. вы бы матчасть почитали вообще прежде чем учить кого-то. Особенно умиляет инфа что только нейронки способны обучаться на больших объемах данных. Если бы вы попробовали использовать иные алгоритмы, и сравнили бы с нейронками, то такую чушь бы не несли. И такой бредятины у вас полон весь текст

Какой стэк использовали для имплементации алгоритма ПС?

80000 рублей за 9 недель? На бигдате и вправду зарабатывают!

Ссылка на список алгоритмов была в 1-ой части, но вот Userguide, где в оглавлении можно о нём почитать.
Строго говоря, код, в отрыве от кода по примеру из первой части, вообще не будет рабочим. "tree" — произвольное название переменной, объекта-дерева хранящего значения скор.балла, которые будет принимать классифицируемые объекты из текстового файла.
Здесь более валидный пример кода, мой вариант "примерочный", но думаю лучше будет мне добавить линк с рабочим примером, если с сайта разработки что-то будет не понятно. Про описание классов следует читать в userguide, ибо описать их в рамках статейки будет избыточно.
Про архитектуру вопрос широкий, можно почитать обзор в википедии, либо на официальном сайте. По опыту, в ROOT реализовано немало крутых алгоритмов для работы с объектами: логарифмически быстрый поиск по множествам "сцепленных" root-файлов, с помощью класса TChain и пр.
А TMVA — это лишь автономная библиотека алгоритмов машинного обучения "с учителем", также написанная на С++. Макросы в TMVA лучше использовать для каких-то не очень больших объёмов данных (NB:10 млн.строк и 15 столбцов), для прототипирования производительность удовлетворительная, но если нужно обработать очень много данных, да ещё и классифицировать с помощью алгоритмически сложного SVM со временем исполнения между O(n^2) и O(n^3), то нужно вносить изменения и компилировать код. О том, какая производительность у программ на C++ Вам известно, вероятно.

Причём тут название статьи "искусственные нейронные сети для новичков" и рассказ про МНК и линейную регрессию? Конечно, понимаю, что это "часть 1", но заголовок вводит в заблуждение.

Как Вы думаете: убьёт ли Scala питон в нише прототипирования?

Справедливости ради, в моём примере код не компилируется, а запускается как макрос.
Если Вы пишите код на С++ и понимаете какими преимуществами обладают компилируемые языки перед интерпретируемыми, то этот материал для Вас. В мире физики (зарубежной) этот пакет относительно популярен; вероятно это первый русскоязычный поверхностный обзор с кодом.
Главное преимущество «наследуется» из самого пакета ROOT — метод MakeClass, с его помощью Вы получаете возможность «воссоздать» исходный код построения какой-либо модели(а это уже не прототипирование, можно и до продакшна довести), либо исходный код записи root-файла.
Опять же очень мало библиотек С++ для машинного обучения, на памяти только: dlib, shark,OpenCV.
Если ознакомится с новостями нового проекта TMVA, выпуск которого будет осенью (обещали), то разработчики планировали параллелизировать алгоритмы, дополнить имеющиеся алгоритмы новыми и тем, что есть в scikit-learn, сделать плагины для питона и R.
Всё вышеперечисленное делает библиотеку уникальной.

Информация

В рейтинге
Не участвует
Откуда
Fuschl am See, Salzburg, Австрия
Зарегистрирован
Активность