Комментарии / Профиль Fontanka135 / Хабр

Пользователь

Подписчики

Что дает рознице машинное обучение: пример проекта

Fontanka135 21 ноя 2018 в 09:24

Стали искать причину и выяснили, что магазины отправляли клиентам сообщения в определенный мессенджер, а его пользователи в нашем сегменте изначально покупали меньше по сравнению с другими клиентами. Об этом не знали даже маркетологи заказчика. Так что эксперимент получился некорректным, но по его результатам мы добавили в модель параметр «пользователь мессенджера»

Вам бы вообще стоило начать с корректной постановки задачи для A/B и A/A тестов, прежде чем фичи добавлять.

SmartData 2018: Первая отменённая конференция JUG.ru Group

Fontanka135 7 сен 2018 в 07:20

Напомните ценник, пожалуйста? Даже с учётом того, что может оплатить компания, выходили дороговато. Лично я хотел пойти, отношусь к целевой аудитории сей конфы, но вы даже не удосужились вывесить названия половины докладов. А после таких отмен, вообще ноль доверия к таким мероприятиям.Яндекс организовывает встречи постоянно разного уровня по DS и бесплатно. В прошлом году РАН провёл неплохую встречу и тоже бесплатно.Профит в чём от вашей конфы? Попить смузи за счёт компании?

Bigdata, машинное обучение и нейросети – для руководителей

Fontanka135 30 мая 2018 в 14:41

Вы просто переворачиваете сказанное, то что вы написали вообще о частном применении нейронок, а вы в тексте посмели утверждать, что ТОЛЬКО нейронки способны работать с большими данными, это демагогия. При этом про Catboost упомянули. Не заметили, что нейронки в принципе требуют на порядок больше данных для получения удовлетворительного качества? Не знаю чего вы там разработчик, но с теорией точно не ладно в статье, о чем вам выше также указали, ещё и лезете учить новичков.

Bigdata, машинное обучение и нейросети – для руководителей

Fontanka135 30 мая 2018 в 06:23

Обычно предпочитаю не комментировать, но от такой ереси глаза лезут на лоб. вы бы матчасть почитали вообще прежде чем учить кого-то. Особенно умиляет инфа что только нейронки способны обучаться на больших объемах данных. Если бы вы попробовали использовать иные алгоритмы, и сравнили бы с нейронками, то такую чушь бы не несли. И такой бредятины у вас полон весь текст

-1

Искусственный интеллект в поиске. Как Яндекс научился применять нейронные сети, чтобы искать по смыслу, а не по словам

Fontanka135 2 ноя 2016 в 23:38

Какой стэк использовали для имплементации алгоритма ПС?

Школа Данных «Билайн», на Неве

Fontanka135 10 окт 2016 в 22:27

80000 рублей за 9 недель? На бигдате и вправду зарабатывают!

Стилизация изображений с помощью нейронных сетей: никакой мистики, просто матан

Fontanka135 19 авг 2016 в 15:51

например?

Машинное обучение с помощью TMVA. Reader модели

Fontanka135 10 авг 2016 в 19:02

"Здесь более валидный пример кода"

Машинное обучение с помощью TMVA. Reader модели

Fontanka135 5 авг 2016 в 09:58

Ссылка на список алгоритмов была в 1-ой части, но вот Userguide, где в оглавлении можно о нём почитать.
Строго говоря, код, в отрыве от кода по примеру из первой части, вообще не будет рабочим. "tree" — произвольное название переменной, объекта-дерева хранящего значения скор.балла, которые будет принимать классифицируемые объекты из текстового файла.
Здесь более валидный пример кода, мой вариант "примерочный", но думаю лучше будет мне добавить линк с рабочим примером, если с сайта разработки что-то будет не понятно. Про описание классов следует читать в userguide, ибо описать их в рамках статейки будет избыточно.
Про архитектуру вопрос широкий, можно почитать обзор в википедии, либо на официальном сайте. По опыту, в ROOT реализовано немало крутых алгоритмов для работы с объектами: логарифмически быстрый поиск по множествам "сцепленных" root-файлов, с помощью класса TChain и пр.
А TMVA — это лишь автономная библиотека алгоритмов машинного обучения "с учителем", также написанная на С++. Макросы в TMVA лучше использовать для каких-то не очень больших объёмов данных (NB:10 млн.строк и 15 столбцов), для прототипирования производительность удовлетворительная, но если нужно обработать очень много данных, да ещё и классифицировать с помощью алгоритмически сложного SVM со временем исполнения между O(n^2) и O(n^3), то нужно вносить изменения и компилировать код. О том, какая производительность у программ на C++ Вам известно, вероятно.

Математика для искусственных нейронных сетей для новичков, часть 1 — линейная регрессия

Fontanka135 3 авг 2016 в 10:47

Причём тут название статьи "искусственные нейронные сети для новичков" и рассказ про МНК и линейную регрессию? Конечно, понимаю, что это "часть 1", но заголовок вводит в заблуждение.

О пользе технологий больших данных в повседневной жизни

Fontanka135 23 июл 2016 в 11:37

Как Вы думаете: убьёт ли Scala питон в нише прототипирования?

-1

Машинное обучение с помощью TMVA (ROOT)

Fontanka135 22 июл 2016 в 20:06

Справедливости ради, в моём примере код не компилируется, а запускается как макрос.

Машинное обучение с помощью TMVA (ROOT)

Fontanka135 22 июл 2016 в 19:37

Если Вы пишите код на С++ и понимаете какими преимуществами обладают компилируемые языки перед интерпретируемыми, то этот материал для Вас. В мире физики (зарубежной) этот пакет относительно популярен; вероятно это первый русскоязычный поверхностный обзор с кодом.
Главное преимущество «наследуется» из самого пакета ROOT — метод MakeClass, с его помощью Вы получаете возможность «воссоздать» исходный код построения какой-либо модели(а это уже не прототипирование, можно и до продакшна довести), либо исходный код записи root-файла.
Опять же очень мало библиотек С++ для машинного обучения, на памяти только: dlib, shark,OpenCV.
Если ознакомится с новостями нового проекта TMVA, выпуск которого будет осенью (обещали), то разработчики планировали параллелизировать алгоритмы, дополнить имеющиеся алгоритмы новыми и тем, что есть в scikit-learn, сделать плагины для питона и R.
Всё вышеперечисленное делает библиотеку уникальной.