Search
Write a publication
Pull to refresh
0
@trader007read⁠-⁠only

User

Send message

CatBoost, XGBoost и выразительная способность решающих деревьев

Reading time42 min
Views64K

Сейчас существенная часть машинного обучения основана на решающих деревьях и их ансамблях, таких как CatBoost и XGBoost, но при этом не все имеют представление о том, как устроены эти алгоритмы "изнутри".

Данный обзор охватывает сразу несколько тем. Мы начнем с устройства решающего дерева и градиентного бустинга, затем подробно поговорим об XGBoost и CatBoost. Среди основных особенностей алгоритма CatBoost:

• Упорядоченное target-кодирование категориальных признаков
• Использование решающих таблиц
• Разделение ветвей по комбинациям признаков
• Упорядоченный бустинг
• Возможность работы с текстовыми признаками
• Возможность обучения на GPU

В конце обзора поговорим о методах интерпретации решающих деревьев (MDI, SHAP) и о выразительной способности решающих деревьев. Удивительно, но ансамбли деревьев ограниченной глубины, в том числе CatBoost, не являются универсальными аппроксиматорами: в данном обзоре приведено собственное исследование этого вопроса с доказательством (и экспериментальным подтверждением) того, что ансамбль деревьев глубины N не способен сколь угодно точно аппроксимировать функцию y = x_1 x_2 \dots x_{N+1}. Поговорим также о выводах, которые можно из этого сделать.

Читать далее

8 ошибок, из-за которых ты проиграешь в соревновательном Data Science

Reading time8 min
Views16K

Привет, чемпион!

Если ты читаешь этот пост, значит, тебе стало интересно, не допускаешь ли этих ошибок ты?! Почти уверен, что ты допускал эти ошибки хотя бы раз в жизни. Мы не застрахованы от совершения ошибок, такова наша человеческая натура — ошибаться для нас естественно. Однако, я постараюсь уберечь тебя от тех ошибок, которые совершал сам или замечал у других.

Так вышло, что за время участия в чемпионатах по соревновательному анализу данных я достаточно часто бывал в призовых местах. Однако, бывали случаи, когда я лишался призовых по глупости или неосторожности. Рассказываю по порядку.
Читать дальше →

«А скидка будет?»: что делать, если клиент торгуется?

Reading time3 min
Views9.2K

Вы эксперт в своем деле, помогаете людям достигать целей, можно сказать, «ведете их к Олимпу», но в ответ на озвученную цену получаете лишь обидное «А скидка будет?» Как в таком случае быть? Отказаться от сотрудничества или попытаться понять заказчика и нейтрализовать причины? Разбираемся вместе.

Читать далее

Современное пиратство глазами моряка

Reading time6 min
Views71K

Автор: Илья Копосов

Здравствуйте. Сегодня я хочу рассказать вам о современном морском пиратстве, как от него защититься и чего это стоит. Из первых рук, так сказать, – рук штурмана торгового флота.

Как защитить своё судно от нападения? Для этого нужно изучить тактику пиратов, их цели и задачи, построить две линии обороны (о них я расскажу подробнее) и продумать пути отступления. Если вы любите играть в пошаговые стратегии, то вам понравится, поехали.

Читать далее

Яндекс.Практикум и “вхождение в айти”

Reading time6 min
Views19K

Зачем статья с отзывом о курсе на Хабре? Большая часть аудитории скорее всего уже работает в it, но у многих есть знакомые, которые интересуется вопросом “входа в айти”, и я пишу эту статью для того, чтобы её можно этим знакомым скинуть. На Хабре недавно был отзыв на Яндекс.Практикум, автор учился со мной на том же направлении и даже на том же потоке. Там я оставлял комментарий, где обещал написать свой отзыв. В общем, вот он. 

Почему из всего многообразия курсов я выбрал именно Яндекс.Практикум? Я внимательно смотрел программы, и у Практикума была адекватная в плане того, сколько технологий планировалось изучить за срок обучения (10 месяцев). Конкуренты, входящие в состав mail.ru (которая теперь ВК) не рассматривались мною из-за предвзятого отношения к компании, курсы остальных конкурентов (и самого Практикума) я скачал с сайтов со складчинами и пролистал по диагонали. То, что я увидел у Яндекса, понравилось мне больше всего. 

Читать далее

Беда “войти в айти” или курсы тестировщика, отзывы: Глава 2.2, в которой сильный испанский стыд

Reading time18 min
Views43K

Спросивший подобное студент - или махровый гуманитарий, или смотрел лекцию в полглаза параллельно с чем-то развлекательным. Сложно понять, что подобные личности вообще забыли в айти. Понятно, что хочется по-быстрому пройти онлайн-курс и зарабатывать нормальные деньги. Но совесть-то должна быть!

Так и хочется осудить нерадивого олуха, верно? Давайте не будем торопиться. Потому что автор, не один год проработав разработчиком, естественно, использовал перечисленное на картинке. Но к концу просмотра лекции известного учебного центра и сам уже начал испытывать некоторые сомнения в том, что и чем все-таки является.

Читать что там дальше написано по делу

[Личный опыт] Поиск работы в разных странах: популярные сервисы, испытательный срок и бумажная волокита

Reading time4 min
Views6.9K

В разных статьях о релокейте мы касались темы работы: наши герои рассказывали, где искали вакансии, какие документы оформляли, с какими трудностями столкнулись при поиске и смене работы. Решили собрать еще один подобный материал, но про несколько стран: Нидерланды, Сингапур и Германию. Читайте и пишите в комментарии, про особенности поиска работы в каких еще странах хотели бы узнать.

Читать далее

Сохранить остроту ума в любом возрасте

Reading time9 min
Views13K

Ключевые идеи неизданной на русском книги «Сохранить ум острым» («Keep Sharp») известного нейрохирурга и писателя Санджая Гупты.

Прочитав обзор книги, вы узнаете о потребностях мозга и о том, как сохранить его здоровье в течение долгого времени и не потерять остроту ума.

Читать далее

Беда “войти в айти” или курсы тестировщика отзывы: Глава 2.1, в которой легкий испанский стыд

Reading time14 min
Views49K

Автор понимает, что труд преподавателя не сахар и с большим уважением относится к лучшим представителям жанра. Но у автора нет и стокгольмского синдрома, так как он целиком согласен с чуть перефразированным принципом “если можешь не преподавать - не преподавай”. Как развитие нашей цивилизации пока сложно представить без хороших учителей, так и плохой преподаватель хуже серийного убийцы. Пользуясь случаем, автор передает привет соответственно учителю математики и учителю английского языка.

Итак, давайте разберем преподавателей на винтики и поменяемся с ними ролями - проставим их вводным онлайн-курсам QA оценки.

Читать что там дальше написано по делу

3 главных Data-профессии: обзор компетенций и зарплат

Reading time7 min
Views19K

Data Science выходит в массы. Настолько, что пора напомнить основы, почти что на пальцах. Скоро вполне может появиться множество вакансий c Data Science в заголовке, явно заниженной зарплатой и требованиями к начинающему аналитику, поэтому давайте внесём ясность.

Если вы слышите о Data Science из каждого мегафона и утюга — и окончательно запутались, гуглите "Data Science в Excel", или всё понимаете и хотите объяснить науку о данных кому-то простыми словами, эта статья тоже для вас. А для продвинутых и знающих людей у нас есть другие материалы о практической стороне вопроса.

Читать далее

Интеллектуальная производительность без выгорания: 7 техник использования мозга. Часть 1

Reading time18 min
Views60K

В предыдущей статье я рассказал про пластичность мозга. Сегодня предлагаю первые три техники ее тренировки. Идея очень простая: представьте себе, что ваша работа состоит не в том, чтобы строить окружающую жизнь. И не в том, чтобы вручную управлять карьерой и взаимоотношениями в окружающем мире, тратя на это ограниченный ресурс нашей силы воли.

Идея в том, чтобы выстроить систему — некую совокупность процессов, которые будут воспроизводиться и обеспечивать необходимый результат с меньшими усилиями. Сила воли будет тратиться для настройки шаблонов наших нейромашин. А качество шаблонов напрямую связано с качеством нашей жизни: именно они позволяют нам показывать высокие результаты в работе, личной жизни, заботе о себе и построении всей жизни в те моменты, когда мы не следим за этим осознанно.

Читать далее

Почему 87% проектов data science не добираются до продакшена?

Reading time4 min
Views4.2K

«Если ваши конкуренты применяют ИИ и они нашли способ, позволяющий им ускориться, то они оторвутся от вас очень быстро», — поделилась CTO компании IBM по data science и ИИ Дебора Лефф на сцене Transform 2019.

В другом докладе, «Что вообще такое — работать с ИИ?» Лефф и старший вице-президент Gap по данным и аналитике Крис Чапо углубились в рассуждения о том, почему многие компании по-прежнему зря тратят время или терпят поражение, пытаясь реализовать стратегии работы с ИИ. И всё это несмотря на то, что преимущество, которым обладали крупные компании перед мелкими, теперь исчезло, а парадигма полностью изменилась. Благодаря ИИ быстрые компании обгоняют по эффективности медленные, вне зависимости от их размера. А крошечные безымянные компании отбирают долю рынка у гигантов.

Но если понимание того, что ИИ действительно даёт конкурентное преимущество, есть у всех, то почему до стадии продакшена добирается всего 13% проектов data science, или почти каждый десятый?
Читать дальше →

«А вот все эти зубы — к чёртовой матери» — случай пациента

Reading time8 min
Views40K
Одним прекрасным утром мы взяли и удалили пациенту все зубы верхней челюсти. Для него это выглядело примерно как 10 лет мучений, потом пациент потерял сознание и все верхние зубы.

image

Затем проснулся, на часах — плюс четыре часа, во рту все зубы новые (импланты и временная конструкция).

Расскажу просто эпический случай мужика, который пострадал от российской медицины далеко не один раз. Итак, на момент приёма у нас пациенту 75 лет. Он несколько десятков лет наблюдался у своего постоянного стоматолога, но его привело в некоторое сомнение то, что последнее, что он ему сделал, отвалилось через неделю. И мужчина решил получить второе мнение. Мы и были вторым мнением. На диагностике мы увидели, что каналы корней вылечены плохо и давно, перелечивать их смысла уже нет, потому что ткани над десной тоже почти нигде нет. И из этих фрагментов зубов показываются штифты, то есть культевые вкладки потеряли герметичность. Вторичный кариес дополняет картину постапокалипсиса.

Как можно довести зубы до такого состояния? С трудом. Как оказалось, нужно просто наблюдаться у своего единственного врача. У меня есть много гипотез, что же пошло не так, но мы не узнавали эту часть, поэтому давайте остановимся на объективных данных, то есть полученных инструментальными способами.
Читать дальше →

Ontol: Самые полезные материалы для релокейта в любую страну мира

Reading time8 min
Views23K
image

В предыдущей подборке самых полезных материалов про визу O-1 много спрашивали про релокейт в Европу. Я целый день копал рунет и накопал полезное про релокейт не только в Европу, но почти куда угодно: Азию, Латинскую Америку, Австралию, Ближний Восток, Африку, Китай и даже… в Россию. Всего про 49 стран.

Недавний (пару недель назад) опрос 2423 ИТишников (50% Senior, 30% Middle, 10% Junior):

  • 23% в ближайшие 5 лет точно уеду (563)
  • 18% уже уехал (443)
  • 37% колеблюсь (900)
  • 21% не собираюсь уезжать в принципе (517)


Онтол — это ресурс призванный помочь максимально раскрыть ваш потенциал: поступить в самый полезный для вас университет, жить в максимально эффективном месте на планете, свободно перемещаться, работать на работе мечты, читать нужные книги.

В конце поста — опрос.

(Если у вас есть полезные ссылки на «личный опыт» по релокейту, который вам понравился, делитесь, буду признателен.)
Читать дальше →

Data Science: лучшие учебные курсы и программы сертификации

Reading time7 min
Views26K
Можно получить два-три десятка Data Science-сертификатов, но по-настоящему стоящих программ сертификации из сферы науки о данных, по моему мнению, не так уж и много. Я хочу рассказать о нескольких таких программах, поддерживаемых авторитетными организациями. Эти программы я оцениваю по разным признакам. В частности — по объёму рассматриваемых в их рамках тем, по их «весу» в глазах потенциального работодателя, по репутации организации, реализующей программу. В последние несколько лет я являюсь и специалистом по анализу данных, и дата-сайентистом. Всё это время у меня формировалось понимание того, что сильнее всего влияет на успех человека в сфере Data Science (DS).



Здесь я рассмотрю ведущие программы Data Science-сертификации, входящие в список, собранный ресурсом Indeed. Из этого списка я выбрал четыре, которые кажутся мне наиболее достойными. Им и посвящён этот материал.
Читать дальше →

Осознанная ходьба для удаленщика

Reading time7 min
Views30K

Я работаю на полной удаленке уже 10 лет. Стоит ли говорить, что проблема сидячего образа жизни все эти годы стоит ребром? Мой пример немного не типичен тем, что какое-то движение в жизни было всегда - сидячей работе сопутствовали эпизодические высокие нагрузки пару раз в месяц (выезды в условный лес). Но этого определенно недостаточно. Нужна именно регулярность.

Сегодня расскажу про самую простую физическую активность из тех, которые можно практиковать каждый день - обычную (не спортивную) ходьбу. Под катом о том, почему она отлично подходит в том числе для удаленки и насколько масштабными могут быть результаты от банальных прогулок.

Читать далее

5 факторов, которые нужно учитывать при прогнозировании товарных запасов

Reading time5 min
Views4K

Привет, Хабр! Меня зовут Александр Грицай, CEO компании Forecast NOW!. Сегодня я хотел бы поговорить о работе с товарными запасами - аналитике, прогнозировании и т.п. Все это - важно для любой отрасли, где продают что-то материальное, товары, которые хранятся на складе. 

Формирование товарных запасов — в первую очередь прогноз: какие товары будут проданы, в каком количестве, как будет изменяться спрос. К сожалению, просчеты могут обернуться для компании значительными убытками или упущенной выгодой. Сегодня поговорим о том, какие факторы нужно учитывать, чтобы этого не произошло и на складе было столько продукции, сколько нужно.

Читать далее

Как мотивировать команду? Про обещания руководителя, правильный фидбэк и выгорание сотрудников

Reading time11 min
Views6.6K


Обсуждаем мотивацию сотрудников в IT: чем компании привлекают и удерживают таланты в 2021 году, как предотвращать выгорания и почему мотивация не должна завязываться только на отношениях «руководитель-подчиненный».

  • После определенного уровня заработной платы, денежное вознаграждение теряет свою ценность.
  • Здоровая команда, с правильной внутренней и внешней коммуникацией, сама себя мотивирует.
  • Если компания / команда / проект в тяжелой ситуации, скажите сотрудникам об этом честно. Возможно в этой ситуации будет стратегически верно профакапить показатели, но решить проблемы, чтобы потом нормально двигаться дальше.
  • Демотивированный ≠ выгревший. Демотивированному сотруднику еще можно помочь.
  • Замена части своих рутинных задач на новые помогает вернуть мотивацию.

Читать дальше →

Простое эконометрическое прогнозирование

Reading time3 min
Views6.2K

Прогнозирование – это важный инструмент экономики. Оно позволяет осуществлять рациональные закупки, вырабатывать долгосрочные планы действий или же, как в случае аудита, спрогнозировать будущие затраты. Прогнозирование так же является одной из областей Data Science.

Давайте рассмотрим создание простой прогнозной модели на основе линейного тренда с помощью эконометрических методов.

Возьмем некоторый набор данных (можно найти в репозитории Github, ссылка в конце статьи). Примем, что генезис не имеет значения (прим. автора – происхождение), но учтем, что данные имеют нормальное распределение:

Читать далее
1
23 ...

Information

Rating
Does not participate
Registered
Activity