Articles / Profile of holowastik / Habr

@holowastik

Пользователь

ProfileArticles4PostsNewsComments6

holowastik Jul 25 2021 at 20:39

GraphQL запрос на GitHub

3 min

4.4K

API * GitHub *

Tutorial

В прошлый раз мы сделали простой запрос на получение списка репозиториев пользователя. Там был только код и ни чего лишнего. В этот раз попытаемся разобраться с внутренней схемой устройства ГрафКьюЭль.

Поехали!

holowastik Jul 25 2021 at 20:20

Реальный запрос репозитория GitHub средствами GraphQL

2 min

2.9K

API * GitHub *

Tutorial

Пример рабочего кода с комментариями и ничего лишнего!

Поехали!

-4

holowastik Mar 3 2021 at 20:43

Мульти-классовое целе-вероятностное кодирование переменных (Multi-Class Target Encoding)

3 min

6.4K

Machine learning * Big Data * Python *

Translation

Что не так с TargetEncoder из category_encoders?

Эта статья является продолжением предыдущей статьи, в которой объяснялось, как на самом деле работает целе-вероятностное кодирование, и теперь мы посмотрим в каких случаях стандартное решение библиотеки category_encoders дает неверный результат, а кроме того, изучим теорию и пример кода для корректного мульти-классового целе-вероятностного кодирования. Поехали!

1. Когда ошибается TargetEncoder?

Посмотрите на эти данные. Цвет - это особенность, а цель - это… цель. Наша цель - кодировать цвет на основе Target.

Теория и код >>>

holowastik Feb 28 2021 at 17:02

Вводная статья по реализации целе-вероятностного кодирования переменных (Feature Target Encoding)

4 min

11K

Python * Big Data * Machine learning *

From sandbox

Translation

Недавно я сделал проект, в котором целевая переменная была мультиклассовой, поэтому, я искал подходящие пути для кодирования категориальных признаков. Я нашёл множество статей, перечислявших преимущества кодирования через среднее значение целевой переменной перед другими методами, а также то, как выполнить эту задачу в двух строчках кода, используя библиотеку category_encoders . Однако, к своему удивлению, я обнаружил, что ни одна статья не продемонстрировала этого метода для мультиклассовой целевой переменной. Я просмотрел документацию category_encoders, и понял, что библиотека работает только для бинарных или вещественных переменных, посмотрел оригинальную работу Даниэля Мисси-Баррека (Daniele Micci-Barreca), который ввел средне-целевую кодировку (mean target encoding) и так же не обнаружил ничего толкового.

В этой статье я дам обзор документа, в котором описана кодировка по целевому признаку, и покажу на примере, как целевая кодировка работает для двоичных проблем.

Формулы, объяснения, код >>