Pull to refresh
19
0
kizill @kizill

Разработчик C++

Send message

Путь, который занял 100* лет: встречаем CatBoost 1.0.0

Reading time5 min
Views20K


Всем привет. Меня зовут Станислав Кириллов, я работаю в команде, которая отвечает за развитие библиотеки машинного обучения CatBoost. Мы впервые поделились ей с сообществом четыре года назад — хотя мы привыкли строить бинарные деревья, поэтому и отсчёт лет предпочитаем вести так же. Это шутка, конечно, но «столетие» — хороший повод для выпуска первой «production ready» версии библиотеки с символичным номером 1.0.0.

Сегодня я кратко отвечу, почему мы считаем выпуск версии 1.0.0 важной вехой, и подсвечу главные изменения (и в новой версии, и в целом за год). А уже завтра выступлю с рассказом на встрече, которая будет целиком и полностью посвящена практике применения CatBoost и противостоянию нейросетей и градиентного бустинга. Если эти слова для вас что-то значат, то добро пожаловать под кат.

Читать дальше →
Total votes 45: ↑44 and ↓1+58
Comments8

Введение в разработку CatBoost. Доклад Яндекса

Reading time10 min
Views18K
Меня зовут Стас Кириллов, я ведущий разработчик в группе ML-платформ в Яндексе. Мы занимаемся разработкой инструментов машинного обучения, поддержкой и развитием инфраструктуры для них. Ниже — мой недавний доклад о том, как устроена библиотека CatBoost. В докладе я рассказал о входных точках и особенностях кода для тех, кто хочет его понять или стать нашим контрибьютором.


— CatBoost у нас живет на GitHub под лицензией Apache 2.0, то есть открыт и бесплатен для всех. Проект активно развивается, сейчас у нашего репозитория больше четырех тысяч звездочек. CatBoost написан на C++, это библиотека для градиентного бустинга на деревьях решений. В ней поддержано несколько видов деревьев, в том числе так называемые «симметричные» деревья, которые используются в библиотеке по умолчанию.

Total votes 33: ↑30 and ↓3+27
Comments5

Особенности поведения нового TCP/IP стека Windows

Reading time3 min
Views18K
Начиная с Windows Vista, компания Microsoft в своих операционных системах перешла на новый сетевой стек — Next Generation TCP/IP Stack. Стек включает в себя множество различных плюшек: Windows Filtering Platform, масштабируемое TCP-окно и прочие вкусности, однако речь пойдет совсем не о них, а об одной конкретной особенности поведения нового сетевого стека.
Всякий уважающий себя сетевой сканер должен уметь определять ОС сканируемого узла, при этом чем больше параметров используется, тем более точный ожидается результат. Например, сетевой сканер Nmap использует для определения операционной системы весьма широкий набор метрик: разнообразные TCP-метрики (поведение значений timestamp, переупорядочивание TCP-опций), IP-метрики (алгоритм генерации порядкового номера пакета, обработка флагов IP-пакета) и иные метрики.

Мы в Positive Technologies тоже занимаемся сбором метрик и определением версии ОС, поэтому хотелось бы рассказать о недавно обнаруженной мною метрике, позволяющей идентифицировать Windows-системы с новым стеком.
Читать дальше →
Total votes 37: ↑33 and ↓4+29
Comments14

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Works in
Registered
Activity