Рассмотрим пример: у нас есть размеченный датасет, содержащий адреса электронной почты и пол их владельцев. Мы хотим создать модель, которая предсказывает пол по email. Вот как можно искать новые признаки с помощью объекта enricher:
Очень откликается мысль про то, что подготовка к конференции — это большой ресурс и времени, и энергии. Я тоже часто думаю о том, «окупится» ли участие в том или ином мероприятии. Список мотиваций, который вы привели, действительно помогает взглянуть на это шире. Было бы интересно, если бы такие причины можно было оцифровать — например, оценить для себя, сколько ценности я получаю от обмена опытом, прокачки навыков или новых контактов. Это могло бы стать хорошим инструментом для выбора: на какие конференции стоит подаваться, а какие лучше пропустить. В конце концов, время — самый ценный ресурс, и хочется вкладывать его туда, где отдача будет максимальной.
Да, в конце статьи приведен такой пример
Рассмотрим пример: у нас есть размеченный датасет, содержащий адреса электронной почты и пол их владельцев. Мы хотим создать модель, которая предсказывает пол по email. Вот как можно искать новые признаки с помощью объекта
enricher:X_trainсодержит признак — адрес электронной почты, аy_train— информацию о поле в тренировочном наборе.Интересное обновление, спасибо! А почему в бенчмарке нет сравнения с GPT?
Очень откликается мысль про то, что подготовка к конференции — это большой ресурс и времени, и энергии. Я тоже часто думаю о том, «окупится» ли участие в том или ином мероприятии. Список мотиваций, который вы привели, действительно помогает взглянуть на это шире. Было бы интересно, если бы такие причины можно было оцифровать — например, оценить для себя, сколько ценности я получаю от обмена опытом, прокачки навыков или новых контактов. Это могло бы стать хорошим инструментом для выбора: на какие конференции стоит подаваться, а какие лучше пропустить. В конце концов, время — самый ценный ресурс, и хочется вкладывать его туда, где отдача будет максимальной.