Как стать автором
Обновить
10
0

Пользователь

Отправить сообщение

Препроцессинг данных и анализ моделей

Время на прочтение8 мин
Количество просмотров31K
Всем привет. В прошлом посте я рассказывал про некоторые базовые методы классификации. Сегодня, в силу специфики последней домашки, пост будет не столько про сами методы, сколько про обработку данных и анализ полученных моделей.

Задача


Данные были предоставлены факультетом статистики Мюнхенского университета. Вот здесь можно взять сам датасет, а также само описание данных (названия полей даны на немецком). В данных собраны заявки на предоставление кредита, где каждая заявка описывается 20 переменными. Помимо этого, каждой заявке соответствует, выдали ли заявителю кредит, или нет. Вот здесь можно подробно посмотреть, что какая из переменных означает.

Нашей задачей стояло построить модель, которая предсказывала бы решение, которое будет вынесено по тому или иному заявителю.


Читать дальше →
Всего голосов 31: ↑27 и ↓4+23
Комментарии15

Распознавание рукописных символов с использованием Python и scikit

Время на прочтение5 мин
Количество просмотров29K
Привет. Наверняка многие интересуются методами машинного обучения и решения различных задач, которые обычными подходами не решаются. Недавно мне посчастливилось попасть на курс Data Mining, организованный в рамках программы GameChangers. Первым же домашним заданием было сделать сабмит на Kaggle — решить задачу Digit Recognizer.
Читать дальше →
Всего голосов 22: ↑22 и ↓0+22
Комментарии7

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность