Search
Write a publication
Pull to refresh

Comments 8

Полностью согласен с вами, что есть и другие решения. В статье я сразу отметил, что не претендую на звание первооткрывателя ни в области проводимых статистических тестов, ни в области универсальности подобного решения. Я не первый и наверняка не последний, кто под свои нужды написал нечто подобное. Свидетельством тому может послужить большое количество библиотек для autoML.

Сделано с душой, благодарю. Диаграммы вполне "авторские", наглядны и не дублируют заезженный функционал EDA-либ (довольно капризных и тормозных). Вообще тут сделана попытка залезть чуть глубже в cat-анализ без привязки к предметной области, что, очевидно, является сложной задачей и преодолевается аналитиками с трудом, редко превращаясь в универсальные либы в свободном доступе. Воодушевляет на публикацию и своих разработок в этом направлении, кмк важный side-эффект.

Preproccesing Let's determine the percentage of missing values for further work with them and their processing. df.isnull().mean() * 100 del df['YEAR'] df['COMMENT'].replace({'сумма больше на 1': 'сумма исправлена'}, inplace=True) We get rid of empty values because these attributes have a low percentage of omissions and have little impact on our dataset. df = df[df['GRADE_OF_COMPETITION'].notnull()] df['ID'] = df['ID'].astype(np.int64) df = df[df['REGIONAL_STATUS'] != 'удален']

df[df['REGIONAL_STATUS'] == 'Победитель'][['SUM', 'PERCENTAGE', 'REGIONAL_STATUS']].sort_values(by='SUM', ascending=True).head(10)

Если дадите пояснение в виде предложения/вопроса, то постараюсь ответить.

Отлично, спасибо!

А не подскажете, - чисто отвлечённый вопрос, - курсы или книги, чтоб поставить себе такую базу по матстату?

На мой взгляд, лучше всего подойдут курсы от МФТИ. Можно найти лекции на ютубе. Если же говорить прям о курсах в классическом понимании (с решением задачек и т.д.), то на платформе stepic можно найти курс "Основы статистики", а также дополнительно можно пройти курс от Carpov Course по математике для анализа данных.

Sign up to leave a comment.