Comments 15
сейчас на Kaggle запуск ноутбуков на приватных данных осуществляется без доступа к интернету
зависит от competition, во многих можно не только данные подкачать, но и собственные библиотеки скомпилировать (через одно место)
Отличная статья и полезные советы, не только для кэгглеров, но и для преподавателей курсов!
Ещё стоит отметить использование сторонних данных, валидация на сторонних данных, ручная разметка, pseudo labeling основанный на них. Не везде это запрещено правилами
так ждал историю о ppleskov, когда данные скрейпятся и тупо (ок, далеко не тупо) подсовываются в код и дают скор почти 1
Занятно. Нашел описание на английском: https://www.theregister.com/2020/01/21/ai_kaggle_contest_cheat/
Помни, сильный тот, кто играет честно!
Запомнил
Спасибо про интересную статью! Про последний способ читиринга не знал)
Эх, помню былые времена, когда засылал сабмиты только с нулями и только с единичками, чтобы по по формуле Байеса узнавать распределение классов в тесте и делать более точную колибровку засылаемых сабмитов)
df.shape - это же свойство, а не метод, круглые скобки не нужны. Неужели никто из читающих не заметил ) А так полезная заметка, хотя большинство методов уже встречалось.
А кроме шашешчек зачем учавствовать в соревнованиях?
Призы бывают очень солидные)
В казино тоже на Zero когда ставитшь 1:36 ..
5 грязных трюков в соревновательном Data Science, о которых тебе не расскажут в приличном обществе