Куций и постоянно уменьшающийся бесплатный тариф. Проплатить из РФ может быть целым приключением
Изначально - только 12 ГБ RAM. Если работать со сколько-то приличным датасетом и/или требовательной к памяти моделью - ООМ обеспечен
Суточная квота - около 6 часов. По моим наблюдениям +- рандом
Необходимо проявлять активность в течение получаса, иначе сессия слетает. Т.е. надолго трениться модель просто так не оставишь
Бывают проблемы с сетью - зависимости могут ставиться долго и далее разбиваемся о пункт 4
Наиболее простой способ обеспечить персистентность данных и выхлопов - через Гугл диск. Но и тут не без проблем - иногда задержка записи в диск может составлять до 12 часов
Из категории свистелки, но все же: медленный автокомплит
Таким образом, при наличии сколько-то серьезной задачи и хотя бы сравнимого по мощности железа оказывается куда выгоднее поднять Jupyter Notebook/Jupyter Hub и жить припеваючи.
Вывод в целом на практике известный, описание неплохое. Можно бы было добавить статистическое сравнение разных групп запусков, чтобы понимать, что наблюдаемое снижение точности при увеличении кол-ва нейронов в данном случае это не случайность, а результат оверфита.
Но для полной задокументированности эксперимента было бы неплохо добавить репозиторий с кодом, т.к. из описания не понятно, использовались ли LR scheduler, нормалицазии, регуляризации, аугментации и т.п.
У Тальмы Лобель в книге "Горячая чашка в холодный день" отдельный раздел посвящен результатам связанным с цветовым восприятием. В том числе в одной из упоминаемых работ показали, что красный цвет формы коррелирует с более высокой вероятностью победы. Так что можно попробовать добавить цвета формы как один из факторов. Еще было бы интересно посмотреть на влияние результата в прошлом матче и в прошлом матче с этой командой.
Наброшу еще недостатков колаба:
Куций и постоянно уменьшающийся бесплатный тариф. Проплатить из РФ может быть целым приключением
Изначально - только 12 ГБ RAM. Если работать со сколько-то приличным датасетом и/или требовательной к памяти моделью - ООМ обеспечен
Суточная квота - около 6 часов. По моим наблюдениям +- рандом
Необходимо проявлять активность в течение получаса, иначе сессия слетает. Т.е. надолго трениться модель просто так не оставишь
Бывают проблемы с сетью - зависимости могут ставиться долго и далее разбиваемся о пункт 4
Наиболее простой способ обеспечить персистентность данных и выхлопов - через Гугл диск. Но и тут не без проблем - иногда задержка записи в диск может составлять до 12 часов
Из категории свистелки, но все же: медленный автокомплит
Таким образом, при наличии сколько-то серьезной задачи и хотя бы сравнимого по мощности железа оказывается куда выгоднее поднять Jupyter Notebook/Jupyter Hub и жить припеваючи.
Вывод в целом на практике известный, описание неплохое. Можно бы было добавить статистическое сравнение разных групп запусков, чтобы понимать, что наблюдаемое снижение точности при увеличении кол-ва нейронов в данном случае это не случайность, а результат оверфита.
Но для полной задокументированности эксперимента было бы неплохо добавить репозиторий с кодом, т.к. из описания не понятно, использовались ли LR scheduler, нормалицазии, регуляризации, аугментации и т.п.
Стоит добавить в рассмотрение polars
Ее уже перевели кстати
Особо заинтересованным в теме стоит ознакомиться с этим постом. Работа с конечными автоматами рассмотрена куда глубже
Жаль, что этот шедевр прошел мимо подборки)
У Тальмы Лобель в книге "Горячая чашка в холодный день" отдельный раздел посвящен результатам связанным с цветовым восприятием. В том числе в одной из упоминаемых работ показали, что красный цвет формы коррелирует с более высокой вероятностью победы. Так что можно попробовать добавить цвета формы как один из факторов. Еще было бы интересно посмотреть на влияние результата в прошлом матче и в прошлом матче с этой командой.
Для меня еще одной киллер-фичей была поддержка (La)TeX для формул. Думаю, этот критерий достоин стать отдельной колонкой.
CRISP-DM на иллюстрации же неверно последние два этапа - Model evaluation и Deployment должны быть