Обновить
1
0

Пользователь

Отправить сообщение

Наброшу еще недостатков колаба:

  1. Куций и постоянно уменьшающийся бесплатный тариф. Проплатить из РФ может быть целым приключением

  2. Изначально - только 12 ГБ RAM. Если работать со сколько-то приличным датасетом и/или требовательной к памяти моделью - ООМ обеспечен

  3. Суточная квота - около 6 часов. По моим наблюдениям +- рандом

  4. Необходимо проявлять активность в течение получаса, иначе сессия слетает. Т.е. надолго трениться модель просто так не оставишь

  5. Бывают проблемы с сетью - зависимости могут ставиться долго и далее разбиваемся о пункт 4

  6. Наиболее простой способ обеспечить персистентность данных и выхлопов - через Гугл диск. Но и тут не без проблем - иногда задержка записи в диск может составлять до 12 часов

  7. Из категории свистелки, но все же: медленный автокомплит

Таким образом, при наличии сколько-то серьезной задачи и хотя бы сравнимого по мощности железа оказывается куда выгоднее поднять Jupyter Notebook/Jupyter Hub и жить припеваючи.

Вывод в целом на практике известный, описание неплохое. Можно бы было добавить статистическое сравнение разных групп запусков, чтобы понимать, что наблюдаемое снижение точности при увеличении кол-ва нейронов в данном случае это не случайность, а результат оверфита.

Но для полной задокументированности эксперимента было бы неплохо добавить репозиторий с кодом, т.к. из описания не понятно, использовались ли LR scheduler, нормалицазии, регуляризации, аугментации и т.п.

Стоит добавить в рассмотрение polars

Ее уже перевели кстати

Особо заинтересованным в теме стоит ознакомиться с этим постом. Работа с конечными автоматами рассмотрена куда глубже

Жаль, что этот шедевр прошел мимо подборки)

У Тальмы Лобель в книге "Горячая чашка в холодный день" отдельный раздел посвящен результатам связанным с цветовым восприятием. В том числе в одной из упоминаемых работ показали, что красный цвет формы коррелирует с более высокой вероятностью победы. Так что можно попробовать добавить цвета формы как один из факторов. Еще было бы интересно посмотреть на влияние результата в прошлом матче и в прошлом матче с этой командой.

Для меня еще одной киллер-фичей была поддержка (La)TeX для формул. Думаю, этот критерий достоин стать отдельной колонкой.

CRISP-DM на иллюстрации же неверно последние два этапа - Model evaluation и Deployment должны быть

Во многих местах был согласен с мнением автора, однако было бы здорово увидеть и какие-то объективные метрики.

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность