там и траты соответсвенно. Программист на удаленке в Киеве за 7К$ в месяц реально зарабатывает больше чем программист из Silicon Valley с зарплатой 150К$ в год
большинство решений было заточено под данный генератор, который, по условиям конкурса, остается неизменным.
Если б генератор был другим, то и решения были б другими — также и наоборот, нет смысла запускать изначальные решения под какой-то другой генератор.
судя по исходникам, пришлось реально стараться:
https://github.com/hola/challenge_word_classifier/blob/master/submissions/5732127f93f2f29d3c9acc28/solution.js
кстати, интересен комментарий 7го места по поводу рекламы конкурса и мотивации
About the challenge promotion: I think the russian page which allow comments is a lot better for motivation than the english github page. I would probably have stopped a lot sooner if I didn't go to the russian page and used google translation on the comments to have an idea of what was achievable
Сети Маркова кажутся очень красивым и интересным решением, мне тоже интересно посмотреть
Что же касается «задачи обучения», то я пришел к выводу что ни одно решение не будет лучше чем узко-направленного анализа словаря и битовой оптимизацией на уровне блюм фильтра. Максимум, что у меня выходило это 72% (в 64 Кб рамках)
Зато алгоритмы обучения универсальны, быстро имплементируемые и легко применяются в других задачах
есть куча соревнований на Kaggle. И формат там очень удобный, надо предоставить только результаты на тест группе, и неважно каким способом решается задача. И видно сразу на каком месте находится решение.
На мой взгляд это не изьян, а свойство, которое прямо выводится из условий конкурса. Оба решения легитимны, но проблема в том что оно позволяет организаторам манипулировать результатами.
Мне, конечно, нравится решение с алгоритмами, да и уверен что участники потратили гораздо больше сил, времени и проявили больше смекалки, чтоб выжать лишнюю долю процента. С другой стороны также признаю что конечный результат у второй группы гораздо выше.
В общем, запасаемся попкорном 3е июня…
(Надеюсь, что победит гибридное решение, которое стартует с 85% и доходит быстрее всех до 100)
Если б генератор был другим, то и решения были б другими — также и наоборот, нет смысла запускать изначальные решения под какой-то другой генератор.
https://github.com/hola/challenge_word_classifier/blob/master/submissions/5732127f93f2f29d3c9acc28/solution.js
или была ошибка в строчке:
кстати, интересен комментарий 7го места по поводу рекламы конкурса и мотивации
6е место самообучающийся алгоритм (плюс стем и блюм)
3е место подало заявку последним
Что же касается «задачи обучения», то я пришел к выводу что ни одно решение не будет лучше чем узко-направленного анализа словаря и битовой оптимизацией на уровне блюм фильтра. Максимум, что у меня выходило это 72% (в 64 Кб рамках)
Зато алгоритмы обучения универсальны, быстро имплементируемые и легко применяются в других задачах
Мне, конечно, нравится решение с алгоритмами, да и уверен что участники потратили гораздо больше сил, времени и проявили больше смекалки, чтоб выжать лишнюю долю процента. С другой стороны также признаю что конечный результат у второй группы гораздо выше.
В общем, запасаемся попкорном 3е июня…
(Надеюсь, что победит гибридное решение, которое стартует с 85% и доходит быстрее всех до 100)
Didi открывает конкурс машинного обучения с главным призом в $100,000