Было использовано 840 млрд 300-мерных вставок GloVe
Чуть не поперхнулся. У меня 1 млн на двух титанах считается 30 часов! Конечно же, это размер исходных данных, а на самом деле словарь на 2.2 млн (в этом можно убедиться, почитав текст по ссылке). В этом и фишка GloVe, что важен размер словаря, а не датасета. К слову, у гуглового Swivel эмбеддинги нажористее, он реализован на TF.
Вот я не понимаю, честно. Какой смысл упарываться ради 0.1-1%? В продакшне на котором миллионы сэмплов франкенштейн-ансамбль не применишь, в нем может и VW будет по швам трещать. Какая разница в логлоссе между линрегом на one hot encoding-е и супер навроченным ансамблем? Кому это нужно?
Есть одна дурацкая причина. На количество звезд любят смотреть люди, далекие от IT. Инвесторы, рекрутеры и т.д. Для них число звезд == крутизна проекта. Хотя все давно поняли что число звезд == способность авторов пиарить (что в общем-то не плохо само по себе, но слабо коррелирует с качеством).
Если уж измерять популярность репозитория, то стоит это делать по числу уникальных клонов (Гитхаб к сожалению это не показывает публично), либо по количеству контрибьюторов и их крутизне. В последнем случае можно ввести PageRank и вообще упороться по математике (как я, см. статью).
Если вам нужен macOS, я могу без проблем одолжить Air 2014 на 3-6 месяцев. Безвомездно, но с возвратом, пересылка каким-нибудь DHL-ем из Мадрида за мой счет.
На оф. сайте http://darkforester.com/wordpress/wp-content/uploads/2014/06/demo_content.png отдает 404
Эх, это уже вторая игра (после Don't open the doors!) в которую я вряд ли поиграю в ближашее время в силу отсутствия Windows и на которую все равно не жалко денег!
В русском стиме игра стоит доллар. Это даже как-то слишком… слишком мало.
Очень полезная презентация про подбор ресурсов для глубокого обучения, которая совпадает с моим мнением и которую только что опробовали на практике: http://www.slideshare.net/PetteriTeikariPhD/deep-learning-workstation
Резюме: в топку облака, Titan X 2016 рулит своим Паскалем и ценой, SuperMicro подходит идеально.
Чуть не поперхнулся. У меня 1 млн на двух титанах считается 30 часов! Конечно же, это размер исходных данных, а на самом деле словарь на 2.2 млн (в этом можно убедиться, почитав текст по ссылке). В этом и фишка GloVe, что важен размер словаря, а не датасета. К слову, у гуглового Swivel эмбеддинги нажористее, он реализован на TF.
Если уж измерять популярность репозитория, то стоит это делать по числу уникальных клонов (Гитхаб к сожалению это не показывает публично), либо по количеству контрибьюторов и их крутизне. В последнем случае можно ввести PageRank и вообще упороться по математике (как я, см. статью).
Эх, это уже вторая игра (после Don't open the doors!) в которую я вряд ли поиграю в ближашее время в силу отсутствия Windows и на которую все равно не жалко денег!
В русском стиме игра стоит доллар. Это даже как-то слишком… слишком мало.
Тогда 21 сентября. Сейчас ноябрь.
Если отбросить странные коммиты Brian Kernighan от 1972, 1974 и 1988 года (o_O; это тот самый? пасхалка?), то получаем
commit 18c5b488a3b2e218c0e0cf2a7d4820d9da93a554
Author: Robert Griesemer <gri@golang.org>
Date: Sun Mar 2 20:47:34 2008 -0800
Go spec starting point.
SVN=111041
Т.е. 2 марта день рождения.
Резюме: в топку облака, Titan X 2016 рулит своим Паскалем и ценой, SuperMicro подходит идеально.