All streams
Search
Write a publication
Pull to refresh
136
0
Вадим Марковцев @markhor

Head of Analytics

Send message
Интересно! А что за язык использован для процедур?
Было использовано 840 млрд 300-мерных вставок GloVe

Чуть не поперхнулся. У меня 1 млн на двух титанах считается 30 часов! Конечно же, это размер исходных данных, а на самом деле словарь на 2.2 млн (в этом можно убедиться, почитав текст по ссылке). В этом и фишка GloVe, что важен размер словаря, а не датасета. К слову, у гуглового Swivel эмбеддинги нажористее, он реализован на TF.
Вот я не понимаю, честно. Какой смысл упарываться ради 0.1-1%? В продакшне на котором миллионы сэмплов франкенштейн-ансамбль не применишь, в нем может и VW будет по швам трещать. Какая разница в логлоссе между линрегом на one hot encoding-е и супер навроченным ансамблем? Кому это нужно?
У нашей компании похожий алгоритм, хотя мы не стрeмимся ко всяким этим рейтингам: https://blog.sourced.tech/post/handshakes_pagerank/
image
Еще есть https://zenodo.org/ — лимит 50 гигов и заодно дает DOI
С другой стороны, CoreOS к примеру весит немногим меньше 300.
Есть одна дурацкая причина. На количество звезд любят смотреть люди, далекие от IT. Инвесторы, рекрутеры и т.д. Для них число звезд == крутизна проекта. Хотя все давно поняли что число звезд == способность авторов пиарить (что в общем-то не плохо само по себе, но слабо коррелирует с качеством).

Если уж измерять популярность репозитория, то стоит это делать по числу уникальных клонов (Гитхаб к сожалению это не показывает публично), либо по количеству контрибьюторов и их крутизне. В последнем случае можно ввести PageRank и вообще упороться по математике (как я, см. статью).

Пример графа контрибьюторов
image
Предлагаю выложить датасет на data.world — GitHub для датасаентистов. В качестве бонуса получится на лету делать запросы любому пользователю.
Можете ссылку на плагин дать, не получилось найти? Очень тяжело с новыми, сине-серые тона на темном фоне я плохо различаю.
Если вам нужен macOS, я могу без проблем одолжить Air 2014 на 3-6 месяцев. Безвомездно, но с возвратом, пересылка каким-нибудь DHL-ем из Мадрида за мой счет.
На оф. сайте http://darkforester.com/wordpress/wp-content/uploads/2014/06/demo_content.png отдает 404

Эх, это уже вторая игра (после Don't open the doors!) в которую я вряд ли поиграю в ближашее время в силу отсутствия Windows и на которую все равно не жалко денег!

В русском стиме игра стоит доллар. Это даже как-то слишком… слишком мало.
А как можно, гм, «подготовиться к неизбежным последствиям» если лечения нет? Написать кучу картин «впрок»? Возможно, лучше было бы не знать вообще.
Тьфу, я вниз не прокрутил. Удалено. Извините.
Отправил на HN https://news.ycombinator.com/item?id=13218834
С удовольствием купил игру, хоть мне и не на чем в нее играть (к сожалению, только под W). Планируется ли в случае финансового успеха L и M?
Грамотный rootkit вам никакой одноразовый сканер не определит
Оттуда:
Robert Griesemer, Rob Pike and Ken Thompson started sketching the goals for a new language on the white board on September 21, 2007.

Тогда 21 сентября. Сейчас ноябрь.
А почему именно сегодня день рождения?

git log --reverse

Если отбросить странные коммиты Brian Kernighan от 1972, 1974 и 1988 года (o_O; это тот самый? пасхалка?), то получаем

commit 18c5b488a3b2e218c0e0cf2a7d4820d9da93a554
Author: Robert Griesemer <gri@golang.org>
Date: Sun Mar 2 20:47:34 2008 -0800

Go spec starting point.

SVN=111041

Т.е. 2 марта день рождения.
Очень полезная презентация про подбор ресурсов для глубокого обучения, которая совпадает с моим мнением и которую только что опробовали на практике: http://www.slideshare.net/PetteriTeikariPhD/deep-learning-workstation
Резюме: в топку облака, Titan X 2016 рулит своим Паскалем и ценой, SuperMicro подходит идеально.

Information

Rating
Does not participate
Location
Madrid, Madrid, Испания
Date of birth
Registered
Activity