Хабр Курсы для всех
РЕКЛАМА
Практикум, Хекслет, SkyPro, авторские курсы — собрали всех и попросили скидки. Осталось выбрать!
с отрицательной выборкой
с вложениями слов
той мере, в какой совпадают названия переменных
Действительно, gensim — единственная известная мне верная реализация на C.
Один вектор для этого слова в фокусе, а второй для слова в контексте
Я прекрасно понимаю автора, поскольку несколько раз пытался разобраться и воспроизвести, например в рамках курса по tensorflow (или про deep learning в целом на примере tensorflow) от Udacity. Да, что-то похожее получалось, но не то.
Но справедливости ради хочу заметить, что описание реализации с двумя векторами мне попадалось, если нужно будет — поищу пруф. Тоже тогда недоумевал, почему такие детали скрыты...
Всё, что вы знали о word2vec, неправда