Qudata Oct 27 2021 at 10:47

Семантика и технология Word2Vec

6 min

10K

Machine learning * Artificial Intelligence

Comments 7

hungry_forester Oct 27 2021 at 11:08

Как-то не очень с классификациями. Подчеркивания, смешивание логических уровней и так далее. Связи между сущностями - ок, они всегда могут быть, а иерархию эту с иллюстрации лучше бы не рисовали.

raamid Oct 27 2021 at 12:57

Как-то неинформативно выглядит проекция пятимерного пространства на двумерное. Может быть попробовать использовать выделение цветом/формой/размером для передачи дополнительной информации? Ну и подписи на осях, без этого тоже непонятно о чем идет речь.

В целом тема интересная, но непонятно какая задача решается в статье.

sunsexsurf Oct 28 2021 at 05:58

Надеялся, что в статье напишут свой w2v по шагам

Qudata Oct 29 2021 at 11:14

i_am_not_bot Nov 10 2021 at 14:08

А по-моему идея прикольная. В обычном w2v семантическая близость векторов возникает благодаря лексическому окружению слова. Но она "зашумлена" полисемией. Вместо этого можно взять какую то иерархию (например WordNet) и получить более "чистую" векторизацию, которую уже тьюнить на конкретной задаче.

UFO landed and left these words here

vbogach Apr 3 2023 at 09:22

Не могли бы вы пояснить, чем обусловлен выбор loss-функции mean_squared_error вместе с activation="sigmoid" на последнем слое? Кроме того, почему бы просто не взять случайные эмбеддинги и минимизировать непосредственно ошибку евклидового/косинусного расстояния между ними относительно желаемого? Зачем вводить дополнительные fully connected слои?