Comments 4
Для достаточно больших текстов, имхо, можно обойтись и без готовых моделей, а понаходить корреляции (слов и их переводов) из, собственно, этих текстов.
Хотя это уже на кандидатскую тянет )
Хотя это уже на кандидатскую тянет )
+1
Если сопоставлять именно по словам, то есть такая мысль — перевести текст машинно со второго языка на первый, привести слова к нормальной форме (гуляли — гулять, стулом — стул) и считать соответствия с учетом синонимов. Но считать моделями мне все же видится проще, да и поддержка множества языков из коробки это большой плюс.
0
Спасибо, интересная статья.
Вы не пробовали использовать лингвистические языковые модели для анализа текстов?
Они давно используются для понимания смысла в системах наравне с таксономиями.
Вы не пробовали использовать лингвистические языковые модели для анализа текстов?
Они давно используются для понимания смысла в системах наравне с таксономиями.
+1
Sign up to leave a comment.
Делаем параллельный корпус из книг с помощью sentence embeddings