Хабр Курсы для всех
РЕКЛАМА
Практикум, Хекслет, SkyPro, авторские курсы — собрали всех и попросили скидки. Осталось выбрать!
Большая и очень полезная работа была проделана.
Огромное вам спасибо!
- Омонимия и полисемия: слова, имеющие одинаковое начертание, могут иметь разное значение (мука и мука, остановка как процесс и остановка как локация). Сюда же можно отнести метафорическое употребление слов и метонимию (например дверь будет классифицирована как замкнутое пространство — это ожидаемая особенность языка).
- Несбалансированность контекстов употребления слова. Некоторые органичные употребления могут отсутствовать в исходном корпусе, приводя к ошибкам при классификации.
[..]
Ошибки первых двух типов в заданной конфигурации системы неустранимы
микроконтекст | тип | значение |
| | |
отхлёбывать из | VBP_РОД | 0.9990 |
отпивать из | VBP_РОД | 0.9989 |
окунуть в | VBP_ВИН_НЕОД | 0.9986 |
разлить в | VBP_РОД | 0.9984 |
мадеры | XG_NG | 0.9981 |
лака | XG_NG | 0.9978 |
порционный | ADJ | 0.9978 |
плюхнуться в | VBP_ВИН_НЕОД | 0.9978 |
вариться в | VBP_ПРЕД | 0.9978 |
плескаться в | VBP_ПРЕД | 0.9978 |
плова | XG_NG | 0.9977 |
налитой | ADJ | 0.9976 |
макать в | VBP_ВИН_НЕОД | 0.9976 |
политься в | VBP_ВИН_НЕОД | 0.9975 |
долить в | VBP_ВИН_НЕОД | 0.9975 |
кальвадоса | XG_NG | 0.9974 |
выложить в | VBP_РОД | 0.9974 |
умыться из | VBP_РОД | 0.9973 |
чачи | XG_NG | 0.9973 |
плевать в | VBP_ВИН_НЕОД | 0.9971 |
термоса | XG_NG | 0.9971 |
отлить в | VBP_ВИН_НЕОД | 0.9969 |
чернил | XG_NG | 0.9969 |
разложить в | VBP_РОД | 0.9968 |
процедить в | VBP_ВИН_НЕОД | 0.9968 |
Подчеркивается центральная роль физического опыта взаимодействия человека с окружающим миром в организации его понятийной системы. Рационализму формальных теорий, основанных на дуалистической концепции Декарта (ср. картезианская лингвистика Хомского), противопоставляется эмпиризм как метод познания. В связи с этим выдвигается тезис о том, что мышление «воплощено» (embodied) [Johnson 1987; 1992; Lakoff 1987; Lakoff, Johnson 1999], т. е. неразрывно связано с телом человека, его анатомическими и физиологическими особенностями, перцептивным и моторным опытом. Подтверждение тому когнитивисты находят в языке, в частности при исследовании механизмов образности. Именно «воплощенностью» мышления, по их мнению, объясняются неудачи, связанные с моделированием искусственного интеллекта и автоматической обработкой языка.
Новогодний датасет 2018: открытая семантика русского языка