Комментарии 2
Спасибо за список! Всегда рад встретить выборку активной лексики русского языка под чьей-то новой редакцией, нет-нет да и попадутся пропущенные у себя слова.
Рекомендую посмотреть слова, которые в список узнаваемых, возможно, попали случайно:
Рекомендую посмотреть слова, которые в список узнаваемых, возможно, попали случайно:
- клас — церковнославянское = колос. Рекомендую убрать
- комфорка — правильно «конфорка»
- нечесть — устаревшее
- пешечком — устаревшее, можно оставить «пешочком»
- поддонок — областное = поддонник. Наверное, имели ввиду «подонок». Это предположение согласуется с ответами ваших респондентов, которые дали этому нейтральному слову (подставка под цветочный горшок) негативную коннотацию (-0.803)
- призирать — устаревшее, но положительное слово. Ваши респонденты, наверное, имели ввиду «презирать», когда давали ему абсолютно негативную оценку -0.9828
- руководствовать — книжное устаревшее слово, лучше замените на «руководствоваться»
- салочка — практически не употребляется. Лучше включите в список «салочки»
- спитый — похоже на беларусизм. Можно заменить на «спитой», хотя не уверен что это слова активной лексики
- трехколёсный, четырехколёсный --> трёхколёсный, четырёхколёсный. Если обозначаете «ё» в словаре (и это правильно), то нужно делать это во всех позициях в слове
Спасибо за содержательный комментарий! Действительно, активный словарь также создаётся краудсорсингом и такие моменты, как некорректное или устаревшее написание и паронимию, не учитывает. (Также это касается пар лен — лён, мед — мёд и т.д.) Это задача автоматики, которую нам предстоит решить, а пока будем отфильтровывать эти слова вручную и ваш список будет более чем полезен.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Новогодний датасет 2019: открытый тональный словарь русского языка