Comments 12
в Японском языке до 3000 кандзи;
Это неверно и количество кандзи бессмысленно сравнивать с количеством слов.
Если сравнять слово с кандзи, то получится тот же один единственный токен. В чем я не прав?
Вы неправы во всём. Если хоть как-то сравнивать кандзи с нашим, то больше всего это похоже на корень. В слове может быть несколько кандзи. 博物館, 警察官, 株式会社 и так далее. И 3000 - это раза в полтора больше чем рекомендованный минимум, вдвое меньше чем технологический стандарт и на порядок меньше чем всего. Плюс слова записываемые без кандзи.
Ок, какую мне цифру указать?
Я бы указал 170 тысяч - столько слов в JMdict. Это вполне соответствует тому, что Большой японско-русский русско-японский словарь - 450 000 слов и словосочетаний. Для всех остальных языков кроме китайского, в котором может быть та же проблема но я не в курсе, подход в статье, скорее и примерно, такой же - поближе к максимуму.
Мне вообще кажется, что для целей статьи важны не слова вообще, а активная лексика, а как её объём выяснить понятно не очень. И не абсолютные цифры, а относительные.
Я бы ориентировался на словари, особенно старые бумажные, там вынужденный балланс между качеством и стоимостью. Типа выбрал бы толковые словари с одинаковой претензией на полноту и сравнивал, тогда можно и 170 тысяч и 450 и 8 - главное, чтобы для всех языков одинаково.
Чуть не блеванул с фотографии плешивого уродца. Дисклеймеры о таком надо ставить.
Кажется тут вообще весь текст для того чтобы какие-то свои мутные рассуждения на отвлеченные от темы статьи материи подсовывать под соусом объяснений что-как работает
Ну да. У меня есть определённые мысли и я их аргументирую.
А ты, думал гайд по сборке кошкодевочки найти?
Это было бы логичнее, и куда как более ожидаемо, чем, например:
И по моему скромному мнению именно окружение Горбачева, и он сам - сильнее прочих выбили опору развития страны и, опять же по моему мнению, уже после него вопрос краха страны и утраты информационного доминирования был лишь вопросом времени.
На то что такие вот перлы выглядят несоответствующими теме статьи я и указал
А что мешает сократить слова убрав например окончания, склонение и суфиксы, а потом уже на выходе оприходовать автокоррекцией, "Мой твой дом труба шатал"?
Плохая waifu (и при чем тут Пушкин, Горбачев и математика). О современных нейронках для ролевых игр на Русском языке