Как стать автором
Обновить
25
0
Виктория @wordvictor

Компьютерный лингвист

Отправить сообщение
Критерий востребованности — странная штука. Очевидно, что у компаний b2c запросов в поисковых системах будет гораздо больше, чем у b2b. Чуть ли не каждый пользователь МТС рано или поздно пойдет с запросом в поисковик, но гораздо меньшее количество пользователей будут гуглить какой-нибудь завод
UPD увидела, что это поисковые запросы по вакансиям, тогда критерий более понятный (но все еще странный)
А есть такое, например, Prettyscale, только они, кажется, считают симметрию и золотое сечение
Спасибо! Конечно, НКРЯ знаем и любим. Но мне была нужна оффлайновая версия корпуса, которую пришлось бы долго согласовывать, подписывать лицензионное соглашение, документы оформлять. А у меня была всего неделя, и хотелось начать анализ как можно скорее.
Вы верно заметили, что фактические значения признаков зависят от того, что под этим словом понимал автор. Но это ограничение, которое вообще характерно для литературного материала (не зря так много недовольных экранизациями литературных произведений). Множественность интерпретаций свойственна литературе. Было бы здорово учитывать объективные признаки типа «она была 1.70 ростом, объем талии – 64, глаза цвета #0033a1», но таких описаний почти нет, гораздо чаще встречается что-то вроде:
Всегда скромна, всегда послушна,
Всегда как утро весела,
Как жизнь поэта простодушна,
Как поцелуй любви мила;
Глаза, как небо, голубые,
Улыбка, локоны льняные,
Движенья, голос, легкий стан,
Всё в Ольге… но любой роман
Возьмите и найдете верно
Ее портрет: он очень мил,
Я прежде сам его любил.

Извлечь из такого описания точные факты нельзя, но можно найти множества признаков, которые соответствуют этим словам.

Попробую пояснить эту идею. Есть такая часть значения слова, которая называется сигнификатом. Это совокупность признаков, по которым выделяются сущности, которые можно этим словом назвать. Такой набор необходимых условий, которым объект должен соответствовать, чтобы к нему рассматриваемое слово было применимо. С сигнификатом как раз связано сразу несколько проблем. Во-первых, эти условия – это целое множество (представляете, сколько оттенков попадает под вот это «глаза, как небо, голубые»?). Во-вторых, набор этих условий может варьироваться в зависимости от говорящего.

Но определенно есть общая ядерная часть условий, которая не меняется – иначе бы мы друг друга совсем не понимали. Кроме того, русский язык, конечно, изменился с 19 по 21 век, но не секрет, что под современным русским литературным языком понимается язык от Пушкина и до современности. Исходя из этого, базовые значения слов существенно не поменялись.
Образы, конечно, не получились фотографически верными – но и визуализации у нас мультяшные, оставляющие простор для воображения.
Было бы интересно учесть этот контекст, но результаты могут быть непредсказуемые. Навскидку, из «Темных аллей»:
1. Я встал, отворил: у порога стоит
высокая девушка в серой зимней шляпке, в сером прямом пальто, в
серых ботиках, смотрит в упор, глаза цвета желудя, на длинных
ресницах, на лице и на волосах под шляпкой блестят капли дождя
и снега; смотрит и говорит:
— Я консерваторка, Муза Граф.

2. Но и без малороссийского наряда она была очень хороша:
крепкая, ладная, с густыми темными волосами, с бархатными
бровями, почти сросшимися, с грозными глазами цвета черной
крови, с горячим темным румянцем на загорелом лице, с ярким
блеском зубов и полными вишневыми губами. Руки у нее были
маленькие, но тоже крепкие, ровно загорелые, точно слегка
прокопченные. А какие плечи!

А ведь и там, и там главный герой – интеллигент (художник в первом случае, во втором – студент-медик).
У нас нативная поддержка 33 языков, включая норвежский. Вот тут полный перечень.
Художнику я показала список частотных признаков по каждой черте (какие глаза, какие губы, какой лоб и т.д.), а визуализация – это фантазия на тему того, как эти признаки увидел художник. В анализе признаки друг от друга не зависели, то есть нельзя сказать что голубые глаза всегда идут в комплекте со светлыми волосами, а кудри – с пухлыми губами. Точно можно сказать, что высокий лоб и прямой нос были частотными признаками в 19 веке, но как они друг от друга зависят, я, к сожалению, не выясняла. Но теперь стало интересно это тоже посмотреть, спасибо за идею.

Информация

В рейтинге
Не участвует
Откуда
Москва, Москва и Московская обл., Россия
Зарегистрирован
Активность