Pull to refresh
53
0
Борис Орехов @nevmenandr

Компьютерный лингвист

Send message
Люди, безусловно, думали иначе.
Но нет, они не были умнее. Отчего Вы так решили? Как это измерить? Разве у нас есть данные по тестам IQ за разные эпохи? Нет этого ничего.
Затем, что использована готовая модель с RusVectōrēs, где слова нормализованы.
А Вы когда говорите о хорошей работе с плоским текстом, ориентируетесь на опыт языков с бедным словоизменением типа английского или знаете работы и о том, где это хорошо получилось на языках с богатой морфологией типа русского?
Ну кто же так не делал. Я тоже делал: http://linghub.ru/poem_generator/
Боюсь, что Вы в плену мифа.
Пушкин великий классик именно потому что он точно выбирал слова. И своими словами создавал такую мощную образность, которую мало кого удавалось создать. Кроме того, он делал это крайне экономно, что тоже восхищает (особенно должно восхищать программистов).
Пушкин ничего не изобретал. Слог, о котором Вы говорите, конечно, существовал до Пушкина. Просто так говорили, но не всегда писали. Но и писали тоже. Чтобы в этом убедиться, достаточно не брать заведомо крайние примеры, а что-то близкое по времени, например, Карамзина. Пушкин просто благодаря своей пассионарности узаконил такой подход к написанию художественных произведений.
Что слог Пушкина — это тот же современный разговорный текст, немного обманчиво. Многие слова у него просто-напросто значат совсем другое, и легко впасть в ошибочную трактовку. Вот на эту тему хорошая лекция Игоря Алексеевича Пильщикова:

Ну наконец-то кто-то озвучил, как это использовать в реальной жизни :) Я, как все видели, держался до последнего.
В статье описано, как модель может применяться, в этом смысле она и отвечает названию.
Но вот создания модели в коде нет. Может быть, Вы обратили внимание, что модель не создавалась, а была взята в готовом виде с сайта RusVectōrēs. За всем, что касается создания таких моделей, я отсылаю Вас туда. Там есть подробный и хорошо написанный раздел «О проекте».
Я вообще сомневаюсь в том, что хоть какие-нибудь квизы интересны и полезны, тем не менее, их в интернетах Вы найдёте огромное количество. Например, тут.
Спасибо за Ваш отзыв!
Мне казалось, что как раз суть дистрибутивной семантики описана. Хотя бы вот тут:
Слова с похожим значением будут появляться в сходных контекстах и наоборот. Сам контекст можно представить в виде вектора (отсюда и «векторные модели») и посчитать сходство и различие в значении разных слов

Что бы Вам хотелось видеть в этом описании ещё?

Я не могу согласиться с тем, что это «hello world» (тогда уж, скорее, «hello word»). Результат вполне конкретный словесный материал, с которым может работать литературовед (сеансы медленного чтения) или веб-мастер (квиз «угадай настоящую фразу из классического романа»). Если для Вас лично получившийся результат бесполезен, я сожалею.
К сожалению, нет. Дело в том, что если написать по-другому, эффект от этого тоже будет другой. Размер можно менять постоянно. Вы же помните «Двенадцать» Блока? Или у помянутого Вами Лермонтова: «Воля» (1831) или «Слышу ли голос твой...» (1838).

Все переводы Шекспира гениальны? Не могу с этим согласиться.
С текстологией Шекспира действительно всё не просто, но более-менее конвенциональный текст всё же есть (с разной степенью устойчивости для разных произведений).

Да, Вы действительно не писали, что всё просто. Но Вы настаиваете на слишком большом участии случайности в том, как устроен текст. Если мы говорим о литературе, которая состоит из слов, любой уровень сложности будет в конечном счёте упираться в слова.
А какой порядок сложности Вам видится в литературе?
Нет, не правы, увы.
Действительно, в том, что такое впечатление создаётся, вина именно упомянутых Вами уроков литературы, которые часто представляют предмет в огрублённом виде. Правда и то, что люди чаще почитают, чем читают классиков (Вольтер подметил, что французы так делают с Данте).
Но ведь чтобы делать столь далеко идущие выводы, стоит сначала глубже изучить дело, не только на уровне плохих школьных уроков? Начать, наверное, можно было бы с работ Ю. М. Лотмана по анализу текста и семиотике культуры. Там хорошо видно, что в текстах тех авторов, которых мы помним до сих пор, действительно есть гениальная выверенность каждого слова.
Приведённые Вами аргументы не очень работают. Стихотворный размер? Во-первых, он допускает довольно много способов сказать по-другому. Во-вторых, его можно сменить. Выбор стихотворного размера тоже не случаен, у этого есть интересные закономерности, описанные М. Л. Гаспаровым в книге «Метр и смыл».
В принципе, я хорошо Вас понимаю: если не быть знакомым с деталями (в которых дьявол), то всё кажется простым, а люди, думающие иначе, идиотами. Но поверьте, если немного расширить свои знания за счёт хороших научных работ, открывается невероятный и увлекательный мир.
Какой «глубинный смысл» у чего бы то ни было в литературе, мне неведомо. По-моему, поиски «глубинного смысла» — пустая трата времени. Я говорю не о смысле, а о сложных отношениях элементов системы. Что до цитаты из Радищева (у Тредиаковского иначе: «тризевной и Лаей»), то «стозёвной» там быть не может: буква «ё» в печати появилась только через 5 лет после публикации «Путешествия из Петербурга в Москву».

Отличный проект! Спасибо за ссылку, действительно, это по-своему близко к тому, что я тут представил.
Вы не правы.
Да, в формировании канона действительно присутствует доля социальной конвенции (см., например, книгу А. И. Рейтблата «Как Пушкин вышел в гении»), но списывать всё только на иллюзию было бы наивно.
На самом деле, художественный текст есть сложнейшая высокоорганизованная система, в которой действуют очень непростые отношения между элементами разных уровней.
Ну а что такое «написал вот так, потому что написал», я совсем не понимаю. Случайности не существует. Написал так потому что это чем-то детерминировано.
Неожиданно нашёлся такой отклик: http://telegra.ph/Statisticheskij-analiz-anket-prostitutok-Moskvy-04-09
На самом деле, нет. Стихотворный ритм не так уж и легко поддаётся формальному описанию.
Он поддавался бы, если бы в реальных стихах всегда выдерживалась формальная схема размера.
Вот строки, которые Вы приводите. Они написаны четырёхстопным ямбом. Значит, с точки зрения формального описания, в них ударения должны падать на каждый чётный слог. Но по факту это не так: ударения из требуемых там стоят только на 2-м, 4-м и 8-м слогах в обеих строках. А как же 6-й слог? Он остаётся безударным, несмотря на схему.
Далее. Ударения в русском языке падают на полнозначные слова и местоимения. Не падают (в основном) на служебные слова. Местоимения — несут ударения. Поэтому мы и считаем, что во второй строке 2-й слог ударный (там местоимение «мы»). Но вот в первой строке тоже есть местоимение, «он», которое занимает 3-й слог. Он должен быть неударным по схеме, но в русской речи ударение несёт.
Ничего простого тут нет.
Эта версия смехотворна. В языкознании есть строгие правила звуковых переходов, которые ничего общего не имеют с тем, как он «играет» всем этим. Так что нет, не «на основании».
Академик Зализняк довольно выразительно это показал: http://hbar.phys.msu.ru/gorm/fomenko/zaliznk.htm
Между Гомером и Сапфо несколько веков, да и жанр очень разный. Так что судить о стиле той поэтической традиции лучше по лирикам Алкею и Архилоху, а не по эпическим поэтам другой эпохи.
Я согласился только с тем, что профессиональная деятельность тренирует определённые навыки. У людей разных профессий эти навыки разные. А язык тут ни при чём.
Совершенно верно. Это одно из тех соображений, которые поддерживают идею, что сознание влияет на язык, а не наоборот.
Нет, не противоречат эти мои фразы друг другу. Потому что характеристики сознания находятся в более устойчивой и более глубинной сфере, чем тренируемые операциональные навыки. Вот есть разные профессии, скажем, водитель и продавец. Если принять Вашу точку зрения, то их сознание тоже должно отличаться. Чем-то принадлежащие к этим классам люди, безусловно, отличаться будут, но вряд ли тем, что принято называть сознанием. Так что можно взять хоть ассемблер с php, дела это не меняет.
На самом деле, сколько таких слов в языке, вообще не имеет никакого значения. Важно только то, как часто эти слова используются в повседневной речи. В русском языке для вежливого обращения целая бездна слов, только их никто не говорит, и именно последнее важно.
Не думаю, что он будет более обходительным. С чего бы? На это влияют не язык, а принятые в обществе нормы и традиции. Если у меня два слова, но я вставляю их в каждое предложение, это больше свидетельствует о моей обходительности, чем то, что у меня в арсенале десять слов, а я не использую ни одного из них.

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Date of birth
Registered
Activity