Как стать автором
Обновить

Комментарии 10

Весьма и весьма интересная технология, но из вашего поста я не очень понял как можно по набору слов, используемых в произведении узнать его содержание. С тем же успехом можно содержание прочитать
Это зависит от того, что понимать под содержанием. Сюжет произведения — кто кого убил и чем всё закончилось — из такой выжимки понять, конечно, нельзя. Но можно понять, вокруг каких смыслов строится текст, кто в нём присутствует и какие действия и характеристики наиболее типичны. Например, в текстах женщин 1780-1900 самые частые глаголы — give, feel, wish, seem и т.п. Из этого становится понятно, чем в основном заняты героини и герои этих произведений. :)

Если продолжать аналогию с ДНК, то по набору генов нельзя узнать, как проживёт свою жизнь какая-нибудь черепашка. Закончит ли свою жизнь в черепаховом супе или в жестокой схватке с крокодилом. Но можно понять, какие у этой черепашки есть органы, как она примерно будет выглядеть и сможет ли летать.
А не лучше ли просто 5 связанных табличек из слов разной популярности, рассортированные по алфавиту? И читать легче, и не надо искать, не спряталось ли какое-то слово где-то в уголке. К примеру, сколько вы потратите времени, ища в первой картине слово «say»?.. Придётся пересмотреть всё.
Мне кажется, не лучше. На этих картинках представлена ещё и связанность слов — то есть в каких связках чаще всего встречаются эти глаголы, существительные и прилагательные.

А поиск по отдельному слову в программе реализован. То есть такая фича, как вы предлагаете, в общем, есть. Можно видеть всю ДНК целиком, а можно искать по отдельным генам.
У гуманитариев с цифровыми источниками другая проблема — непонятно, как на них ссылаться.
— Как другой человек, увидевший такую ссылку найдет источник? Нет уверенности, что источник будет общедоступен.
— Как убедиться, что источник не будет модифицирован, исправлен?
— Датировка таких источников.

А вот обязанности знать все у гуманитариев нет. Ты должен знать всю литературу по своей тематике, о том, что может касаться, должен быть в курсе, а остальное можно и не знать особо :)

Знать содержание большого объема художественной литературы — это признак интеллигента (или уникума с хорошей памятью), без разницы гуманитария или технаря.
Пока проблем с цифровыми источниками у гуманитариев не возникало. Есть стандарт, как ссылаться на такие источники. Есть академические базы данных и электронные архивы статей (EBSCO, ScienceDirect, MUSE etc). Сохранение статей в первозданном виде — задача этих сервисов.

Знать всю литературу по своей тематике гуманитарий физически не может. :) Потому что ежедневно по всему миру публикуются десятки статей на одну и ту же тему.
Задача гуманитария — очень широкий охват культуры, литературы и истории. Тут я разделяю точку зрения Гадамера («Истина и метод»).
технология интересная
но мне кажется, что то, что созданно роботом только робот и захочет читать
Ну, это инструмент не для чтения, а скорее для анализа. Он нужен, чтобы составить представление, а читать уже потом одну книгу в выборке.
"… читать одну книгу в выборке" — если вы определите критерии по выбору одной книги в выборке, то мы (технари) можем настроить генерацию текстов для удовлетворения этого критерия и, как следствие, генерацию «идеальных» книг на основе критериев «экспертов». Это нам знакомо по антиутопиям, не правда ли? Тогда нечего будет читать. Такое уже используется в ТВ и пр. масс-медиа — им подают только то, что едят… Книг миллионы, но и вас, гуманитариев, миллиард. Читайте, анализируйте, делитесь с остальными живыми отзывами!
ндааааааа, вот она какая — общемировая папочка под названием «Разобрать!!!» :)
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории