Компьютерный алгоритм выбирает самых значимых авторов прошлых лет



    1 января каждого года — не только день, когда все мы внезапно оказываемся в следующем году (у кого-то такой переход сопровождается типичной головной болью). Это еще и день, когда многие произведения различных авторов попадают в общий доступ. 50 или 70 лет (зависит от страны) права на то либо иное произведение принадлежат авторам или издательствам. По прошествии этого времени произведение можно свободно использовать: перепечатывать, оцифровывать и даже изменять. Под «авторами» подразумеваются писатели, поэты, художники и прочие представители мира искусства.

    Так вот, каждый год доступными для всех становятся тысячи, десятки тысяч произведений. И только малое количество печатных работ оцифровываются. Все потому, что возможности команд оцифровщиков ограничены. Плюс ко всему, выбирать наиболее значимых авторов очень сложно.

    Для того, чтобы упростить процесс выбора, Аллен Риддер из Дартмутского колледжа (Нью-Хемпшир) создал компьютерную программу, алгоритм, способный оценивать значимость различных авторов. Для начала работы программы нужно ввести дату (год), и машина выберет наиболее значимых авторов (по оценке машины), на чьи произведения уже не распространяются авторские права.

    Другими словами, при помощи алгоритма можно выбрать автора и произведения, которые необходимо оцифровать в первую очередь. Оценка значимости проводится по большому количество факторов, включая упоминание авторов в Вики, цитируемость авторов, количество просмотров статей на Википедии с описанием биографии автора или его произведений и других данных.

    Для работы алгоритма используется две базы данных. Первая — список из миллионов книг Университета Пенсильвании. Вторая — Википедия, о чем уже говорилось выше.

    Свою систему оценки автор назвал «public domain ranking», протестировать работу алгоритма можно на одноименном сайте. Алгоритм позволяет провести ранжирование всех авторов, упоминание которых есть в Википедии (англоязычной). Результаты получаются интересными. К примеру, писательница Вирджиния Вулф получает 1081 баллов из 1011304 возможных. А художник Джузеппе Амисани, умерший в один год с Вирджинией Вулф, получил 580363 балла. Чем меньше число баллов — тем значимей автор.

    Согласно этой оценке, организации типа Project Gutenberg должны оцифровать работы Вирджинии Вулф, а потом уже — картины художника.

    Среди наиболее значимых авторов, чьи работы станут доступными для оцифровки 1 января 2015 года, первое место, по оценке алгоритма, занимает Томас Стернз Элиот. Также доступными станут работы Уинстона Черчилля, Малкольма Икс и некоторых других известных людей.

    По словам разработчика алгоритма, оценки машины зачастую совпадают с оценками людей. Но, конечно, эту оценку нельзя принимать за аксиому, особенно с учетом того, что для ранжирования используется только один источник информации об авторе — Википедия.

    Кстати, много лет назад я читал какой-то научно-фантастический рассказ по схожей проблеме. Тогда непризнанный никем литератор создал машину для оценки произведений писателей и поэтов. Само собой, он надеялся, что первое место достанется его поэме. Но нет, первое место досталось «Справочнику по радиотехнике». Машины такие машины.

    Только зарегистрированные пользователи могут участвовать в опросе. Войдите, пожалуйста.

    Могут ли машины корректно оценивать значимость авторов?

    • 31,6%Да, конечно99
    • 43,4%Может быть, со временем, но не сейчас136
    • 11,5%Никогда36
    • 13,4%Если да, то это будет уже не машина42
    AdBlock похитил этот баннер, но баннеры не зубы — отрастут

    Подробнее
    Реклама

    Комментарии 6

      +1
      Думаю, тут некорректно задан вопрос в опросе. По крайней мере, если он соотносится со статьей. Т.к. фактически значимость оценивают все-таки люди, просто выражают ее не в числах, а с помощью просмотров статей на вики, упоминания автора и т.д. Машина так и остается тупым калькулятором, который все это подсчитывает.
        +1
        Учитывая что «Дарья Донцова» уже стало почти что именем нарицательным при упоминании определенной категории авторов и вообще графоманства, то по частоте упоминания этого имени данная прога должна поставить ее на первое место в очередь по оцефровке когда придет время.
          0
          Возможно, нужно считать не только упоминание имени, но и упоминание конкретных книг.
          +1
          Изпитал, ага.
            0
            Господа, как значимость авторов можно оценить? Вам 5 лет и «Чиполлино» для Вас верх искусства. Вам 15 и Вы обязаны оценить шедевриальность «Мастер И Маргарита». Но не можете… И уже «Чиполлино» как-то «не вставляет». А затем значимость того или иного произведения меняется.
            Уверен, что многие не признают «Квадрат Малевича», а другие восторгаются этим вызовом системе изобразительного искусства.
            Давать оценку миру творчества человек до конца не может. А уж машина… Это полный бред.
              +1
              «Кстати, много лет назад я читал какой-то научно-фантастический рассказ по схожей проблеме. Тогда непризнанный никем литератор создал машину для оценки произведений писателей и поэтов. Само собой, он надеялся, что первое место достанется его поэме. Но нет, первое место досталось «Справочнику по радиотехнике». Машины такие машины.»

              Кстати, у Стругацких в «Хромой судьбе» эта же самая тема обыграна гораздо изящнее и интереснее.

              Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

              Самое читаемое