Cоздание вандалодетектора для Wiki

    image
    Не так давно завершился Первый международный конкурс по обнаружению актов вандализма в Википедии (здесь и далее ссылки ведут на PDF документы): 9 групп (пять из США, одна связана с Google) пробовали разработать целостную систему для выявления случаев вандализма.
    Победивший подход помогает обнаружить 20% актов вандализма без ошибочных срабатываний на регулярные правки, либо, при иной настройке, 95% проявлений вандализма с 30% ложных срабатываний.

    Таким образом, применяя обе конфигурации, в ручную придется перепроверять только 34% всех правок. Нельзя сказать, будут ли боты, основанные на правилах Википедии конкурировать с этой машиной, работающей по стратегии самообучения. Во всяком случае, потенциал для совершенствования есть, ведь два детектора используют разные принципы определения нарушений: первый анализирует редактированный контент, в то время как второй анализирует контекст, используя WikiTrust.

    via slashdot.org
    Поделиться публикацией
    Комментарии 23
      +1
      Каким же надо быть идиотом чтоб портить статьи в вики
        +5
        В вики идут настоящие войны по переписыванию современной истории.
        Так как исправив пару статей можно стать победителем или жертвой немотивированного нападения.

        Поэтому подобный инструмент достаточно актуален.

        Но вероятнее всего мы просто присутствуем при начале очередной гонки вооружений между ботами и анти-ботами (поле боя — Вики).
          0
          Неужели в будущем станет справедливо следующее:
          «Не описано в вики — не было на самом деле»?
            0
            Это было бы отлично, при условии что правило 95/5 превратится к тому времени в правило хотя бы 60/40 ))
              +2
              О том, что вика составляется такими же людьми как и мы, которые могут ошибаться или иметь предвзятое мнение, знают многие. Однако чтобы задумываться об этом во время чтении статьи надо обладать критическим мышлением. Большинство же людей пользуясь материалами из википедии об этом совершенное не задумываются.

              Небольшая правка статьи и

              «Россия после многолетней войны, при поддержке союзных сил США, Великобритании и Канады проводят контрнаступление на фашискую Германию и одерживают победу в второй мировой войне»

              превращается в

              «Россия заручившись поддержкой США, Великобритании и Канады пересекает границы Герминии, захватывают Берлин и практически разворовывает ресурсы Германии»

              И человек который будет это читать врятли будет проверять «а почему же Россия решила напасть» у него уже будет сложившееся мнение «кто виноват». Поэтому находятся люди которые переписывают статьи что бы люди начали думать как им удобно.

              PS справедливости ради стоит заметить что и бумажные источники такого недостатка не лишены.
                +2
                Разница в том, что бумажные источники редактирует тот, у кого больше авторитета, а Вики — тот, у кого больше свободного времени.
                Как ни удивительно, именно у авторитетных людей свободного времени мало.
                  –1
                  Очень любопытное замечание, впрочем в его справедливости я лично сомневаюсь. Особенно в первой его части.
                    +1
                    Ага, т.е. чтобы быть авторитетным человеком нужно ничего не делать и только редактировать Вики?
                      0
                      разве такое заключение можно сделать из моих слов? ;-)
                  0
                  >Небольшая правка статьи и

                  >«Россия после многолетней войны, при поддержке союзных сил США, Великобритании и >Канады проводят контрнаступление на фашискую Германию и одерживают победу в второй >мировой войне»

                  >превращается в

                  >«Россия заручившись поддержкой США, Великобритании и Канады пересекает границы >Герминии, захватывают Берлин и практически разворовывает ресурсы Германии»

                  Вы немного превратно представляете себе, как пишется Википедия — такая правка продержится в пределах нескольких минут, а того, кто решит на ней настаивать, заблокируют через несколько часов, ибо есть принцип «нейтральной точки зрения», которому «захватывают» и «практически разворовывает» никак не соответствует.

                  Хотя насчёт критического отношения Вы, разумеется, совершенно правы — критически относиться стоит вообще к любому источнику, кроме разве что сборника молитв своей религии :-) А уж к таком, который постоянно меняется — и подавно.
                  +1
                  Нет, поскольку в вики действует правило «не написано в авторитетном источнике — не было на самом деле». При этом очень редкие интернет-источники признают авторитетными.
                    0
                    > При этом очень редкие интернет-источники признают авторитетными.

                    Это Вы просто не умеете их искать…
                  0
                  Вандало-детектор не поможет в войнах правок.
                  Войны правок — это когда две стороны придерживаются разной точки зрения на толкование того или иного явления/события и постоянно исправляют статью согласно своему мнению.
                  Например, одни пишут, что Абхазия — это независимое государство, а другие, что это часть Грузии. Так и правят статью об этом туда-сюда.

                  Чтобы бот стал разруливать такие ситуации, он должен будет встать на чью-то сторону и правки другой стороны считать вандализмом. А как тут определить, кто прав, а кто виноват?
                    0
                    > Вандало-детектор не поможет в войнах правок.

                    Спасибо, Кэп :-) Вообще-то он для этого и не предназначен.
                    А вот скрестить его с админботом так, чтобы зверушка, обнаружив три не антивандальных отката, банила откатчика — это будет страшная сила :-)
                +1
                Если бы ещё у вандализма были объективные критерии…
                Для одного добавление фотографии, например, в статью «Defecation» — откровенный вандализм, для другого — разъясняющая иллюстрация.
                  0
                  Как ни парадоксально, боту легче отличить вандализм от спорной правки — он, в отличие от человека, беспристрастен.
                  +1
                  >> Таким образом, применяя обе конфигурации, в ручную придется перепроверять только 34% всех правок.

                  Придется проверять также 100% правок, просто работа ускорится.
                    +2
                    да, интересно как получили 34%
                    –4
                    Я один застрял на скриншоте, долго пытаясь обнаружить вандализм?
                      +2
                      Да.
                        0
                        А я сразу подумал, что густые чёрные усы сильно бы изменили внешность Билла Гейтса.
                          +2
                          Видимо сказалась привычка искать вандализм в тексте (мало ли, проставили убыток вместо прибыли или накинули пару веков возраста, всякое бывает). Дело в том, что предлагаемый в статье подход никак не поможет защититься от вандализма, как на скриншоте, тут сработает только защита/стабилизация на изображении.
                          0
                          Нет, рожки могут быть только у Джордана Хаббарда и других основателей FreeBSD

                        Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                        Самое читаемое