Почему не взлетели тематические гипертекстовые ссылки (тэги, Semantic web), а платформы загаживаются спамом и как это исправить.
Казалось бы, нужно только придумать универсальную разметку для [тематических гипертекстовых] ссылок. Попыток было уже много — от навороченной концепции Semantic Web до простейшего инструмента навигации по тэгам (как в ЖЖ). Но как это работает в реальной экономике, где ссылка становится товаром? Да фигово это работает. Спамеры, SEOшники и прочие паразиты легко загаживают любую гипертекстовую экосистему (Википедия уже основательно загажена). СМИ перестают ставить ссылки на первоисточники (не хотят отдавать трафик). Соцсети пессимизируют посты со ссылками (классический бред Фейсбука — люди боятся использовать гипертекст в постах и пишут «ссылка в первом комментарии».) Лёха (Алексей Андреев), ЖЖ.
Платформы, владеющие социальными сетями, а также Wikimedia Foundation пишут сложные пользовательские соглашения, постоянно их обновляют, нанимают множество модераторов и привилегированных пользователей для слежки за обычными пользователями, а сотрудников компании для надзора за модераторами. Игра «Жизнь» (клеточный автомат) Конвея содержит очень простые правила в которых явно не описываются ни осциллирующие состояния, ни глайдеры, ни глайдерные ружья. Без возможности получать эти интересные и сложные состояния игра «Жизнь» была бы никому не интересна, но многие из этих состояний даже не нужно конструировать специально, а можно получить, наблюдая развитие случайных начальных конфигураций. Можно ли на платформах заменить сложные правила чем-то очень простым и при этом отказаться от нанятых контролёров?
Выбор явных требований применяется в плановой экономике (СССР, Китай), дирижизме и кейнсианстве западных стран. Второй подход соответствует либеральному принципу невмешательства, Láissez-fáire, но также содержит какой-то небольшой набор требований, иногда крайне незаметный в силу привычности. Проблема выбора либо явных требований к формулировке законов природы на основе имеющихся экспериментальных данных, либо сочинения математических моделей согласно простым идеям с последующей проверкой и уточнением возникла в физике задолго до развития компьютеров. Оба подхода успешно применялись в физике, экономике, и многих других областях, но в современном ИТ известен и используется исключительно первый подход, по крайней мере я давно не встречал ничего иного. В этой статье я разберу примеры второго подхода из физики и лингвистики, а далее перейду к возможным решениям «неразрешённых» и «нерешаемых» проблем социальных сетей и Semantic web, включая засилье рекламы и спама, на основе второго подхода – получения желаемых свойств не напрямую из навязывания явных правил, а косвенным образом из устройства пространства решений.
Данный текст описывает общие принципы для создания платформ с низким уровнем спама и копипасты. Это – примитивизация правил; замена прямого регулирования обратными связями, подавляющими нежелательное силами самих пользователей; организация авторов в сообщества единомышленников (дискурсы), в которых обратные связи могут работать; замена глобальной кармы локальной кармой в пределах сообщества без участия в оценке чужих; применимость локальной кармы для монетизации.
Сложное из простого
Общая теория относительности (ОТО) Эйнштейна была получена из принципа эквивалентности инерции и гравитации. Два требования к теории – ньютоновский предел и Лоренц-инвариантность из специальной теории относительности. ОТО позволяет точно вычислить смещения перигелия Меркурия, отклонение света, потери энергии нейтронных звёзд на излучение гравитационных волн (до открытия самих гравитационных волн) и многое другое на что не закладывались при создании теории.
На примере игры «Жизнь» и ОТО мы убедились, что системы, описываемые простыми правилами, могут давать очень сложные и заранее непредсказуемые решения. Наоборот, системы, описываемые сложными правилами, часто дают примитивные решения, непредсказуемость которых сводится к скрытым возможностям злоупотреблений. Борьба с этими злоупотреблениями требует написания новых правил, а также найма вахтёров, следящих за их соблюдением.
Простые правила дающие сложные решения на своём уровне являются примитивизацией. Это стандартный, но кажется всегда нетривиальный путь развития. Одна операция одним рабочим на конвейере вместо надомных рабочих на улицах Ствольная, Замковая и Ложевая в Туле (что тоже было прогрессом против средневековых цехов) – примитивизация труда каждого из рабочих, позволяющая создавать более сложные и качественные, за счёт точности обработки, изделия. Другой пример развития через примитивизацию – изначально контринтуитивный и примитивный фонетический алфавит. Пиктограммы – интуитивные: было много независимых центров их происхождения в разных частях света. Китайские единственные сохранились и продолжают развиваться в XX и XXI веках в сторону усложнения даже в упрощённом китайском, но отказываться от пиктограмм китайцы не будут ради единства письма сильно отличающихся произношением региональных диалектов. Все линейные фонетические алфавиты произошли от греческого, а греческий от финикийского от которого произошли все линейные (согласно Уолтеру Онгу, но кто-то усомнится), а финикийский от упрощенного египетского слогового письма для малограмотных и обучения детей грамоте. Переходы от пиктограмм к небольшому фонетическому алфавиту, то есть идея записывать отдельные звуки, а до этого звучание отдельных слогов символами, было крайне нетривиальным изобретением, но при этом примитивизацией пиктограмм.
Простые правила для платформ можно попытаться получить исходя из нескольких общих принципов, подобных принципу эквивалентности ОТО.
Необходимость обратных связей
Спам, реклама, копипаста и кролики будут публиковаться или размножаться неограниченно пока не запустится и наберёт силу какой-то механизм отрицательной обратной связи, препятствующий их росту. Кролики на островах без хищников ограничены только кормовой базой, а в местах их естественного обитания ещё и хищниками. В центре крупных городов кроликов вообще нет, а если кролик забежит в центр, то погибнет. Задача борьбы с кроликами на островах без хищников может решаться либо полным истреблением кроликов и карантином, либо завозом хищников. В естественной среде обитания или в центре города задача борьбы с кроликами обычно вообще не стоит. (В игре «Жизнь» отрицательная обратная связь тоже присутствует в виде ограничения плотности сверху – гибели клеток от перенаселённости, но нет ограничений на пустоту.)
Перечислим ограничители на рекламу в интернете. Обычно реклама контролируется владельцами платформы, иногда допускается реклама от пользователей, как часть поста или видео на YouTube. YouTube помечает такую рекламу предупреждением. Количество рекламы на платформе ограничивается количеством рекламы на конкурирующих платформах, нельзя забивать платформу рекламой намного сильнее, чем это делают конкуренты. Можно сделать ограничение на рекламу, спам, копипасту и генерируемый ИИ бред в виде отрицательной обратной связи источником которой будут действия пользователей, но пользователи возможно ограничат рекламу в ноль, а платформы на такое не согласны. В продуктивном варианте пользователи должны эффективно подавлять неуместный и некачественный контент вообще и позволять уместный и качественный контент, включая уместную рекламу. Для этого генерирующие качественный контент пользователи должны получать какую-то долю рекламных доходов. Такой подход должен также улучшить таргетирование рекламы, а значит приветствоваться рекламодателями, которые готовы платить больше за рекламу с высокой конвертацией.
Быстрые обратные связи также необходимы для улучшения качества текстов и для решения проблемы отказа ставить ссылки на первоисточники и подавления публикаций со внешними ссылками для сохранения трафика внутри системы: необходимые ссылки будут подавляться для предотвращения выхода из системы, пока за подавление таких ссылок нет немедленного и видимого наказания, а за расстановку необходимых ссылок поощрения.
Другие требования необходимые для реализации обратных связей будут описаны ниже.
Устройство социальных сетей не соответствует социальной организации людей
ОТО формулируется в 3+1 искривленном пространстве-времени, а не в плоском 3 мерное пространстве классической механики, отделённом от времени. Для включения инициированных пользователями механизмов обратной связи тоже нужно адекватное социологическое описание пользователей, а также их взаимодействия между собой с помощью текстов, а не какие-то взятые с потолка и навязанные пользователям конструкции. Существующая система организации на уровнях платформа – пользователи – подписки или ограниченные тематические сообщества под руководством отдельных пользователей явно не описывают существующие сообщества единомышленников и мало помогают их организации.
Пространства смыслов организовано в виде дискурсов, то есть сообществ единомышленников, делящих также и понятийный аппарат, «общий язык». Каждый дискурс обладает своей точкой зрения. Организация дискурса или даже просто описание норм сообщества возможно только в рамках этого дискурса, организация дискурса всегда является самоорганизацией. «Нейтральная точка зрения» базирующаяся на «авторитетных источниках» – не отражение реальности, а инструмент тотального контроля. «Нейтрального» дискурса не существует, есть только самый популярный дискурс. Множественные дискурсы не представлены ни на одной из платформ, но каждая из платформ насаждает единственный дискурс в интересах своих владельцев, что гарантирует обоснованное недоверие к интернет-платформам со стороны всех сторонников других дискурсов. Неспособность корпоративных интернет-платформами одновременно поддерживать разные дискурсы, а также давать инструменты для их формирования и развития, стало причиной застоя интернета, вставшего на квадратные колёса Википедии и социальных сетей в нулевые.
Построить заслуживающую всеобщего доверия платформу можно если это распределённая p2p система на основе открытого кода, которая никому не принадлежит и может быть реализована без централизованного контроля[1]. Доверие можно считать всеобщим если каждая группа единомышленников сможет хранить и контролировать материалы своего дискурса на своих серверах согласно собственным правилам, подобно тому как на узлах Фидонета хранились интересные владельцам узлов эхоконференции (форумы), а в торрентах на раздачу идут только закачиваемые и сохранённые фильмы. Фидонет, в силу распределённой архитектуры, обладал преимуществом над интернетом, но его критическим недостатком был ограниченный базовый формат форума. Тем же недостатком, ограниченностью базового формата, обладают и все остальные распределённые социальные сети и системы, массово появляющиеся в последние годы. Следующая статься будет посвящена проблеме создания универсальной платформы, обладающей функционалом множества других интернет-систем в рамках единого и простого пользовательского интерфейса и единой базы данных.
Только локальная карма, только локальная репутация
Существующие платформы используют глобальную карму, напоминающую рейтинги состояний миллиардеров. Хотя со времён древней Греции существует многоборье, но обычно у шахматистов, бегунов и боксёров отдельные рейтинги. Глобальная карма бессмысленна: оценка единомышленников и оценка посторонних относятся к разным категориям и их нельзя мешать. Единомышленники могут оценивать творчество друг друга индивидуально, а также близость или удаленность чужих дискурсов в целом. Индивидуальная оценка от посторонних вообще не нужна. Критика принципиально отличной точки зрения является предметом публикации в собственном дискурсе, а не поводом для расстановки галочек или эмодзи. Например, православные не критикуют и не минусуют отдельных католиков за филиокве, а пишут статьи почему филиокве неправильно, то есть критикуют католический дискурс в рамках своего дискурса.
Дискурс составляют как тексты, так и авторы и их читатели. И тексты, и текущие авторы дискурса должны обладать согласием между собой. Тексты и читатели пассивны. Основа дискурса – активные авторы. Избежать ручной взаимной оценки авторов невозможно, но можно ограничиться этим. Оценка читателей не нужна вообще, если дискурс читают — значит дискурс популярен и этого достаточно.
Механизм дискурсов предполагает, что «авторитетность источников» должна устанавливаться на уровне отдельных дискурсов. Разные дискурсы могут обладать согласием по ряду вопросов и считать одни и те же источники авторитетными, но проверка каждого из источников будет осуществляться в каждом из дискурсов независимо.
Механизмы дискурса с локальной кармой также практически исключают возможность интернет травли: в своём дискурсе травить не будут, до чужих дискурсов нет дела, а дискурсы в целом будут противостоять не кому-то лично, а другим дискурсам.
Кристаллизация дискурсов
Необходимо предоставить явные механизмы для организации дискурсов, то есть механизмы отношений пользователя со всем сообществом дискурса, а не только парные отношения друзей или подписки на автора. Необходимы механизмы кристаллизации и роста новых дискурсов, объединения дискурсов при достижении согласия и разделения при утрате согласия. В рамках механизмов дискурсов нужны механизмы монетизации для авторов, создателей системы и программистов, осуществляющих поддержку системы после её запуска.
Создание нового дискурса подобно кристаллизации снежинки из переохлаждённого пара, что может случиться случайно или из внешнего центра, например пылинки или перехода на новую платформу существующего сообщества из социальной сети. Дискурс может явно декларироваться (авторами или даже создателями системы при её запуске), но может и вычисляться, а затем проверяться через согласие «вычисленных» авторов. Можно сочетать оба подхода. Если согласие авторов теряется, то дискурс надо разделять на несколько обладающих согласием. Для этого авторам можно предложить голосование о возможном разделе. Процесс вынесения на голосование может быть автоматическим, но алгоритм опубликованным и обсуждаемым. Для каждого дискурсов авторы-владельцы могут индивидуально голосовать за местные значения параметров алгоритмов.
Монетизация и количество дискурсов
Монетизация возможна с помощью отдельной криптовалюты для каждого дискурса. Майнинг будет просто ростом кармы автора за счёт создания вкладов в дискурс, а также поддержанием системы. Например, создатели и разработчики системы получают 10% крипты каждого дискурса, ещё 10% будет раздаваться за хостинг, остальные 80% – авторам. Выводить деньги можно продажей локальной кармы, то есть локальной криптовалюты, рекламодателям. В процессе публикации рекламы сжигается карма, то есть криптовалюта. Скорость сжигания кармы будет зависеть от того насколько неуместна реклама: раздражающая реклама будет сжигать криптовалюту быстро, а значит будет невыгодной рекламодателям. Существующие криптовалюты – фиатные, то есть базируются на доверии. Криптовалюты дискурсов будут нефиатными, то обеспеченными популярностью дискурса у читателей и эффективностью рекламы в дискурсе, что также защитит от спама: ценность криптовалют населённых роботами дискурсов будет как у долларов Зимбабве в 2008 году.
Ожидаемое распределение популярности дискурсов по каждой теме может быть 50% для самого популярного дискурса, 25% для следующего, 12.5% для третьего и так далее, то есть альтернативы представлены и создают конкуренцию самому популярному дискурсу, но значимых альтернатив не будет слишком много. В разных темах самыми популярными могут быть разные дискурсы. Слишком мелкие дискурсы и крипта этих дискурсов никому не нужны кроме его авторов – для успешной монетизации дискурс должен быть достаточно большим, что даёт стимул не создавать новых дискурсов без необходимости, а находить единомышленников, у которых может не быть согласия по всем вопросам, но точно есть способность вести конструктивный диалог между собой.
Как создавать конкуренцию между разными дискурсами, то есть разными точками зрения на одну тему, для повышения качества контента в каждом из дискурсов, будет обсуждаться в следующей статье.
Заключение и библиография
Я следую идеям Уолтера Онга из Торонтской школы коммуникации исследовавшего устность, письменность и выступления на ТВ и в интернете (вторичная устность) как технологии. Я пытаюсь расширить подход Онга в область инженерии, то есть создания новых технологий общения. Краткий обзор подхода описан в моей статье «Как технологии коммуникации диктуют механизмы мышления человека».
Мои статьи писались в обратном порядке от необходимого: эта статья по смыслу должна быть первой. В следующей статье приведены метрики для оценки систем письменного (текстового) общения и дана оценка развития с середины ХХ века. Затем будет статья, описывающая идею универсальной платформы сочетающей свойства многих других платформ в рамках единого пользовательского интерфейса и единой базы данных. В предыдущей статье описана проблема доверия, решить которую невозможно при помощи LLM. В статье «Наука является прикладной технологией и это создаёт проблемы» я разбираю проблемы науки возникающие в следствие неразвитости технологий общения. В статье о многомерных ссылках объясняется почему расширенная Википедия++ (В++) способна выглядеть как большинство существующих интернет-платформ в зависимости от выбора направления навигации в системе, а также обеспечить максимальную связность системы.
[1] Контроль над отдельными доменами (наборами дискурсов) p2p системы может быть настроен в широком диапазоне от анонимного децентрализованного (как биткоин) до привязки ключей к Госуслугам. Анонимные домены и контролируемые государством домены могут сосуществовать и взаимодействовать в рамках одних протоколов подобно разным сайтам Веба или разным языковым версиям Википедии на разных серверах, но под одним пользовательским интерфейсом.