Часть 1. Где хранить данные децентрализованным приложениям на блокчейне?

    Сейчас наблюдается бум блокчейн проектов. Некоторые блокчейны настолько мощные, что являются платформой для написания приложений. Приложения автоматически получаются децентрализованными, устойчивыми к цензуре и блокировке. Но действительно ли всё так хорошо и просто? В данной статье мы постараемся посмотреть на блокчейн как платформу для приложений, сняв розовые очки.

    А что же это такое блокчейн?

    Блокчейн (blockchain — цепочка блоков) — это неизменяемая структура данных, состоящая из списка блоков, где каждый следующий блок содержит хэш предыдущего блока. В результате такого хэширования цепочка блоков становится неизменяемой: нельзя изменить или удалить блок из середины цепи, не перестроив все блоки выше, потому что малейшее изменение потребует перестройки (пересчета хэшей) всех блоков выше изменения.

    Если сделать ещё подсчет хэша каждого блока вычислительно или экономически сложной операцией, то изменение данных в середине цепи становится вообще практически невозможным. Сочетание сложности подсчета хэша нового блока, а также легкости проверки правильности хэша как раз и обеспечивает блокчейну серьёзную устойчивость к неправомерным изменениям. На этом и держится безопасность биткоина и других блокчейнов.

    Благодаря этому своему свойству блокчейн проекты могут быть публично децентрализованы. То есть, кто угодно может поставить рабочий узел блокчейна и генерировать новые блоки. В большинстве реализаций блокчейна за генерацию блока дают награду — этот процесс называется майнинг. А поскольку майнить сложно, а результаты твои легко могут быть проверены, то выгодно действовать только честно. Иначе потратишь ресурсы на майнинг, а другие майнеры твой блок не примут — вся работа насмарку. Таким образом, при полной децентрализации и независимости отдельных узлов сеть блокчейнов работает как единое целое.

    Но ладно, допустим, одного нечестного майнера легко вычислить и проигнорировать. Но что, если их много, и они сговорились? Представьте, что все люди вокруг вас считают красный свет зеленым. :) И смотрят на вас, как на ненормального, если вы считаете иначе. Социальные эксперименты показывают, что большинство людей в такой ситуации начинают сомневаться и присоединяются к мнению большинства. А ведь в блокчейне как раз и работает правило большинства!

    Подобная проблема выяснения истины в условиях, когда твои собеседники могут бессовестно врать, была названа Лесли Лампортом «Проблемой византийских генералов», а решена двумя годами ранее в 1980 году им же совместно с другими авторами. Было показано, что при n шпионах, которые могут врать и искажать информацию, консенсус между участниками может быть достигнут при общем количестве участников 3n+1. А если гарантировать, что шпионы не могут искажать переданную через них сообщения, то достаточно и 2n+1. В блокчейне за счет электронной подписи зловредные узлы не могут искажать информацию, поэтому если в блокчейне менее половины зловредных узлов, то сеть устойчива.

    Устойчивость сети к зловредным узлам называется устойчивостью к византийской проблеме (Byzantine Fault Tolerance, BFT). BFT очень важна для публичных сетевых систем, в которые могут свободно добавляться произвольные узлы. Именно такими системами является большинство проектов на блокчейне.

    Применение блокчейна не ограничивается созданием криптовалют. Внутрь блока можно записывать что угодно. В биткоине туда записывается список новых транзакций, и применяется это для обмена криптовалютой между её владельцами. В NameCoin в блоках хранятся произвольные пары ключ-значение, что можно применить для создания децентрализованных DNS. В других реализациях блокчейна используются ещё какие-нибудь фишки. А вот Ethereum пошел значительно дальше. Он позволяет хранить в блокчейне не только транзакции, но и полноценные Тьюринг-полные программы, называемые смарт-контрактами, которые позволяют очень тонко настроить блокчейн на прикладную задачу. Например, NameCoin реализуется на Ethereum 5 строками кода.

    Ethereum задумывался как универсальная платформа для создания децентрализованных проектов на основе блокчейна. Зачем реализовывать весь блокчейн заново, разворачивать собственную инфраструктуру, если можно парой-тройкой смарт контрактов реализовать то, что тебе нужно, на Ethereum, как, например, аналог NameCoin? Поэтому последнее время Ethereum переживает бурный рост. С марта 2017 ETH (криптовалюта Ethereum) всего за два месяца выросла в цене в 5 раз, и рост продолжается. На Ethereum работают уже сотни приложений, например, социальная сеть AKASHA, биржа фрилансеров Ethlance, игра в слова, да много их!

    Блокчейн со смарт-контрактами предоставляет приложениям всю инфраструктуру. Приложения имеют выполняемый на блокчейне код в смарт контрактах. Приложения могут хранить в блокчейне любую информацию, передавая её в свои смарт контракты как данные. Приложения могут читать эту информацию из блокчейна, потому что состояние блокчейна Ethereum — это, по сути, база данных ключ-значение.

    Казалось бы, что ещё нужно? Приложения получаются действительно децентрализованными, неподверженными цензуре и запрещению. В общем, блокчейн — это сплошные достоинства! Но если бы всё было так хорошо… При создании действительно мощных приложений сразу обнаруживаются и недостатки.

    Неизменяемость. Неизменяемость — это, конечно, хорошо. Именно неизменяемость даёт блокчейну публичность и BFT. Однако есть и обратная сторона медали. Все данные, которые приложения пишут в блокчейн, остаются там навсегда. Поиграли в слова — блокчейн это запомнил. Разместили информацию в социальной сети — она навсегда сохранена в блокчейне, даже если вы потом удалили свой профиль. Взрывной рост числа приложений на блокчейне приводит к сильному раздуванию цепи блоков в размере. Уже сейчас размер полного блокчейна Ethereum перевалил за 130Гб, хотя он работает меньше 2 лет. У биткоина меньше при его солидном возрасте более 7 лет.

    Конечно, в некоторые реализации Ethereum включают технологию State Tree Pruning, которая позволяет хранить только последнее состояние блокчейна, с ограниченной историей примерно на сутки, что на текущий момент позволяет сократить хранимую информацию в 20 раз. Например, go-ethereum full node требует для хранения блокчейна 130 Гб, а Parity с поддержкой данной технологии — всего 6 Гб. Однако, учитывая, что рост числа приложений только начинается, а каждому узлу Ethereum приходится хранить все данные всех приложений, это выглядит хоть и необходимой, но всего лишь отсрочкой проблемы. С ростом размера блокчейна он перестанет помещаться на массово выпускаемые жесткие диски, его обслуживание станет по карману лишь большим организациям, что ведет к опасной централизации — сосредоточению контроля над более чем 50% сети у одной организации. Это может нарушить BFT.

    Медленность транзакций. За свою устройчивость блокчейны расплачиваются скоростью транзакций. У биткоина 7 транзакций в секунду, у Ethereum — 15. И это на всю сеть, потому что каждый узел полностью реплицирует другие узлы. Добавление нового узла повышает устойчивость системы, но никоим образом не увеличивает скорость её работы или максимальный объём хранения данных. То есть, изменение данных (а каждое изменение данных в блокчейне — это транзакция) является бутылочным горлышком. Популярные приложения сразу же натолкнутся на это ограничение.

    Примитивное хранение данных. При том, что состояние блокчейна уже является базой данных «ключ-значение», она довольно примитивна. Поиск возможен только по первичному ключу, объем хранимых данных очень ограничен. Для серьёзных приложений этого явно недостаточно.

    Таким образом, при разработке приложений на блокчейнах, например, для Ethereum, проблема хранения данных стоит очень остро. Сейчас нет удовлетворительных способов её решения.

    Но ведь существующие приложения, например, AKASHA как-то выкручиваются… В следующей части мы рассмотрим существующие подходы к решению этой проблемы.

    Вторая часть статьи
    Третья часть статьи
    Поделиться публикацией
    Ой, у вас баннер убежал!

    Ну. И что?
    Реклама
    Комментарии 14
    • +2
      Неплохая статья. Но не понравилось, что при заголовке Где хранить данные — этой информации уделен лишь один последний абзац.
      • 0

        Вижу, что всем понравилось, но хочется ещё ) Сегодня будет ещё, не волнуйтесь. Там же обещано.

      • +1
        Чуть общих слов про технологию, а потом реклама конкретных криптовалют?
        Блокчейн реализуется в пару сотен строк кода.
        1. Подсчет хэша каждого блока цепочки и есть проверка правильности. Она ну очень быстрая. Linked List.
        2. Внутри блока хранить можно что угодно и любого размера. Сериализация.
        Конец статьи :)

        • 0
          Спасибо, интересно написано. Но вопрос то не раскрыт вообще:
          Так а где же хранить?
          • 0

            Спасибо за краткий пересказ введения. Но если бы я так написал, было бы совсем непонятно. Пришлось написать подробнее. А где реклама?
            Сегодня будет продолжение. Всего будет 3 части, все по существу.

            • 0

              Это ответ для olku

              • +1
                Продолжайте. Обратите внимание, что некоторые статьи про блокчейн содержат ошибки. Например, «Блокчейн в 200 строк кода», который постился на ресурсе аж дважды (второй раз удалили). Авторы даже не проверяли что пишут, похоже, откуда-то взято.
                В последнее время на Хабре все больше научпопа и скрытой рекламы, гиктаймс не спасает, а система рейтингов среди любителей стимулирует гиковость и снижает качество ранжирования вцелом. Скоро понадобится Хабраторт.Ру с избранными рецензированными статьями вместо лайков. Естественный побочный эффект расширения?
              • 0
                Хорошая статья, наконец-то хайп по поводу блокчейна потихоньку проходит.
                • +1
                  Вопрос в тему. Предположим блокчейн шибко развился. Миллиард человек совершают в среднем по 5 транзакций в день каждый (от покупки утреннего кофе до оплаты счетов), т.е. в год получается около двух триллионов транзакций. Пусть каждая по 512 байт, значит каждый блокчейн-клиент будет отъедать по терабайту дискового пространства в год. Я прав?
                  • +1
                    «640 килобайт хватит всем»...

                    Над беспокоившем Вас вопросом уже работают… а если новые носители информации (на кварце) прослужат миллионы лет — то и налоговая всеми руками будет "за":).
                    (Не думаю, что что то нужно будет иметь с собой кроме платёжного устройства, с подключением к сети — все гигабайты полной истории будут хранить в огроменном гособлаке, куда доступ шаловливым пользователям будет заказан).

                    • 0
                      Работают как? В чём принципиальная идея? Ведь если переходить к гособлаку, то теряется идея децентрализации, получается аналог счёта в банке, который банк или государство могут заходеть заблокировать.
                      • 0
                        Государство тоже иногда может быть заинтересовано, чтобы данные невозможно было подтасовать задним числом. Для этого блокчейн подходит (с Proof of Work, конечно). Хотя, наверное, маловероятно, чтобы государство это захотело…
                        • 0
                          Государству достаточно поставить централизованный сервер.
                  • 0
                    У биткоина 7 транзакций в секунду, у Ethereum — 15

                    Количество транзакций \ блок в сети Ethereum ограничивается согласно лимиту на «газ». Каждая транзакция потребляет определенное количество «газа». Блока наполняется, пока газ для блока не израсходуется. Если появляется много наполненных блоков, лимит газа на блок (соответственно количество транзакций в секунду) может быть увеличено манерами [1] согласно их Yellow Paper [2]. У Bitcoin дела хуже, чтобы увеличить размер блока нужно делать hard-fork [3], или частично решать проблему soft-forkами, на подобии Segregated Witness [4]

                    Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                    Самое читаемое