WEB 3.0 — второй подход к снаряду / Хабр

Сначала немного истории.

Web 1.0 — это сеть для доступа к контенту, который размещали на сайтах их владельцы. Статичные html-страницы, доступ к информации только для чтения, основная радость — гиперссылки, ведущие на страницы этого и других сайтов. Типичный формат сайта — информационный ресурс. Эпоха переноса в сеть offline-контента: оцифровка книг, сканирование картинок (цифровые фотоаппараты были еще редкостью).

Web 2.0 — социальная сеть, объединяющая людей. Пользователи, погруженные с головой в интернет-пространство, создают контент непосредственно на web-страницах. Интерактивные динамические сайты, тегирование контента, веб-синдикация, технология mash-up, AJAX, веб-службы. Информационные ресурсы уступают место социальным сетям, блогхостингам, wiki. Эпоха online-генерации контента.

Понятно, что термин “web 1.0” возник только после появления “web 2.0”, для обозначения прежнего интернета. И практически сразу начались разговоры о будущей версии 3.0. Вариантов видения этого будущего было несколько, и все они, конечно же, были связаны с преодолением недостатков и ограничений web 2.0.

Руководителя Netscape.com Джейсона Калаканиса прежде всего волновало низкое качество контента, создаваемого пользователями, и он предположил, что будущее интернета за “одаренными людьми”, которые начнут “создавать высококачественный контент" (Веб 3.0, «официальное» определение, 2007). Мысль вполне себе разумная, но как и где они это будут делать, на каких сайтах, он не объяснил. Ну не на Фейсбуке же.

Автор термина “web 2.0” Тим О’Рейли резонно предположил, что для размещения информации в сети не обязателен столь ненадежный посредник, как человек. Поставлять данные в интернет могут и технические устройства. И те же технические устройства могут читать данные непосредственно с веб-хранилищ. По сути, Тим О’Рейли предложил ассоциировать web 3.0 с уже привычным для нас термином “интернет вещей”.

Один же из основателей всемирной паутины Тим Бернерс-Ли увидел в будущей версии интернета реализацию своей давнишней (1998) мечты о семантическом вебе. И его трактовка термина победила — большинство произносящих “web 3.0” до последнего времени имели в виду именно семантический веб, то есть сеть, в которой контент страниц сайтов был бы осмысленным для компьютера, машиночитаемым. Где-то в районе 2010-2012 годов было много разговоров об онтологизации, пачками плодились семантические проекты, но итог известен всем — мы до сих пор пользуемся интернетом версии 2.0. Полноценно выжили, по сути, только схема семантической разметки Schema.org и графы знаний интернетовских монстров Google, Microsoft, Facebook, LinkedIn.

Скрыть провал семантического веба помогли новые мощные волны цифровых инноваций. Интерес прессы и обывателей переключился на большие данные, интернет вещей, глубокое обучение, беспилотники, дополнительную реальность и, конечно же, блокчейн. Если первые по списку это в большей степени offline-технологии, то блокчейн — сетевой проект по сути своей. На пике своей популярности в 2017-2018 годах он даже претендовал на роль нового интернета (эту мысль неоднократно высказывал один из основателей Эфириума Джозеф Любин).

Но прошло время, и слово “блокчейн” стало ассоциироваться уже не с прорывом в будущее, а скорее с неоправданными надеждами. И естественным образом возникла идея ребрендинга: а давайте мы не будем говорить о блокчейне, как о самодостаточном проекте, а включим его в стек технологий, олицетворяющих все новое и светлое. Тут же для этого “нового” нашлось название (правда, не новое) “web 3.0”. А чтобы как-то оправдать эту неновизну названия пришлось в стек “светлого” включить и семантическую сеть.

Итак, сейчас в тренде не блокчейн, а инфраструктура децентрализованного интернета web 3.0, состоящая из нескольких основных технологий: блокчейна, машинного обучения, семантической паутины и интернета вещей. Во множестве появившихся за последний год текстах, посвященных новой реинкарнации web 3.0, можно в подробностях узнать о каждой его составляющей, но, вот незадача, нет ответа на естественные вопросы: как же эти технологии объединяются в нечто целое, зачем нейронным сетям интернет вещей, а семантической паутине блокчейн? Большинство команд просто продолжают заниматься блокчейном (наверное, в надежде создать крипту, способную побороть биток, или просто отрабатывая инвестиции), но под новой вывеской “web 3.0”. Все же хоть что-то про будущее, а не про неоправданные надежды.

Но не все так печально. Сейчас я попробую коротко ответить на заданные выше вопросы.

Зачем семантической сети блокчейн? Конечно, тут надо говорить не о блокчейне как таковом (цепочке криптосцепленных блоков), а о технологии, обеспечивающей идентификацию пользователей, консенсусную валидацию и защиту контента на основе криптографических методов в одноранговой сети. Так вот, семантический граф в качестве такой сети получает надежное децентрализованное хранилище с криптографической идентификацией записей и пользователей. Это вам не семантическая разметка страничек на бесплатном хостинге.

Зачем условному блокчейну семантика? Онтология, она вообще про разнесение контента по предметным областям и уровням. А это значит, что накинутая на одноранговую сеть семантическая паутина — а если проще, организация сетевых данных в единый семантический граф, — обеспечивает естественную кластеризацию сети, то есть ее горизонтальное масштабирование. Уровневая организация графа позволяет распараллеливать обработку семантически независимых данных. Это уже архитектура данных, а не сбрасывание всего без разбора в блоки и хранение на всех узлах.

Зачем интернету вещей семантика и блокчейн? С блокчейном вроде все тривиально — он нужен как надежное хранилище со встроенной системой идентификации акторов (включая IoT-датчики) по криптографическим ключам. А семантика, с одной стороны, позволяет сегрегировать поток данных по предметным кластерам, то есть обеспечивает разгрузку нод, с другой — позволяет сделать данные, посылаемые IoT-устройствами, осмысленными, а значит независимыми от приложений. Можно будет забыть о запросе документации на API приложений.

И осталось выяснить, каков взаимный профит от скрещивания машинного обучения и семантической сети? Ну, тут все предельно просто. Где, как не в семантическом графе, можно найти такой колоссальный массив валидированных, структурированных, смыслово определенных данных в едином формате, столь необходимый для обучения нейронок? С другой стороны, а что лучше нейронной сетки проанализирует граф на наличие полезных или вредных аномалий, скажем, для выявления новых понятий, синонимов или спама?

И вот такой web 3.0 нам нужен. Джейсон Калаканис скажет: я же говорил, что это будет инструмент для создания высококачественного контента одаренными людьми. Тим Бернерс-Ли будет доволен: семантика рулит. И Тим О’Рейли тоже окажется прав: web 3.0 — это про “взаимодействие интернета с физическим миром”, про стирание грани между online и offline, когда мы позабудем слова “войди в сеть”.

Продолжение Семантический браузер или жизнь без сайтов

Предыдущие мои подходы к теме