febb1 июн 2010 в 14:28

Автоматический Web

2 мин

2.5K

Чулан

+23

Комментарии 19

Strorin 1 июн 2010 в 14:36

Что сказать-то хотел?

НЛО прилетело и опубликовало эту надпись здесь

Dreammaker 1 июн 2010 в 14:38

В порн… сео автоматическиский веб уже себя хорошо показывает. Не совсем то, что вы описали, но близко. Те же сервисы типа seopult, rookie, webeffector — работают в полуавтоматическом режиме. Часть работы должен сделать сам оптимизатор, но вот тестовые закупки ссылок, проверка их работоспособности, удаление не проиндексиваронных, закупка новых и т.д. — это проходит в автоматическом режиме.

febb 1 июн 2010 в 16:04

На самом деле технологии, алгоритмы уже есть. Гуглу, Яндексу под силу такое сделать, да и фактически они это делают через свои службы рекламы. Попробую дать первое представление как это может выглядеть.

Вы читаете какой-то текст, новость. Адрес в строке неважен. Внизу появляется другой текст «вам будет интересно», переходите на него. Система даже учится. Как last.fm например. И вы можете бесконечно прыгать от текста к тексту, где ссылки (переходы) будут релевантные, а не прямые, подготовленные текущим автором или алгоритмом его сервера.

Те же бесплатные тексты Википедии можно так сделать. Пока это только ссылки в подвале, подготовленные авторами статьи. Если сделать персонализацию, ориентироваться на историю просмотров пользователем, то даже внутри Энциклопедии всегда будет что почитать.

Сами тексты тоже могут по-разному выстраиваться. Если читатель хорошо знает математику, ему показываются формулы. Если ребенок — то больше картинок. В мире бесплатной информации сайт получается лишней категорией. Важен алгоритм представления этой информации.

Машины пока не научились глубоко понимать смысл текста, но найти вероятно интересное уже умеют хорошо.

Elkaz 1 июн 2010 в 15:14

А как же Whoyougle?

SerrNovik 1 июн 2010 в 18:49

Может вы плохо смотрели — но основная задача семантического веба — как раз в формализации и представлении информации и качественно лучшем поиске и представлении информации на основании того что она описывает.

febb 1 июн 2010 в 19:17

Скажем так, все что я прочитал о семантическом Вебе предполагает обработку источников. Ну то есть по сути Бернерс-Ли предлагает использовать специальные смысловые тэги, метки, метаданные. Ему, конечно, виднее, но как по мне это утопический подход. Победа обычных поисковиков это доказала. Им в чистом виде не нужен ни рсс, ни доступ к базам данных. Они «видят» интернет практически так же как живые люди, без специальных протоколов и форматов. Обрабатывают его, и находят в миллиардах текстов то, что нужно пользователю. Очень хорошо получается уже. Еще один этап в облегчении с взамодействия с интернетом — читателю не нужно прыгать из поисковика на сайты и обратно. Поисковик приходит в сайты, ну или, если хотите, сами сайты появляются под поисковой формой и в контекстных блоках. Если информация есть — какой смысл уже ее «раскладывать» по разным адресам. Дизайн? Кого сейчас волнует дизайн. Ее можно собрать воедино, как логически, там и технически. Остается лишь правовой аспект. В этом и есть суть описываемого «Автоматического Web» — избавить пользователя от поиска разрозненной информации. Давать ее сразу.

haskel 1 июн 2010 в 19:18

>Поисковики практически достигли предела развития

«640 килобайт хватит всем» — БГ

«Все, что могло быть изобретено, уже изобрели» — специальный уполномоченный американского Бюро Патентов, 1899г

В будущем компьютеры будут весить не более чем 1.5 тонн

Думаю, что на мировом рынке мы найдем спрос для пяти компьютеров. (Thomas Watson – директор компании IBM, 1943г )

Такое устройство, как «телефон» имеет слишком много недостатков, чтобы рассматривать его, как средство связи. Поэтому, считаю, что данное изобретение не имеет никакой ценности. (из обсуждений в компании Western Union в 1876г )

Летающие машины, весом тяжелее воздуха невозможны! (Lord Kelvin – президент Королевского Общества — Royal Society – 1895г)

Бурение земли в поисках нефти? Вы имеете в виду, что надо сверлить землю для того, чтобы найти нефть? Вы сошли с ума (ответ на проект Edwin L. Drake в 1859г )

Самолеты – интересные игрушки, но никакой военной ценности они не представляют. (Marechal Ferdinand Foch, профессор, Ecole Superieure de Guerre.)

haskel 1 июн 2010 в 19:26

Вот когда поисковики будут находить мои носки, я вспомню о пределе развития. Не раньше.

febb 1 июн 2010 в 19:51

Спасибо за отличные цитаты :-) Я и не говорю, что прогресс закончился, я как раз говорю что отсутствие прогресса затянулось. Вот не поленился, проанализировать в _поисковике_ Гугл два запроса «Google эволюция поиска» и «Google evolution of search». Практически никаких изменений с начала 2000-х. Да даже и с конца 90-х. Конечно, специалист в SEO найдет кучу различий в движке полугодового срока, но факт в том, что эти изменения касаются и направлены только на специалиста в SEO.

Интерфейс поиска не меняется уже десять лет. Поисковая строка, выдача ссылок и кратких аннотаций. Да, проводятся какие-то мелкие эксперименты с социализацией. Да, пытаются играть с кластеризацией, но не включают ее в действие.

Общий смысл остается тот же.

При этом конечно же алгоритм Google изменился, он стал находит точнее. Но по сути остался тем же.

Алгоритм конечно же совершенствуется, выдача улучшается. Вместе с тем регулярно Гугл судят за слишком большие картинки в поиске, за слишком большие аннотации, за «лишние» книги, слишком детальные карты или чужие адреса в кэше. Еще за что-то.

Из наших смело экспериментирует с поиском Нигма. Уже дает какую-то информацию из википедии прямо в поиске. Вот Википедия похоже и будет основой для автоматического web.

Проблема не техническая, проблема правовая. Если сейчас запустится какой-нибудь «пиратский» краулер, и потом на хорошем алгоритме сделает хороший сервис — успех ему будет. Наверное он будет достаточно скоро.

aleXoid 2 июн 2010 в 02:10

По-моему рано списывать со счетов web 2, особенно если брать в расчет поисковики. И как минимум странно:

>> Вот не поленился, проанализировать в _поисковике_ Гугл два запроса
>> «Google эволюция поиска» и «Google evolution of search». Практически
>> никаких изменений с начала 2000-х. Да даже и с конца 90-х.

Изменений огромное количество и быть SEO-специалистом чтобы их увидеть не нужно (ниже, применительно к Google):
1) Появление контекстной рекламы — анализируя контент, посетителей и кол-во кликов на том или ином объявлении можно узнать о многом
2) Календарь, документы, почта, фото (Flickr и Picasa), видео (Google Video и Youtube), блоги с Blogspot, микроблоги с Buzz (а почти все привязывают туда и Twitter-аккаунты), чтиво с Google Reader, накопление и анализ хистори. Сегодня не так много пользователей Интернета не имеют аккаунта в Google.
3) Cвободные DNS сервера, Google Analytics — отличный инструмент сбора предпочтений своих пользователей
4) Сбор сведений о WiFi сетях, развитие Google Maps с адресами и т.д. — сервисы геолокации, которые знают где пользователи Google проводят свое время.

Если поисковик знает о тебе почти все, то логично, что он в итоге все это объединит и станет выдавать в своем основном ПОИСКОВОМ сервисе именно то что ищет пользователь. Если соединить базы Google и соц. сетей Facebook, вКонтакте и пр. то о подрастающем поколении эти сервисы знают гораздо больше родителей.

По-моему очевидно что поисковые технологии двигаются к smart-поиску, основанному на предпочтениях пользователей. А вся «автоматизация» нужна действительно больше паукам для поиска энциклопедической и научной информации…

febb 2 июн 2010 в 05:38

aleXoid, вы правы, но попробуйте взглянуть на интерфейс поиска по-другому. Мы просто привыкли к нему очень и очень сильно. Да, как уже писал — технически все готово к реализации контекстной подачи информации. Алгоритм умеет находить оригиналы вместо копипастов, умеет находить то, что интересует пользователя, умеет привязываться к гео, возрасту, полу и т.д. Но!

Поисковик не дает саму информацию. Ему это запрещено. Он дает лишь набор ссылок, где информация часто либо дублирована, либо пользователю приходится анализировать полезность этой информации. Да, отвечая на 1) 2) 3) 4) поисковые компании создали множество сервисов вокруг со своей _личной_ информацией. Часто эти сервисы даже лучше, чем на стороне.

Попробуйте представить немного другой Интернет. Где информация не разложена по отдельным сайтам. Где не нужно выбирать из поисковой выдачи лучший вариант одного и того же. Посмотрите наконец на Вольфрам и попробуйте представить как бы в нем смотрелась информация иного рода.

Набросаю конкретный сценарий. Вас заинтересовала например смерть Андрея Вознесенского. Вы пишете в поле на белой странице: Вознесенский. Внизу появляются блоки информации. Новость о смерти. Ниже краткая биографическая справка. Слева ссылка на собрание сочинений. Справа лента видеороликов от ТВ каналов. Отдельно вкладка на выступления. Ссылка на спектакли по его стихам. Внизу отзывы читателей. И все это на одной странице. Да, вся эта информация есть кусками сейчас. Вы можете найти отдельно. Но вот такой интеллектуальной Dashboard нет. Просто потому что никто не разрешает владельцу алгоритма (Гуглу) показывать саму информацию у себя. Механизм этот будет, Гугл будет показывать у себя чужую информацию с чужой рекламой. Пока лишь есть зачатки и эксперименты такого автоматизированного свода.

Посмотрите «Пресс Портреты» Яндекса. Там примерно о том же, наглядно. Автоматические цитаты, автоматическая биография, какие-то новости.

Да того же Вознесенского посмотрите и станет понятно о чем я.
news.yandex.ru/people/voznesenskij_andrej.html

arilou_camper 6 июн 2010 в 21:26

в таком случае рекламная модель умрет.
где гугл будет показывать рекламу? ведь получится, что на одной странице собрана информация из разных источников, а деньги будут капать только гуглу.

febb 8 июн 2010 в 02:13

Не обязательно. Будем нормальный механизм монетизации. Гугл показывает чужую информацию и платит деньги. И показывает чужую рекламу.

P.S. Как вы считаете, стоит ли мне писать статью про будущие методы монетизации?

arilou_camper 8 июн 2010 в 06:39

думаю да, стоит.
по крайней мере, это интересная тема.

febb 10 июн 2010 в 15:08

Написал статью, но опять загоняют в минус. Читайте :-) Эх, за что же такая неблагодарность :-)
Что-то в консерватории не так… febb.habrahabr.ru/blog/96115/

Pingwin32 10 июн 2010 в 08:32

Будет о чем холиварить ;-)

febb 10 июн 2010 в 15:08

Pingwin32 10 июн 2010 в 04:05

Возможности Web 3.0 вытекают из возможностей Web 2.0
Возьмем в пример Хабр:
1) метки/теги есть
2) рейтинг есть
3) комментарии есть

Если покопать SEO, то видно, что в его основе уже есть семантический анализ, опять же есть метки/теги. Уже работают автоматические новостные ленты.

Чего не хватает для появления Web 3.0?
1) Создания общего стандарта
2) Создание стандартного API межсерверного взаимодействия.
3) Интеграция элементов Web 3.0 в браузеры.
4) Создание общего распределенного каталога на замену доменных имён.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий