nooze Oct 6 2008 at 17:56

Chrome будет использован для поиска по закрытой части веба?

2 min

1.1K

IT-companies

Translation

+46

Comments 70

nooze Oct 6 2008 at 18:00

ППНХ (первый перевод на хабре), принимаются предложения по улучшению перевода.

0n1y_0ne Oct 6 2008 at 18:07

Некоторые личные наименования не с заглавной буквы, как-то: «Планирует ли google в будущем использовать chrome для индекса закрытой части интернета?» Также есть несколько пунктуационных и стилистических ошибок, но копаться пока лень. :) В целом перевод и тема статьи хорошие. По самой теме позволю себе высказаться позже.

nooze Oct 6 2008 at 18:10

Да как-то упустил, подправил

track13 Oct 6 2008 at 18:07

Поработайте над связностью и смыслом перевода. Следующее предложение не читаеться, чтобы понять смысл надо лезть в первоисточник
«Должны быть внесены некоторые изменения в соглашение, чтобы позволить это, потому что это индексация персональных данных и это запрет для поисковых систем, особенно для лидера рынка – google»

nooze Oct 6 2008 at 18:08

Я долго бился над ним, но ничего логичнее чем сейчас не смог выдавить :) Если кто перефразирует со смыслом, буду рад.

track13 Oct 6 2008 at 18:19

«Для этого нужно внести некоторые изменения в TOS, потому что индексация личных данных — табу для поисковых систем. Особенно для лидера рынка — Google.»
Попробуйте так.

nooze Oct 6 2008 at 18:22

Спасибо, чуть дополнил и подправил

MTonly Oct 6 2008 at 22:41

Все ли еще это

По-прежнему ли это

на 4-ом месте

На 4-м месте

EugeneKudashev Oct 7 2008 at 10:35

Я бы посоветовал переводить «user-generated content» как «контент, создаваемый пользователями».

«Генерируемый», на мой взгляд, не очень уместно в данном контексте.

В целом перевод хорош и информация полезная. Спасибо :)

nooze Oct 6 2008 at 18:08

Выскажу и свое мнение :) Очень интересная теория. В эпоху web2 (а дальше еще хуже), поисковикам пирходится все труднее. Информацию уже не достать так просто как раньше — просканировал страничку и готово. Все извращаются с поиском по флешу, документам, pdf. Google пошел дальше всех и уже ищет по речи в видео, тексту в нем. Планируется и поиск по тексту в изображениях, но все это не бегранично. Настанет такой момент, что доступная информация будет проиндексирована вдоль и поперек, а вся ценность будет только в закрытой, в той, куда поисковикам попасть очень тяжело. Может chrome — не просто браузер? Или это просто «плагин» для поисковой системы гугла? Время покажет :)

RedOctober Oct 6 2008 at 18:32

ну вы и закрутили :)

PDmitriy Oct 6 2008 at 19:30

а что имеется в виду под «закрытой» информацией? персональная? тогда однозначно нет. и мое отношение и перспектива. америка — страна частной собственности. гугл там порвут за такую индексацию.

endless Oct 6 2008 at 19:46

куда без регистрации не пускают, например. но все равно неясно, зачем это, если даже обычные страницы владельцы сайтов просили удалить из индекса. да и шумиха будет

farafontov Oct 7 2008 at 01:10

Эээээм теперь моя личная переписка вконтакте будет светится в поисковой выдаче??? Лучше останусь тогда на лисе.

UFO just landed and posted this here

hulinada Oct 6 2008 at 18:08

Паника, паника!

Gunnar Oct 6 2008 at 18:10

А зачем сторить теории? Код хрома ведь открыт.

nooze Oct 6 2008 at 18:11

Дело не в коде, дело в самой возможности. Сейчас это только теория, вопрос в том будет ли это на самом деле

payalnic Oct 6 2008 at 20:06

Сама возможность появилась вместе с расширениями google для браузеров, то есть гораздо раньше самого chrome. И вам правильно выше написали, код открыт, по-этому можно воочию контролировать появление темных сторон chrome.

khim Oct 6 2008 at 18:14

Открыт код Chromium'а. Google Chrome отличается от него по меньшей мере инсталлятором, но вполне может и ещё какие-нибудь фишки содержать. Впрочем сейчас там таких закладок точно нет (столько народу смотрели и ничего не увидели — да и сравнить два бинарника куда проще чем взломать какой-нибудь Skype, опять-таки WireShark'ом на него тоже смотрели), но что будет в будущем? Бог его знает…

boolean Oct 6 2008 at 18:15

Тоже думаю, код открыт — а все кричат, что гугл сканирует, гугл следит. Я думаю, что за месяц в этих исходниках нашли бы все «дополнения к поисковой системе».

kurokikaze Oct 6 2008 at 18:11

Под «темной стороной интернета» обычно подразумевается несколько другое, если мне не изменяет память. Это данные, доступные по запросам из форм — например, интерактивное расписание поездов, которое можно использовать указав город и дату. Обычный поисковик проиндексирует форму — но не базу данных.

nooze Oct 6 2008 at 18:13

В том числе. Вроде принято считать темной стороной любой контент, который не доступен сразу. А туда поподает уже половина интернета

khim Oct 6 2008 at 18:16

Кстати ведь можно индексировать неперсональный «тёмный web» с помощью Хрома вполне себе легальным способом: если сколько-то человек (ну там 3-5-10) ткнули по какой-то ссылке, а у нас её нет — можно туда сходить: вдруг чего интересного найдём? Если явок/паролей никто не требует — можно и в базу занести…

maratori Oct 6 2008 at 19:39

Если ссылка где-то есть, значит находящийся под ней материал, если он не требует регистрации, будет проиндексирован. Поисковики ведь так и работают — перемещаются по ссылкам.

Но если регистрация требуется — всё, поисковикам вход заказан. Вот ведь в чём дело.

na1anya Oct 6 2008 at 19:47

тогда каким образом можно объяснить, что у гугла есть 12 копий интернета?

maratori Oct 6 2008 at 23:13

только открытого интернета — куда пускают «ботаф»

Baf Oct 9 2008 at 17:42

сорри за возможно глупый вопрос — что значит 12 копий?

na1anya Oct 9 2008 at 19:46

в прямом смысле этого слова… а еще они потребляют электричества больше чем сталелитейные заводы и в честь этого решили построить свою маленькую ядерную подстанцию…

piupiu Oct 6 2008 at 21:50

Ну да, а речь о том, что хром, как вполне самодостаточное приложение, легко запомнит не только страницу на которую Вы попали залогинившись, но и узнает как на нее самому попасть)

maratori Oct 6 2008 at 23:18

Хрому может и не понадобиться самому заходить: просто вся информация о странице будет отправляться сразу при серфинге на сервер гугла.

Хотя теория и параноидальна, но зерно здравого смысла здесь есть.

khim Oct 7 2008 at 00:43

Ссылка может порождаться «на лету» JavaScript'ом — тогда её не так просто отловить.

Frobozz Oct 7 2008 at 04:45

Это как с капчей. Тоже можно понаписать сложнейшую скриптовую функцию для проверки — но робот тупо выполнит ее с помощью своей Java-машины, и получит результат. Так что порождение ссылок «на лету», мне кажется, может ломаться легко.

Rusan Oct 6 2008 at 18:27

Думаете поисковики postить не умеют? Спокойно они так себе умеют.

coldFlame Oct 6 2008 at 18:31

Да, но что будет постить поисковик в текстовый инпут?

Rusan Oct 6 2008 at 19:11

всяческие расписание это обычно выбор из селекта и календаря — думаю догадается тыкнуть и даже javascript отработать (вроде как гугл заявлял что может аджаксовый контент индексить, а значит с джаваскриптом работать)

Vitality Oct 7 2008 at 01:36

гугль не инопланетный разум, там такие же люди работают…
может там спецотдел сидит регится на всяких сайтах и индексируют для своих целей эту „тёмную сторону инета” по-тихому

PiaFraus Mar 25 2009 at 19:54

Инвайты не везде легко достать.

kurokikaze Oct 6 2008 at 18:32

Я не думаю что они понимают что нужно постить. Форму из одного select'а Гугл может и переберёт, но если запрос сложнее…

Rusan Oct 6 2008 at 19:12

я отвечал конкретно на ваш вопрос «интерактивное расписание поездов» — обычно это набор предопределенных полей формы.

lauri Oct 6 2008 at 18:53

Если гугл использует информацию с тулбаров, то проблема отпадает.

freehome Oct 6 2008 at 18:46

Ненавижу желтые заголовки в виде вопроса.
Если автор сам не знает, чего пишет?

nooze Oct 6 2008 at 18:47

А что, все теории сначала подтверждаются а потом публикуются? Автор высказал вполне интересную мысль

alves Oct 6 2008 at 18:47

Можна будет читать с кеша Лепру? ;) (извините если неправильно выразилась, неосведомлена)

nooze Oct 6 2008 at 18:49

Хмм… ну что-то вроде того

alves Oct 6 2008 at 18:57

Спасибо. Но что то кажется что это незаконно (Privacy Policy) а если изменят TOS то будут ли потом им пользоватся?

nooze Oct 6 2008 at 18:58

Это уже вопрос того, как они смогут это преподнести. В находчивости Google я, впрочем, не сомневаюсь.

alves Oct 6 2008 at 19:00

Зашифроватся уже не получится =/

bO_oblik Oct 6 2008 at 19:00

Хороший ход со стороны гугла.

endless Oct 6 2008 at 20:22

причем тут ходы гугла? это просто теория

stab Oct 6 2008 at 19:03

— Аааа! А что если Chrome пересылает все данные с моих жёстких дисков в Гуголь?!
— Этого нет в его коде, да и лицензионным соглашением запрешено.
— Они могли это хитро спрятать!
— Но исследования сетевого трафика не показывают никакой левой активности.
— Ну и что! Возможность-то всё равно есть. Ааа! Они могут добавить эту фичу в следующем релизе!!! Точно, об этом и будет моя следующая статья…

+13

nooze Oct 6 2008 at 19:07

А вы не знали? Google — корпорация зла!

Watcher Oct 6 2008 at 19:31

Ну вот откуда только гуглофобы берутся? Где их откапывают?

UFO just landed and posted this here

HEm Oct 7 2008 at 13:30

Пока наш мир не идеален подозрения были, есть и будут. И, имхо, должны быть, надо критически относиться к тому, что тебе подносят.
Это не значит, что я должен подозревать все и вся, но я считаю, все что есть — к лучшему. Борцы за правду могут перегибать палку, но они улучшают и вашу жизнь тоже.

l2k Oct 6 2008 at 19:10

… (задумчиво, про себя) — Я как всегда, гениален…

-3

na1anya Oct 6 2008 at 19:22

я бы сказал что это довольно таки не честно… если ресурс закрыт, даже не ресурс, а какая-либо страница(ресурс это понятно, его и создают для получения прибыли, НО не все), с какого такого перепуга Google имеет право её индексировать?!
Либо «они» должны индексировать с «умом», либо на Google будут поданы миллионы исков о «нарушении авторских прав» или «нарушении права на частную жизнь».

Цитирую:

КОНСТИТУЦИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
Статья 23
1. Каждый имеет право на неприкосновенность частной жизни, личную и семейную тайну, защиту своей чести и доброго имени.
2. Каждый имеет право на тайну переписки, телефонных переговоров, почтовых, телеграфных и иных сообщений. Ограничение этого права допускается только на основании судебного решения.
Статья 24
1. Сбор, хранение, использование и распространение информации о частной жизни лица без его согласия не допускаются.

А так же:

Закон РФ от 9 июля 1993 г. N 5351-I «Об авторском праве и смежных правах»
(с изменениями от 19 июля 1995 г., 20 июля 2004 г.)
www.fips.ru/avp/law/5351-1SN.HTM

Kastrulya Oct 6 2008 at 19:34

так как лицензионное соглашение люди читают с огромным интересом, в Google решили немного намудрить…

maxpelevin Oct 6 2008 at 19:38

Если это так, то прощай вся закрытая информация Контакта, Фейсбука и прочей нечисти…

Kane Oct 6 2008 at 19:50

Контакта, Фейсбука и прочей нечисти просто не пустят к себе гугл — делов то.

-2

darkside Oct 6 2008 at 21:15

и как же это вы себе представляете? как он бота от человека отличит? будет капчу спрашивать на каждой странице? а что если как бота будут использовать ваш собственный процесс вебсёрфинга?

Kane Oct 6 2008 at 21:34

Полагаю, по User-Agent: www.google.com/bot.html

piupiu Oct 6 2008 at 21:56

да нет, human.name/hands.html

UFO just landed and posted this here

eugenios Oct 6 2008 at 21:28

вот-вот. Всё-равно к ней доступ не получить.

darkside Oct 6 2008 at 21:16

мне так кажется, что эта индексация просто неимеет смысла.

n1mnul Oct 6 2008 at 21:24

В следующий раз серьёзней подходите к вопросу о переводе статьи :) Имею ввиду что переводить — нужно выберать. Не каждая статья на дигге на вес золота :)

По теме: паранойя шизофреников.

Zibx Oct 7 2008 at 00:09

Если ограничить это проверкой на то, заходит ли у пользователя на этот ресурс с его набором куков, то можно и индексировать. Поиск Бухтоярова от этого выиграет :)

azverev Oct 7 2008 at 01:11

Очень интересная статья, спасибо.

Я тут подумал.., возможно, Гугл собирается предоставить каждому пользователю их браузера специальный личный индекс, который будет строиться на основании посещений закрытых сайтов. С куками, понятно, проблем нет, но зато после этого пользователь смог бы искать не только на вебе, в личных сообщениях на хабре, например, или в сразу во всех веб-мылах. Это было бы интересно пользователям — стало быть, популярность Хрома возрастет. И, главное, вне досягаемости от конкурентов — ни один производитель браузеров не имеет такого сильного движка поиска. Ресурсов — они не особо стесняются — пример GMail — так что выдать каждому свое пространство для поискового индекса — не особо проблематично. Плюс часть функций по индексации можно перекинуть на «толстого» клиента в лице Хрома. Тут, конечно, нужно быть внимательным, так как серьезные алгоритмы реализовывать в открытом коде, по меньшей мере, глупо.
Ну, понятно, у пользователя можно «спрашивать», хочет ли он индексировать тот или иной ресурс, продумать удобный интерфейс, но в целом – это, на мой взгляд, может быть очень интересной технологией.
Единственное, куки экспирятся, но если пользователь сам заинтересован в индексировании – это можно решить.

vlaskin Oct 8 2008 at 15:48

А смысл?

Проиндексировали «закрытую» часть… И?
Другие пользователи через поисковик туда попадут? Нет, конечно… (конечно, если говорить именно о закрытой части, а не той, на которую нет внешних ссылок)

Сохранять у себя? За это гугл порвут на кусочки, да и опять-таки смысл?

Возожность есть, да, но надобности я не вижу. Приведите пример того что можно найти в закрытой части и почему это нужно отдавать всем, с учетом того что оно все-таки ото всех закрыто…

Show the best of all time