Comments 57
Под угрозой исчезновения находятся ещё около 900 онлайн-журналов
плевать, главное чтоб их не было на сайхабе [сарказм]
Возможно с выходом libtorrent 2.0 с поддержкой протокола BitTorrent 2 ситуация изменится (там хотя-бы пофайловое выравнивание и хеширование сделали).
Вообще построение реально работающей децентрализованной базы знаний всего человечества — очень сложная задача:) Я много думал об этом. Реально непонятно за что браться и как грамотно разбить эту сверхзадачу на достаточно независимые друг от друга и посильные для среднего программиста компоненты.
Не думаю что в libtorrent вырубят поддержку старого протокола. libtorrent это chrome в мире торрентов а значит новый протокол автоматически появится в куче битторрент клиентов.
Но libtorrent уже в роли догоняющего в технологиях. Только только решили хешировать каждый файл отдельно а IPFS уже шарит каждый блок файла отдельно и научилась находить одинаковые блоки в разных файлах благодаря rabin и buzhash.
А я посмотрел и у меня uTorrent'ов 5 штук из 100 пиров.
Возможно. Они сделали свой протокол(uTorrent transport protocol) который работает по UDP и конектятся по нему к своим же клиентам.
Я кстати не вижу в этом протоколе место где можно было указать ID своего клиента так что uTorrent возможно может показывать клиентов соединённых по этому протоколу как uTorrent клиенты.
Биллинг не обязательно должен быть в деньгах. Трекеры не плохо приучили пользователей к уважению других и оценке данных.
Условно говоря, каждый браузер разрешает делать закладки. Каждый разрешает сохранять страницы. Но нигде нет такого, чтобы браузер при добавлении в закладки позволял сразу сделать локальную копию страницы где-нибудь в заранее настроенной папке (или даже локальную копию сайта, если нужен весь сайт).
Причём даже дополнения, которые были раньше (типа ScrapBook) делали это всё крайне убого, например сохранённый скрапбук можно было открыть только из того же самого браузера, он сохранялся в своём формате, а вовсе не в виде обычной страницы.
А что предлагаете вы? Скопировать ссылку из адресной строки, перетащить в соседнее приложение (если оно не запущено, то запустить), открывать сторонним способом, поиск вообще через какой-нибудь TC, да и то, вдруг там сохранилось в другой кодировке…
Во-вторых. Чисто ради интереса, попробуйте сохранить с помощью этого вашего wget сайт Крылова (krylov.cc). У меня не получилось, но я не программист, может у вас получится. А в браузере всё отлично открывается.
Я предлагаю рабочее решение по тому как можно сохранить целиком сайт здесь и сейчас. А не мечтать о чудо-кнопке, где по 1 клику сохранит целый сайт как надо.
Wget это консольная утилита. Открыть её это 1 клик по консоли и wg+tab. И сохраняет wget в .html. Поиск для сохраненного сайта всегда будет сторонний. Встроенный поиск сохранить невозможно. Чтобы сохранить встроенный поиск сайта это нужно получить движок сайта + бд.
Wget не для простого пользователя, но он обеспечивает огромную гибкость при сохранении, быструю скорость работы и не требовательность к ресурсам. К нему написан отличный ман и его легко освоить.
Для простого пользователя есть всякие teleport pro и другие сохранялки. Где кнопочки и вот это всё.
Teleport offline browser Вам в помощь, только не знаю, актуален ли он...
IPFS автоматически сохраняет локально то что загружается через его шлюз. Для этого сайт должен быть загружен в IPFS.
Но может потерятся связь домен — хеш при отключении сайта. Получится что информация есть но для доступа к ней нужно "вспомнить" один из хешей с которым был связан домен.
Можно перебрать все корневые блоки в локальном хранилище и найти те что вероятно были связаны с этим доменом. Но не знаю написал ли кто уже инструмент поиска по локальным блокам.
Далеко не всегда, как тут сразу начали комментировать, пропадают "бесполезные" статьи. Есть, например, советский/российский журнал ЖЭТФ (Журнал Экспериментальной и Теоретической Физики). Он выходит с 1931 года и формально доступен онлайн, с одним "но". Статьи с 1955 по 1994 года доступны только на английском языке. Чем примечателен 1955-й год? Это год, с которого статьи начали рутинно переводить на английский язык. Хохма заключается в том, что русскоязычные статьи до 1994 года онлайн недоступны, похоже их никто не сканировал вообще.
Т.е., грубо говоря, если бы некие люди в Западной Европе (Springer) не отсканили англоязычные статьи, то большая часть журнала, фактически, пропала бы из эфира. Статей на русском до 1994 года считай, что нет. Статьи с 1931 по 1954 год доступных онлайн нет ни на каком языке. Конечно, где-то, в ещё несгоревших/незатопленных/не покрывшихся мхом архивах библиотек можно раздобыть бумажные копии, но физика — не история, в бумажных архивах никто копаться не будет без особой на то необходимости.
И журнал этот бесполезным назвать очень трудно. Собственно, о проблеме недоступных/пропавших статей я знаю не понаслышке, потому что регулярно приходится искать старые статьи, включая таковые из ЖЭТФ.
Это, конечно, не имеет непосредственного отношения к посту, где речь, скорее всего, идёт об online-only современных журналах, которые появляются и исчезают как облака летним утром. Однако, проблема долговременного хранения научных статей неиллюзорна, и не очень понятно, какой процент статей доживёт до конца века.
Спасибо за информацию. Надо будет узнать побольше.
Да, с книгами похожая проблема. Старые издания, которые не переиздавались. Бывает, что их ни купить, ни в отсканированном виде не найти. Существуют только в виде библиографических ссылок там сям.
Сайт выглядит очень стремно, но человек действительно работает в РГБ и выслал оцифрованную копию в лучшем виде и всего за 2 дня.
пропадают «бесполезные» статьи.
в бумажных архивах никто копаться не будет без особой на то необходимости
бесполезным назвать очень трудноКак бы всё равно сами то и повторили — если никому не нужно, то никто не сохраняет, «в бумажных архивах не копается».
Это не означает, что оно ненужное. Чтобы оценить "нужность", статью надо хотя бы увидеть. Но покопаться в бумажных архивах — это уйма потраченого времени. А в итоге, может оказаться, что эта конкретная статья оказалась не достаточной "нужности". Если архив отсканирован, и есть доступ, то вполне может выясниться, что там полно всего нужного для разных людей.
Тут, опять-таки, разница между физикой и историей. В первом случае, если не удалось раздобыть статью с решением какой-то задачи, придётся решать эту задачу самому (если это возможно). Получается выбор между тем, на что потратить время: а). на поиск статьи, где задача может быть решена, а может и нет; б). на решение задачи своими силами. В случае исторической науки выбора нет: если исторический документ невозможно найти, то другой вместо него не сделаешь.
Другой собеседник выше отметил, что физики — это не историки, и для них невыгодно искать статьи в библиотеках. (По правде сказать, для историков это тоже очень невыгодно, и историки стараются этог избегать.)
Зато всякая хрень в инете плодится в геометрической прогрессии.
«Нету никаких облаков, есть чужие компьютеры» (с) Neuromantix
Мусора, конечно, много, но есть подозрение, что родись сейчас Галуа, его бы тоже записали в «мусор», до поры до времени… вот только да, когда время прийдет, архив уже потеряют.
Десятки научных журналов исчезли из интернета за последние 20 лет и никто их не сохранил