Как стать автором
Обновить

Комментарии 6

Интересно было бы узнать, а что подвигло основателя заниматься этим? На самом деле, это великое дело, т.к. сайты в интернете умирают намного быстрее, чем это можно было бы предположить... если бы не Архив, многое уже было бы безвозвратно потеряно.

Internet Archive или Архив интернета занимается поиском и хранением накопленной информации: будь то книги, видео или программное обеспечение.

Грандиозная задача, но каково исполнение? Наверное, если бы интернет был бы большой-пребольшой базой данных по типу Википедии, в которой у каждого объекта реального мира был бы свой узел, то всё сохранялось бы автоматически.

Честно говоря, не знаю, даже, почему, не приходилось заглядывать. Наверное, зря.

Меня совершенно не устраивает сохранение страниц самого интернета. Очень выборочно. Это всё очень сложно. Тут и нужен современный ИИ.

В 2024 году сервис подвергся хакерской атаке, что привело к утечке данных 31 млн пользователей.

А что у Архива были какие-то пользователи? Зачем они Архиву? Сохранять историю поиска/просмотра?

Также на организацию неоднократно подавали в суд из-за нарушений в сфере интеллектуальной собственности.

Лучше бы урегулировали бы взаимоотношения авторов/правообладателей/пользователей. Где, например, искать школьные и вузовские учебники? Раньше был "Колхоз", а теперь даже за денюшку не найти! (Хотя, бывает, издательство URSS "порадует" каким-нибудь дорогущщим букинистическим изданием.) Зато гордая плашка РосКомНадзора висит. Если, что.

Или, например, хочу я посмотреть старую телевизионную передачу. Где мне её искать? Даже на остановленном у нас в России Ютьюбе кое-что можно было найти, да и то, со временем, пропало и оттуда. А, ведь, могли бы быть полноценные видеотеки, в которые автоматически закачивался бы эфир телеканалов, да и радиостанций тоже.

Архив призван бороться с монополией на предоставление данных как со стороны корпораций, так и государств.

Безнадёжное дело. Государство всегда будет на страже, всячески оберегая границы от внешнего влияния. Корпорации — это государства "в малом". Никто никогда не будет вести открытую деятельность. Между тем, открытую деятельность легко автоматизировать: сделал действие — положил в базу данных несколько записей в нескольких таблицах.

Когда он заходит на какой-то сайт, то делает его «снимок» и «кладет» в хранилище.  

Это так не работает. Когда был текстовый интернет, такой подход ещё мог бы сработать. Но, как только появляется динамическое содержание, такой подход полностью перестаёт работать. Здесь нужно предварительно разбивать данные на отдельные сущности и отслеживать изменения по каждой сущности. Другое дело, что интернет можно было бы изначально спроектировать со встроенным архиватором. Но кто ж из столпов Интернета это смог бы реализовать?

Суд постановил, что цифровая библиотека Архива интернета «позволяет осуществлять широкомасштабное копирование, которое лишает создателей компенсации и снижает стимул к созданию новых произведений».

Единственный способ стимулировать создание новых произведений, это прописать правило, согласно которому автор получает за книгу заработную плату. Соответственно, чтобы получить новые день надо писать новую книгу. Современное юридическое правообладание, вообще, препятствует какому-либо обмену информацией/идеями. А любое развитие требует свободного обмена. Постоянные заимствования. Творческое преобразование.

Тоже пользуюсь иногда, особенно когда что-то старое нужно почитать и натыкаюсь на ошибку "нет файла", "нет страницы" (статьи, программы, инструкции). Зачастую "старыми" оказываются страницы из 2019 года (я уж не говорю про 2009 или 1999). А иногда просто посмотреть что писал хабр 1 апреля лет пять назад.

Кто бы что ни говорил, а Internet Archive одна из лучших вещей, которая есть в интернете. Они — молодцы.

Кому интересна тема борьбы этих ребят за свободу доступа к информации, смотрите документалку:

Дитя интернета история Аарона Шварца - The Internets Own Boy The Story of Aaron Swartz (2014) (есть с русским переводом)

История молодого парня, компьютерного гения (создателя RSS, сайта reddit.com , соавтора лицензии СС и др.), которого за участие в движении за свободу доступа к информации затравили и довели до самоубийства власти США. Участники документалки Брюстер Кейл (Веб Архив), Тим Бернерс-Ли (создатель html, url, web), Джимми Уэйлс (создатель википедии). Аарон работал вместе с ними.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий