Comments 35
Потомки оценят этот подвиг :)
Я не вижу смысла в этом вообще, зачем читать как чья-то собака погадила в 2006 или #хуй попал в топ?
>>… ученые анализировали ДНК, содержащееся в окаменевших экскрементах, что дало повод их оппонентам говорить о том, что экскременты могли содержать постороннюю ДНК…
Если нас сейчас интересует говно предков, то возможно и наших потомков заинтересует #хуй в топе.
Если нас сейчас интересует говно предков, то возможно и наших потомков заинтересует #хуй в топе.
Ну может быть дело в том, что твитер это не только хуй и собака погадила, не? И может быть вместо того чтобы надменно вещать о том, что не видишь смысла попытаться этот самый смысл найти, не? Удивительное лицемерие вообще.
Прискорбно сие. Лучше молча присунуть в карму (анонимность это дар небес) чем аргументированно поспорить и попытаться понять. Милая публика, хехе.
Ну смотрите, человек написал, что «не видит смысла в этом вообще». К его комментарию два ответа — от noma4j и ваш. Оба выражают несогласие, однако комментарий noma4j на данный момент имеет рейтинг в +13, а ваш -7.
Мне кажется, что это должно наводить на мысль, что причина минусов вовсе не в согласии большинства с позицией hollow, а в чем-то другом.
Давайте посмотрим, чем же отличаются ваши комментарии:
* noma4j привел вполне конкретный аргумент, предположив, что сообщения в твиттере могут заинтересовать наших предков в каких-то научных целях (как я его понял).
* Вы предложили найти скрытый смысл даже не намекнув о том где его искать, попутно обвинив hollow в надменности и лицемерии. При этом ни одного аргумента вы собственно и не привели, хотя теперь сетуете что люди не хотят с вами аргументированно спорить.
Может быть тут-то собака и зарыта?
P.S. Поскольку вас печалит анонимность минсующих — я тоже поставил вам минус в карму за совокупность ваших двух комментариев.
Мне кажется, что это должно наводить на мысль, что причина минусов вовсе не в согласии большинства с позицией hollow, а в чем-то другом.
Давайте посмотрим, чем же отличаются ваши комментарии:
* noma4j привел вполне конкретный аргумент, предположив, что сообщения в твиттере могут заинтересовать наших предков в каких-то научных целях (как я его понял).
* Вы предложили найти скрытый смысл даже не намекнув о том где его искать, попутно обвинив hollow в надменности и лицемерии. При этом ни одного аргумента вы собственно и не привели, хотя теперь сетуете что люди не хотят с вами аргументированно спорить.
Может быть тут-то собака и зарыта?
P.S. Поскольку вас печалит анонимность минсующих — я тоже поставил вам минус в карму за совокупность ваших двух комментариев.
Меня не печалит анонимность, меня печалят минуса без диалога.
Твиттер это уникальная новостная площадка с неимоверным охватом аудитории и минимальным временем реакции. Когда где-то что-то происходит первым делом лезу в твитер искать отзывы из первых рук — фотографии, заметки, эмоции.
Твиттер это удобнейшая замена rss. У многих онлайн и офлайн газет есть твитер, очень удобно.
Твиттер это офигенный чатик в конце концов. Очень удобно обсуждать с друзьями всякое барахло, делиться ссылками, разное.
Это только самые очевидные плюсы, думаю для примера достаточно. Меня чудовищно выбешивают люди, разговаривающие шаблонами — айфон не нужен, в твитер пишут о том как сходил в туалет, прочее. Все эти вещи всего лишь инструменты. То, как они будут применяться зависит только от человека, их использующего. Ну а чтобы надменно бросить в толпу «Фи, твитер, какая ерунда» ума много не надо, да.
Твиттер это уникальная новостная площадка с неимоверным охватом аудитории и минимальным временем реакции. Когда где-то что-то происходит первым делом лезу в твитер искать отзывы из первых рук — фотографии, заметки, эмоции.
Твиттер это удобнейшая замена rss. У многих онлайн и офлайн газет есть твитер, очень удобно.
Твиттер это офигенный чатик в конце концов. Очень удобно обсуждать с друзьями всякое барахло, делиться ссылками, разное.
Это только самые очевидные плюсы, думаю для примера достаточно. Меня чудовищно выбешивают люди, разговаривающие шаблонами — айфон не нужен, в твитер пишут о том как сходил в туалет, прочее. Все эти вещи всего лишь инструменты. То, как они будут применяться зависит только от человека, их использующего. Ну а чтобы надменно бросить в толпу «Фи, твитер, какая ерунда» ума много не надо, да.
И собственно если чуть-чуть, совсем немного подумать, то можно увидеть огромнейший потенциал этого самого архива. Социальные исследования реакции на события, например. Многие твиты содержат географические координаты, это же ценнейшая информация для социологов. А что мы имеем тут, в комментариях? «Лучше бы делом занялись», «Собака погадила». Для любого человека должно быть оскорбительно, унизительно говорить шаблонные вещи не думая. Это отвратительно. Вот такие вот дела, ребята.
Как пример — на этом материале можно изучать лингвистические явления. Например — как изменяется употребление различных слов. Или ретроспективный анализ реакции в твиттере на события.
Это же отдельный жанр текстов — твиты.
Это же отдельный жанр текстов — твиты.
Лучше бы дельным чем-нибудь занялись
Интересно, они и материал по ссылкам архивируют? В противном случае большинство твитов будут совершенно бесполезны для потомков.
Как по мне лучше бы архивировали к себе ресурсы по типу хабра и обязательно со всеми комментариями к статьям.
Это было бы реально полезно, а не превращать Библиотеку Конгресса в свалку, индексирующей тонны бесполезного контента.
Как по мне лучше бы архивировали к себе ресурсы по типу хабра и обязательно со всеми комментариями к статьям.
Это было бы реально полезно, а не превращать Библиотеку Конгресса в свалку, индексирующей тонны бесполезного контента.
400 млн * 140 символов (а большинство твитов все-таки меньше) = 56 Гб + остальное, вроде имени, времени публикации и т.д., ну пусть будет 100 Гб в день. Не так уж и много получается. Странно, что такое учреждение находит сложности в архивации этого контента.
не 56гб, а минимум 112, там же юникод
Вы считаете, что в Twitter латиницы нет вообще?
Это еще без сжатия, учитывая что можно дедуплицировать большинство твитов и сжать их. Там будет намного меньше
Латиницу можно детектить легко и переводить в latin1 кодировку. Да и вообще про архивацию забыли что ли? Она круто жмет текстовые данные!
Они не просто хотят заархивировать, а так же построить индекс и организовать полнотекстовый поиск. А это ой как не просто
Да там же 97% твитов такие-же как у Артемия Лебедева, еще 2% это чекины с foursquare и 1% чего-то полезного.
Это хорошо, значит можно неплохо упаковать все твиты, простым алгоритмом, просто поиском повторяющихся сообщений… а если по умнее, уровень компрессии может быть 'на порядок'.
p.s. зачем нужно все хранить? это же элементарно (статья публиковалась на хабре, нашел только видео)
p.s. зачем нужно все хранить? это же элементарно (статья публиковалась на хабре, нашел только видео)
Хотят архивировать — пусть архивируют. Это их проблемы.
Я бы не отказался почитать свои первые твиты. Однако при попытке их откопать, твиттер сдаётся и посылает меня уже на 2-3 сотне.
Свои, и не только свои, первые твиты можно прочитать с помощью вот этого отличного сервиса.
Это благое дело. Если уметь ставить исследовательские задачи, твиттер может быть весьма полезен, т.к. предсказание котировок акций и результатов выборов на основе его данных в последнее время набирают популярность.
Sign up to leave a comment.
Библиотека Конгресса продолжает попытки архивировать все твиты за 2006-2012 годы