Обновить

Комментарии 35

Потомки оценят этот подвиг :)
Я не вижу смысла в этом вообще, зачем читать как чья-то собака погадила в 2006 или #хуй попал в топ?
>>… ученые анализировали ДНК, содержащееся в окаменевших экскрементах, что дало повод их оппонентам говорить о том, что экскременты могли содержать постороннюю ДНК…

Если нас сейчас интересует говно предков, то возможно и наших потомков заинтересует #хуй в топе.
Ну может быть дело в том, что твитер это не только хуй и собака погадила, не? И может быть вместо того чтобы надменно вещать о том, что не видишь смысла попытаться этот самый смысл найти, не? Удивительное лицемерие вообще.
НЛО прилетело и опубликовало эту надпись здесь
Прискорбно сие. Лучше молча присунуть в карму (анонимность это дар небес) чем аргументированно поспорить и попытаться понять. Милая публика, хехе.
Ну смотрите, человек написал, что «не видит смысла в этом вообще». К его комментарию два ответа — от noma4j и ваш. Оба выражают несогласие, однако комментарий noma4j на данный момент имеет рейтинг в +13, а ваш -7.

Мне кажется, что это должно наводить на мысль, что причина минусов вовсе не в согласии большинства с позицией hollow, а в чем-то другом.

Давайте посмотрим, чем же отличаются ваши комментарии:

* noma4j привел вполне конкретный аргумент, предположив, что сообщения в твиттере могут заинтересовать наших предков в каких-то научных целях (как я его понял).

* Вы предложили найти скрытый смысл даже не намекнув о том где его искать, попутно обвинив hollow в надменности и лицемерии. При этом ни одного аргумента вы собственно и не привели, хотя теперь сетуете что люди не хотят с вами аргументированно спорить.

Может быть тут-то собака и зарыта?

P.S. Поскольку вас печалит анонимность минсующих — я тоже поставил вам минус в карму за совокупность ваших двух комментариев.
Меня не печалит анонимность, меня печалят минуса без диалога.

Твиттер это уникальная новостная площадка с неимоверным охватом аудитории и минимальным временем реакции. Когда где-то что-то происходит первым делом лезу в твитер искать отзывы из первых рук — фотографии, заметки, эмоции.

Твиттер это удобнейшая замена rss. У многих онлайн и офлайн газет есть твитер, очень удобно.

Твиттер это офигенный чатик в конце концов. Очень удобно обсуждать с друзьями всякое барахло, делиться ссылками, разное.

Это только самые очевидные плюсы, думаю для примера достаточно. Меня чудовищно выбешивают люди, разговаривающие шаблонами — айфон не нужен, в твитер пишут о том как сходил в туалет, прочее. Все эти вещи всего лишь инструменты. То, как они будут применяться зависит только от человека, их использующего. Ну а чтобы надменно бросить в толпу «Фи, твитер, какая ерунда» ума много не надо, да.
И собственно если чуть-чуть, совсем немного подумать, то можно увидеть огромнейший потенциал этого самого архива. Социальные исследования реакции на события, например. Многие твиты содержат географические координаты, это же ценнейшая информация для социологов. А что мы имеем тут, в комментариях? «Лучше бы делом занялись», «Собака погадила». Для любого человека должно быть оскорбительно, унизительно говорить шаблонные вещи не думая. Это отвратительно. Вот такие вот дела, ребята.
Как пример — на этом материале можно изучать лингвистические явления. Например — как изменяется употребление различных слов. Или ретроспективный анализ реакции в твиттере на события.

Это же отдельный жанр текстов — твиты.
Лучше бы дельным чем-нибудь занялись
Ну, так! Шли бы на завод работать, а то всякие архивы собирают.
Искали бы НЛО, например…
НЛО прилетело и опубликовало эту надпись здесь
Его разве не архивируют?
Да какая разница, мы же знаем, что землю мыши забэкапили. ;)
Интересно, они и материал по ссылкам архивируют? В противном случае большинство твитов будут совершенно бесполезны для потомков.
Как по мне лучше бы архивировали к себе ресурсы по типу хабра и обязательно со всеми комментариями к статьям.
Это было бы реально полезно, а не превращать Библиотеку Конгресса в свалку, индексирующей тонны бесполезного контента.
Ну вам, конечно, виднее, полезный это контент или нет. Не то что чувакам из библиотеки Конгресса.
400 млн * 140 символов (а большинство твитов все-таки меньше) = 56 Гб + остальное, вроде имени, времени публикации и т.д., ну пусть будет 100 Гб в день. Не так уж и много получается. Странно, что такое учреждение находит сложности в архивации этого контента.
не 56гб, а минимум 112, там же юникод
Вы считаете, что в Twitter латиницы нет вообще?
Это еще без сжатия, учитывая что можно дедуплицировать большинство твитов и сжать их. Там будет намного меньше
Латиницу можно детектить легко и переводить в latin1 кодировку. Да и вообще про архивацию забыли что ли? Она круто жмет текстовые данные!
>Латиницу можно детектить легко и переводить в latin1 кодировку.
Зачем это делать если есть UTF-8?
Они не просто хотят заархивировать, а так же построить индекс и организовать полнотекстовый поиск. А это ой как не просто
НЛО прилетело и опубликовало эту надпись здесь
Да там же 97% твитов такие-же как у Артемия Лебедева, еще 2% это чекины с foursquare и 1% чего-то полезного.
Это хорошо, значит можно неплохо упаковать все твиты, простым алгоритмом, просто поиском повторяющихся сообщений… а если по умнее, уровень компрессии может быть 'на порядок'.

p.s. зачем нужно все хранить? это же элементарно (статья публиковалась на хабре, нашел только видео)
Хотят архивировать — пусть архивируют. Это их проблемы.
Я бы не отказался почитать свои первые твиты. Однако при попытке их откопать, твиттер сдаётся и посылает меня уже на 2-3 сотне.
Ответил вам чуть ниже по поводу первых твитов.
Свои, и не только свои, первые твиты можно прочитать с помощью вот этого отличного сервиса.
Дальше 3200 последних твитов он все равно не показывает (ограничение Twitter API).
НЛО прилетело и опубликовало эту надпись здесь
Это благое дело. Если уметь ставить исследовательские задачи, твиттер может быть весьма полезен, т.к. предсказание котировок акций и результатов выборов на основе его данных в последнее время набирают популярность.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации