Хабр Курсы для всех
РЕКЛАМА
Практикум, Хекслет, SkyPro, авторские курсы — собрали всех и попросили скидки. Осталось выбрать!
Email, маркетинговые, девелоперские данные - это, если развивать мысль статьи есть классы ДАННЫХEmail можно выделить в отдельную группу в силу своей специфики…
Те же email могут устаревать через несколько минут или часов, а могут иметь ценность несколько лет или даже десятков лет…а часто используемые письма, как правило, сохраняются в соответствующем месте в удобочитабельном формате и становятся документацией (перестают быть письмами, from/to пропадает).
Согласен полностью. А про скорость обработки можно сказать, что это не главное при работе с архивом. Главное - удобный инструмент задачи поиска.
Проблема объема информации это не "немного надуманная проблема" - это просто не проблема на сегодняшний день... да и в обозримом будущем то-же.
Из приведенного графика и легенды к нему совершенно непонятно почему вдруг классификация информации была проведена именно так. Я не говорю про методику исследования, которая осталась за кадром - лично я не понимаю как вдруг так получились такие странные графики - мне интересно почему вдруг email стал каким-то особым классом информации?
При таком подходе есть еще проблема взаимозависимости данных, их взаимосвязанности. Нельзя так просто убить пачку писем - нужно понять что за данные они за собой потянут дальше.
Поэтому проблема сложнее и шире - как найти способы рассортировать информацию по актуальности в определенный момент времени да плюс к этому обеспечить более менее приемлемые сроки перевода информации из запасников в оперативное поле принятия решений.
Кстати, посыл насчет необходимости ограничивать объемы хранения информации мне кажется немного надуманным. Средства хранения постоянно развиваются, и мне кажется еще долго возможности хранилищ будут опережать объем информации.
Поэтому, нужно думать о том, как уменьшить затраты на обработку информации, которая не нужна.
От данных — к информации