Pull to refresh
78
0
Сергей @nekoval

Пользователь

Send message
Сжатие, безусловно, есть. И даже в DB2 пятилетней давности оно было. Но максимально эффективно сжать можно только разделив данные на колонки. Грубо говоря, чем больше разнородных данных мы пытаемся сжать, тем хуже они будут сжиматься.

А как индексы позволяют секционировать ДАННЫЕ?
Если запихивать все нужные данные в индекс, то фактически это денормализация, то есть классическая схема-звездочка OLAP.

Тут есть два момента.

  1. Запись становится дороже, а если индексов много — ох как дороже!
  2. Нет компрессии. Вместо уменьшения объема данных мы получили серьезный прирост (ибо данные теперь многократно дублируются). Думаю, не надо объяснять, чем это плохо.


Это уже не говоря о том, что индексы (а именно B-деревья и хэш-таблицы) заточены на поиск и фильтрацию данных, а не на эффективное их хранение.
Не совсем понял, причем тут индексы. Вы собираетесь в индекс запихнуть все данные? Индекс обычно содержит указатели на физические страницы данных и позволяет данные фильтровать, однако ну НИКАК не позволит прочесть эти данные с диска быстрее. Даже если пытаться сжимать индексы (что некоторым образом реализовано в BITMAP-индексах Oracle), это не даст никакого эффекта, т.к. сами данные не сжаты.

>проблемы класса «чтобы прочитать строчку целиком надо полезть в много разных мест» не решаются никак

Не всегда и не везде физическое разделение данных плохо. Иногда данные специально размещают в разных местах для лучшей масштабируемости. Запись однозначно дороже, но чтение может обойтись дешевле.
Индексы в таких базах устроены сложнее. Приходится хранить указатель на каждый колоночный блок строки. В классическом индексе это просто указатель на строку.

Что касается Cassandra, то там, я думаю, такой запрос сделать просто невозможно, если все колонки не лежат в одной column family (тут могу соврать).

В любом случае, индексы не являются «заменой» вертикального хранилища. Это ортогональные понятия. Индексы не позволяют сжимать и секционировать данные.
То есть старую схему «просмотреть все данные в которых может быть возможность угрозы» и заэкспейпить или переделать на PreparedStatement заменяем на совершенно новую «просмотреть все данные в которых может быть возможность угрозы и закодировать все входные параметры как base64»? Это, безусловно, прорыв.
потому что так написано:
> в подстановке в SQL-запросах всех данных в base64-представлении

Т.е. гениальность этого метода состоит в том, чтобы поменять все SQL запросы?
Феерический ужас. А что, везде декодировать base64 это действительно проще, чем починить код, подверженный SQL injection?
Думаю, там все очень прозаично — пустыня, у них в руках оказалась дешевая земля + договоренность с провайдером, который прокинул им канал.

У электропровайдера, похоже, интереса проводить кабель такой мощности в пустыню не наблюдалось :)
Мда. Экономия $3000 в месяц — для дата-центра это, конечно, просто фантастический выигрыш. Наверное, аккурат столько у них уйдет на регулярное сервисное обслуживание солнечных батарей.
Отличный сайт, уже года три смотрю эту карту и все никак не насмотрюсь. Вообще идея со вставкой аудиозаписей ветеранов довольно удачная.
Попытался представить себе паспортную систему или госуслуги на Joomla. Александр, Вашу бы энергию да в мирное русло!

Вы себе примерно представляете, во что выльется внедрение любой, хотя бы мало-мальски завалящей информационной системы в госучреждениях России? Кто будет бесплатно делать аналитическую работу? кто будет за бесплатно обучать пользователей? кто будет внедрять? полстраны вообще сидит на dial-up.

Какой-нибудь госсайт, который на хабре с негодованием осуждают за «распил бабла» — это крохотная вершина айсберга, и стоимость его разработки вообще малосущественна по сравнению со всей остальной работой.
на 4-х разработчиков два манагера, босс и секретарша? Как-то многовато — я бы как минимум двоих уволил :)
Я вообще не понимаю, какой чиновник будет смотреть этот ролик после фразы «Охерел». Понятно, конечно, что цель была не привлечь чиновников, а отбить 100 тыс. показов, и в этом плане все ок (хотя Елена Беркова, думаю, поболе хитов соберет). С другой стороны, монтажная работа и общее качество — все гут.
Тогда ваша версия деградации Пети не прокатит. Работа-то у них, получается, одинаковая.
То есть Вася поддержкой своих проектов вообще не занимался? Я так понимаю, он их бросает после получения денег от заказчика :)
Желание-то есть у всех, а вот возможности воспроизвести проблему — отсутствуют. У гугль даже нет версии ОС в багтрекере, о чем тут говорить? Похоже, что ребята сильно понадеялись на webkit.
Странно было бы меряться размером Knowledge Base — посчитайте для начала, сколько продуктов выпускает Microsoft и сколько Google.
Ну да, стандартный вариант «У меня все работает».
Именно в таком стиле разработчики Chrome и отвечают.

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Date of birth
Registered
Activity