Как стать автором
Обновить
21
0

Пользователь

Отправить сообщение

Жил в Норвегии несколько лет, медицина там, действительно, очень специфичная. Заболел бок, неделю не проходит, решил сделать УЗИ. В итоге сначала 3 недели ждал приема "семейного" врача, уговорил его дать мне направление на обследование, потом ждал еще столько же, чтобы попасть на УЗИ. В промежутке попытался обратиться в emergency с болью, там сказали, что скорее всего это не критичный случай и предложили пить обезболивающее. Такое себе в общем.

Спасибо большое за статью! Для тех, кто хочет погрузиться в «математику» распределенных систем, можно еще порекомендовать классическую книгу Gerard Tel «Introduction to Distributed Algorithms».
«B» в названии B-tree означает Block

What, if anything, the B stands for has never been established.

You just have no idea what a lunchtime conversation can turn into. So there we were, [indistinct] and I, at lunch, we had to give the thing a name. And we were, so, B, we were thinking… B is, you know… We were working for Boeing at the time, we couldn't use the name without talking to the lawyers. So, there is a B. It has to do with balance, another B. Bayer was the senior author, who did have several years older than I am and had many more publications than I did. So there is another B. And so, at the lunch table we never did resolve whether there was one of those that made more sense than the rest. What really lies to say is: the more you think about what the B in B-trees means, the better you understand B-trees.
Все зависит от архитектуры системы. В нашем случае, все «головы» кластера видят один и тот же набор дисков. Выход из строя «головы» не приводит к потере данных. Только сломавшийся диск требует запуска процедуры восстановления. Когда говорят про схему кодирования N+K (в технологиях erasure coding), подразумевается, что блок с данными разбивается на N фрагментов, по ним считаются дополнительные K, и все это «разлетается» по разным дискам. У нас схема по умолчанию 12+4, соответственно любые 4 диска можно потерять.
В других СХД, архитектура может быть другой. Конкретная «голова» может отвечать за какое-либо число дисков и выход из строя «головы» равнозначен поломке всех дисков, за которые она отвечает. Если, к примеру, «голова» отвечает за 3 диска, а схема 12+4, то можно потерять или 4 диска, или 1 диск и одну «голову» или …
По «частоте применения», возможно, технология RAID — лидер. По другим критериям, например, «объемы данных», картина, думаю, другая. Все известные мне «облачные» решения не используют RAID для хранения пользовательских данных. А объемы данных там гигантские. Современные классические СХД в связи с ростом объемов данных и увеличением требований к «физической» плотности систем, начинают сталкиваться с теми же ограничениями, что и «облачные системы» (где технологии RAID не находят массового применения). На самом деле, мы не противники RAID и несомненно есть и будут области, где RAID – оптимальный выбор. Мы рассматривали и такой вариант, но пришли к выводу, что использовать в нашем случае RAID — нецелесообразно.
Была идея затронуть следующие темы:

1) Коды Рида-Соломона. Теория
2) Арифметика полей Галуа. Теория и реализация
3) Коды Рида-Соломона. Реализации
4) Коды Рида-Соломона. Программные оптимизации
5) Коды Рида-Соломона. Аппаратные оптимизации

Посмотрим, на что хватит времени…
Да, в реальных СХД хранится информация о том, какие фрагменты присутствуют на каждом диске. При выходе диска из строя, система составляет список потерянных фрагментов и передаёт эту информацию модулю восстановления данных.

Информация

В рейтинге
Не участвует
Откуда
Санкт-Петербург, Санкт-Петербург и область, Россия
Работает в
Дата рождения
Зарегистрирован
Активность

Специализация

Backend Developer, Application Developer
C++
C
Applied math