• Распределение строк и доступ в СУБД Teradata (Primary Index)

      Предыдущий пост: Что такое Teradata?

      Как Teradata распределяет строки?

      • Teradata использует алгоритм хэширования для рандомного распределения строк таблицы между AMP-ами (преимущества: распределение одинаково, независимо от объема данных, и зависит от содержания строки, а не демографии данных)
      • Primary Index определяет, будут ли строки таблицы распределены равномерно или неравномерно между AMP-ами
      • Равномерное распределение строк таблицы ведет к равномерному распределению нагрузки
      • Каждый AMP отвечает только за свое подмножество строк каждой таблицы
      • Строки размещаются неупорядоченно (преимущества: не требуется поддержка сохранения порядка, порядок не зависит от любого представленного запроса)


      Primary Key (PK) vs. Primary Index (PI)

      Primary Key (первичный ключ) – это условность реляционной модели, которая однозначно определяет каждую строку.
      Primary Index – это условность Teradata, которая определяет распределение строк и доступ.
      Хорошо спроектированная база данных содержит таблицы, в которых PI такой же как и PK, а также таблицы, в которых PI определен в столбцах, отличных от PK, и может влиять на пути доступа.
      Читать дальше →
    • Что такое Teradata?

      Предисловие: По работе мне пришлось изучать устройство базы данных Teradata, и оказалось, что в интернете почти нет информации, особенно на русском языке. Поэтому я решила собрать в кучу всю доступную информацию.

      Стремительное увеличение объемов носителей информации и удешевление стоимости хранения данных привело к появлению методов, способных обеспечить более быстрый доступ к необходимым данным – индексы, хранение данных в отсортированном виде и т.п. Эти методы вполне успешно справляются со своей задачей, однако возрастающая конкуренция в мире заставляет искать новые, более быстрые, способы доступа к информации. «Кто владеет информацией, тот владеет миром». Основной интерес вызывают базы данных с традиционной реляционной моделью данных, отвечающие требованиям ACID (Atomicity, Consistency, Isolation, Durability — атомарность, согласованность, изолированность, надежность) и предназначенные для аналитики Больших Данных (Big Data).

      Teradata – это параллельная реляционная СУБД, которая работает на операционных системах:

      • MP-RAS UNIX
      • Microsoft Windows 2000/2003 Server
      • SuSE Linux

      Разнообразие поддерживаемых ОС — одна из причин, почему Teradata имеет открытую архитектуру.
      Читать дальше →