Vertica на HighLoad++

    Вчера было мое выступление на HighLoad++. Тезисы и слайды на сайте организаторов. Конференция организована, кстати, отлично. Но времени на полноценное выступление было мало — 45 минут с вопросами. Тестовый прогон у меня занял 60 минут, после некоторой реорганизации и без вопросов на HL я уложился за 42. Некоторые важные архитектурные моменты пришлось проговаривать быстро и без примеров, от чего, конечно, страдала ясность. Я пытался построить презентацию таким образом, чтобы показать, как мы необходимым образом пришли к Вертике и к текущей архитектуре, и в то же время сделать акцент на важных архитектурных принципах работы с большими данными вообще. Не уверен, что цель была в полной мере достигнута. Мало, мало времени. Но я всегда открыт для вопросов. Вертика, впрочем, вызвала заслуженный интерес, вопросы были по делу.

    А сегодня было выступление Криса Бонна из etsy.com, и, удивительное дело, он тоже рассказывал про Вертику. Два доклада на HL — это уже тенденция. Крис по-другому пытался рассказать, что же это за RDBMS, потратил на это почти полчаса и тоже не успел. Впрочем, на мой вкус они слишком разжевывал некоторые вещи, но я субъективен. По сравнению с моим вчерашним докладом он сделал два полезных для слушателей дополнения. Во-первых, он совершенно справедливо указал, что однонодовая Вертика до 1ТБ — бесплатна. И хотя это мало, но это куда лучше, чем любая другая однонодовая RDBMS для аналитики. Во-вторых, он попытался сделать демо. Я не догадался, но у меня и не было доступа к компьютеру во время выступления. Впрочем, его демо не очень вышло, и пример «быстрого вопроса» был не очень показателен, так как не было понятно, сколько в таблице всего строк. Надо было взять таблицу на несколько миллиардов строк, и сделать запрос с агрегацией по всем данным за пару секунд на лаптопе. Пример подобрать нетрудно, а было бы очень эффектно.

    Возможно, что благодаря этим докладам, интерес к Вертике у нас в стране вырастет. Если кто-то видел эти выступления на HL++, интересны ваши впечатления, что было понятно, что нет.
    LifeStreet Media
    32,24
    Компания
    Поделиться публикацией

    Комментарии 6

      0
      Или что-то изменилось у вертики, или это уже 2ая ошибка с ограничениям. Там 3 ноды в CE версии.
        +1
        Честно говоря, не уверен. Надо бы у них спросить. На сайте есть только новость годичной давности, где да, объявлено, что 3 ноды. Но с другой стороны, 3 ноды абсолютно бесполезны. По нашему опыту это мертвая инсталляция, так поиграться только, как с кластером обращаться. Накладные расходы на сеть между нодами и дополнительное склеивание данных на ноде-инициаторе сводят на нет преимущество кластера. Более-менее нормальная производительность начинается от пяти нодов. А вот однонодовая Вертика с быстрыми дисками — это очень неплохой вариант, и мы его вовсю используем для задач среднего объема. Если хочется дешево и сердито получить возможность гонять запросы на данных до терабайта — это очень неплохой вариант.
          0
          Ну у нас админ брал CE версию и он говорил, что там 3 ноды. Мы правда только на одной тестили в итоге. Результаты и правда крутые на агрегацию. Очень вероятно, что будем использовать для некоторых аналитических задач.
        0
        ответ перенесен выше
          0
          Александр, видео планируется?
          О Вертике читал когда-то в сравнении с Хадупом, но вроде также слышал, что в сфере распределенных баз данных лидером является Teradata…
            0
            Организаторы обещали видео выложить.

            С Хадупом Вертику можно сравнивать, но сравнение будет не совсем корректно, потому что это системы разного предназначения. Для тех задач, для которых Вертика проектировалась (типичный OLAP), Хадуп потребует в 10 раз больше серверов. Но точно так же есть класс задач, где Хадуп будет эффективнее Вертики.

            А Терадата лидер, конечно, но стоит, как самолет.

          Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

          Самое читаемое