youROCK Mar 25 2017 at 13:49

Делаем быстрый поиск по турам на основе ClickHouse

12 min

23K

MySQL * High performance * Website development *

+31

Comments 19

UFO landed and left these words here

youROCK Mar 28 2017 at 11:57

Кстати говоря, не очень понятно, почему ваш комментарий заминусовали — вполне возможно, что на ElasticSearch работало бы тоже не так уж плохо. Правда, у меня нет никакой экспертизы по ElasticSearch, чтобы это попробовать реализовать по-быстрому.

RFL Mar 25 2017 at 16:08

Спасибо за Ваш труд, интересная информация по тестам! Только лучше было бы все же предварительно настроить MySQL, это было бы больше похоже на реальные испытания.

wildraid Mar 25 2017 at 19:49

Ради интереса, сгенерировал tours.csv и положил в Exasol (1 node, бесплатный который).
Размер в сжатом виде получился 180.06 Мб.

По времени выполнения, все запросы идут 0.2 — 0.5 секунд, из которых львиная доля уходит на EXECUTE \ COMPILE. Просто на то, чтобы взлететь и понять, что нужно сделать. Данных совсем мало чтобы получить заметную разницу.

Вот бы взять ~1Тб туров, колоночек сделать штук пятьдесят и запрос чуть посложнее. Например, «топ 50 туров, которые искали люди, похожие на вас».

Suncheez Mar 25 2017 at 21:33

А давайте посчитаем косты на Exasol и ClickHouse для работы с терабайтной базой туров?

Из своего опыта могу сказать, что 250 отелей*60 размещений*18 вариантов срока пребывания*200 доп опций*сезон в 7 месяцев = примерно 30ГБ в БД Мастер-тур.
Вся Италия вместе с Сардинией будет как раз около ТБ.
На рынке есть моно-операторы, работающие только в одном направлении, но их мало уже осталось. Большинство крупных операторов работают минимум на всю Европу, но(!) у себя держат не полные данные, а примерочные, а полные данные дают по запросу клиента, запрашивая из внешних баз.

Вот здесь нам рассказывают, что для более-менее приемлемой аналитической работы с базой в 85ТБ нужно 8 20-головых нод с 5,6ТБ суммарной оперативки и 64ТБ хранилищем.

Самая крупная база, с которой имел дело лично я, весила 3,5ТБ. Это объём данных оператора в средне-тяжёлом весе за полный год. Обычно, хранят «под рукой» данные за два-три года.

Если предположить, что для работы с такой базой нужна будет одна нода в Exasol из примера Baidoo, против обычного 2-голового ксеона с 256ГБ оперативки в топе под Click-House, то выбор становится очевидным, правда?

wildraid Mar 25 2017 at 21:50

Именно на терабайтную базу косты одинаковые будут. 1Тб сырых данных как раз примерно ужмутся в 200Гб сжатых и целиком влезут в память бесплатной версии. И как раз это всё заведётся на машинке с 256Гб памяти.

Тут вопрос немного в другом. При росте объёма данных те проблемы и острые углы, которые есть у любого продукта, начинают проявляться намного ярче. По шести сотням мегабайт и fullscan можно сделать, сохранив адекватное время ответа. А вот хотя бы на пятистах гигах ClickHouse должен оторваться от MySQL уже на много порядков. Особенно на запросе чуть посложнее WHERE + ORDER BY.

vbarinov Mar 26 2017 at 07:12

Спасибо за статью, но запросы слишком простые — не ни аггрегаций, ни группировок, ни вложенных запросов, ни джоинов.

Потом у самого кликхауса на сайте есть бенчмарки против MySQL, и там прекрасно видно их сравнение.

Было бы гораздо интереснее посмотреть сравнение против Elastic Search, Splunk, Druid...

hatarist Mar 26 2017 at 15:53

че-т не очень искали :)

https://github.com/excitoon/ClickHouse/releases — собранные бинарники
https://github.com/excitoon/homebrew-clickhouse — репо для хомбрю с клиентом
https://github.com/hatarist/homebrew-clickhouse — репо для хомбрю с сервер+клиентом

youROCK Mar 26 2017 at 15:58

Чо-то как-то так себе сборка, я вам скажу:

> ~/Downloads/clickhouse-client
dyld: Symbol not found: __ZSt14__once_functor
  Referenced from: /Users/yuriy/Downloads/clickhouse-client (which was built for Mac OS X 10.12)
  Expected in: /usr/local/opt/gcc/lib/gcc/6/libstdc++.6.dylib
 in /Users/yuriy/Downloads/clickhouse-client
fish: '~/Downloads/clickhouse-client' terminated by signal SIGABRT (Abort)

hatarist Mar 26 2017 at 16:01

Пардон, я со свежезареганного аккаунта, поэтому править комменты не могу. Исправленный:

https://github.com/excitoon/ClickHouse/releases — собранные бинарники (уже старые)
https://github.com/excitoon/homebrew-clickhouse — репо для хомбрю с клиентом (тоже уже старое)
https://github.com/hatarist/homebrew-clickhouse — репо для хомбрю с сервер+клиентом (стараюсь обновлять, но может быть лениво)

в последнем случае всячески приветствуются:
— автоматизация тестов и обновления пакета (как brewbot'ы делают для bottle'ов),
— исправления для того, чтобы пройти в homebrew-core репу. дело было давно, но отклонили. см. https://github.com/Homebrew/homebrew-core/pull/7222
— банальные обновления ссылки/хеша/тестирование того, что пакет собирается, с последующими пуллреквестами

ссылка на идею сделать официальный homebrew-репозиторий на стороне яндекса: https://github.com/yandex/ClickHouse/issues/235

Тоже сначала плевался от докера, оверхед от virtualbox/xhyve по I/O очень большой, что критично при тесте кликхауса локально, в макоси. Но на время тестов, да и пока нет нормальной линуксовой машины, докер вполне можно потерпеть. ¯\_(ツ)_/¯

hatarist Mar 26 2017 at 16:05

а насчет excitoon'овских ничего не могу сказать, он действительно собирал для 10.12, и официально сборка для макоси поддерживается с сиерры (раз, два), но я сидел на El Capitan, и с ним сначала все было ОК, потом сильно сломалось, а теперь снова все ОК, если динамически библиотеки линковать.
Впрочем, может там опять что-то изменилось, я перестал следить :(

youROCK Mar 26 2017 at 16:10

Так я собственно для macOS Sierra и собрал. И недостающие либы тоже выложил.

DOLARiON Mar 26 2017 at 16:04

Может еще Tarantool? Насколько знаю, он уже умеет держать в оперативке не все данные.

youROCK Mar 27 2017 at 19:18

Не похоже, чтобы Tarantool подходил — он же сделан как быстрая сетевая хеш-таблица, а не чтобы делать быстрый фулскан.

Я залил данные в демона, это заняло 1 минуту 51 секунду процессорного времени тарантула и 535 Мб памяти.
Но что потом с этими данными делать? У тарантула нет возможности выбрать отфильтрованные данные без использования индекса. Если же выбирать все данные в lua, то даже в локальной консоли сервера это занимает очень приличное время (заметьте, что я даже сортировать не начинал, как и обработку записей тоже):

tarantool> local start = os.clock(); for k, v in box.space.tours:pairs() do end; print(string.format("elapsed time: %.2f sec\n", os.clock() - start))
elapsed time: 5.90 sec

Если же добавлять индексы, то потребление памяти будет ещё больше. Очевидно, что движок Vinyl быстрее memtx тоже на такой нагрузке не будет.

В общем, тарантул — безусловно хорошая база, но она в данном случае совсем не подходит.

youROCK Mar 27 2017 at 21:24

Небольшой апдейт: поигравшись с количеством ядер, выделенных под «наливалку» (GOMAXPROCS=3) и количеством одновременных потоков (1024 намного лучше, чем изначальные 16), которые заливают в Тарантул, мне удалось сократить время заливки до 40 секунд. Однако на время выборки это не влияет.

dedokOne Mar 27 2017 at 23:14

Классика…

lua garbage collector плохо переживает много lua таблиц (в твоем коде — box.space.tours:pairs()).

Проблема 1 в 1 была когда мы делали Facebook linkbech, часть хранимой пришлось переписать на C, чтобы избавиться от этих эффектов.

Как вариант rust, C или попробовать наш SQL (который в альфа)

youROCK Mar 28 2017 at 07:55

Жду с нетерпением, когда вы расскажете про свой SQL :)

comerc Oct 30 2023 at 20:46

А почему нет индекса по полю price?

youROCK Oct 30 2023 at 21:53

Почему Вы пишете комментарии к постам шестилетней давности :)?
Если кратко, то индекса по полю price нет, потому что мы в данном примере мы сортируем по любому полю, не только по цене.

Можно добавить индексы по всем полям, но тогда вставка будет ещё медленней, и места на диске таблицы тоже будут занимать ещё больше. При этом ускорение от индексов будет только в случае, если условие WHERE не отсекает слишком много строк, иначе MySQL будет читать всю таблицу случайным чтением по одной строке, что очень медленно.

В ClickHouse же вторичных индексов на тот момент вообще не было.