Комментарии 9
Рассматривали ли вы облачные решения, как например snowflake?
Да, есть много облачных решений, в том числе и у Сциллы. Но всё-таки хотелось иметь больший контроль над хранилищем (вплоть до физического доступа). Это особенно важно при испытании новой технологии, чтоб быть уверенным, что проблема не в ресурсах облачного провайдера, а в неправильных действиях испытателя. Ну и доступ к качественным облачным сервисам сейчас сопровождается определенными рисками. Поэтому мы изначально были нацелены на использование именно on-premise решения.
А расскажите пожалуйста, на каком железе работала монги и какой рпс она держала? Интересно в сравнении на вашем типе нагрузки. Ибо в своё время тоже рассматривал сциллу/кассандру как замену кластеру монги, но спустя неделю тестов каждой не получилось даже приблизиться к монговским рпс на запись (при +/- одинаковом железе).
Наш кластер Mongo работал и работает фактически на таком же железе, какое получила Scylla, и обеспечивает rps порядка 40K. Как показала практика, Scylla не может служить полноценной заменой Mongo. Это связано не только с тем, что Scylla уступает по производительности, но и с указанными в статье нюансами. При этом компактность хранения данных и простота масштабирования хранилища всё же позволяют рассматривать Scylla для задач долговременного хранения и как вариант диверсификации зависимостей системы.
Расскажите пожалуйста про компактность хранения, какой выйгрыш получился при сравнимом объеме документов?
При этом компактность хранения данных и простота масштабирования хранилища всё же позволяют рассматривать Scylla для задач долговременного хранения и как вариант диверсификации зависимостей системы.
Рассматривали ли вы вариант реализацие tiered хранилища на монге (используя тэги при шардировании)? Или второй кластер монги под холодные данные. Это я к чему все.. Вы взяли незнакомую БД под архивные данные, хотя текущая БД доказала надежность и с её помощью можно реализовать hot-cold архитектуру данных. Хочу понять мотивацию :)
Речь о выигрыше не идёт. Достаточно того, что Sclylla просто поддерживает действенные алгоритмы сжатия. И, конечно же, аналогичное архивное хранилище можно реализовать и при помощи Mongo. Что же касается мотивации исследования... Это стремление уменьшить зависимость всей системы от одной конкретной технологии, а заодно выяснить, является ли новое решение более эффективным, чем старое. Ведь это хорошо, когда есть альтернатива, не так ли? :)
2431 ops - как-то маловато. Да ещё и latency 9.8, странно. А каков общий размер записи, примерно?
ScyllaDB: приручение «лающей» базы данных