1anisim 25 апр 2019 в 14:43

ok.tech: Cassandra meetup

2 мин

2.3K

Блог компании ОКNoSQL*Базы данных*Распределённые системы*Хранение данных*

Работаете с NoSQL-хранилищем Apache Cassandra?

23 мая Одноклассники приглашают опытных разработчиков в свой офис в Петербурге на митап, посвященный работе с Apache Cassandra. Важен лишь ваш опыт работы с Cassandra и желание им поделиться.
Зарегистрироваться на мероприятие

Мы в ОК начали использовать Apache Cassandra в 2010 году для хранения оценок фото. В настоящее время мы — самые крупные пользователи Apache Cassandra в Рунете и одни из крупнейших в Европе. У нас более сотни различных кластеров используются как для хранения различной продуктовой информации — классы, чаты, сообщения, так и для управления критичными инфраструктурными данными — маппинг логических блоков на диски большого бинарного хранилища — one-cold-storage, управление данными внутреннего облака one-cloud и т.д.

В общей сложности, в Одноклассниках под управлением Cassandra находятся петабайты данных на тысячах нод. За это время мы накопили огромный опыт в администрировании, разработке и эксплуатации решений на основе Cassandra и даже разработали свою собственную NewSQL транзакционную БД.

Сейчас мы хотели бы поделиться всем этим с вами — на реальных кейсах из практики и без секретов; Мероприятие пройдет в формате живой дискуссии между участниками, это значит, что обсуждение займет основную часть времени. Эксперты OK готовы поделиться своими идеями и подходами. Вести мероприятие будут Олег Анастасьев и Александр Христофоров.

Какие будут темы?

Эксплуатация:

Рассмотрим типичные конфигурации нод и кластеров в различных production инсталляциях. Обсудим, как расширять кластера с ростом объёмов данных и нагрузки и как заменять отказавшие узлы с минимальным эффектом для клиентов. Поделимся болью и систематизируем популярные грабли. Выясним, как мониторить кластера, чтобы заблаговременно понимать, где и что именно работает не так. Затронем проблемы деплоя новых версий Cassandra.

Производительность:

Попробуем понять, на какие метрики смотреть и что можно тюнить, чтобы сделать метрики лучше. Разберёмся, ретраить или нет и если да, то как. Идентифицируем узкие места в архитектуре и реализации Cassandra и рассмотрим некоторые инженерные трюки, чтобы их обойти. Затронем наболевший регулярный repair и compaction без деградации производительности.

Отказоустойчивость:

Железо не вечно, поэтому аварии происходят постоянно, да и рука коллеги может дрогнуть и мы удалим лишнее, поэтому обсудим восстановление после сбоев дисков, машин или датацентров, а также откат к консистентному состоянию из бекапов в случае ошибок оператора.

Регистрируйтесь и рассказывайте про мероприятие друзьям и коллегам.

Хабы: