Работаете с NoSQL-хранилищем Apache Cassandra?
23 мая Одноклассники приглашают опытных разработчиков в свой офис в Петербурге на митап, посвященный работе с Apache Cassandra. Важен лишь ваш опыт работы с Cassandra и желание им поделиться.
Зарегистрироваться на мероприятие
Мы в ОК начали использовать Apache Cassandra в 2010 году для хранения оценок фото. В настоящее время мы — самые крупные пользователи Apache Cassandra в Рунете и одни из крупнейших в Европе. У нас более сотни различных кластеров используются как для хранения различной продуктовой информации — классы, чаты, сообщения, так и для управления критичными инфраструктурными данными — маппинг логических блоков на диски большого бинарного хранилища — one-cold-storage, управление данными внутреннего облака one-cloud и т.д.
В общей сложности, в Одноклассниках под управлением Cassandra находятся петабайты данных на тысячах нод. За это время мы накопили огромный опыт в администрировании, разработке и эксплуатации решений на основе Cassandra и даже разработали свою собственную NewSQL транзакционную БД.
Сейчас мы хотели бы поделиться всем этим с вами — на реальных кейсах из практики и без секретов; Мероприятие пройдет в формате живой дискуссии между участниками, это значит, что обсуждение займет основную часть времени. Эксперты OK готовы поделиться своими идеями и подходами. Вести мероприятие будут Олег Анастасьев и Александр Христофоров.
Какие будут темы?
Эксплуатация:
Рассмотрим типичные конфигурации нод и кластеров в различных production инсталляциях. Обсудим, как расширять кластера с ростом объёмов данных и нагрузки и как заменять отказавшие узлы с минимальным эффектом для клиентов. Поделимся болью и систематизируем популярные грабли. Выясним, как мониторить кластера, чтобы заблаговременно понимать, где и что именно работает не так. Затронем проблемы деплоя новых версий Cassandra.
Производительность:
Попробуем понять, на какие метрики смотреть и что можно тюнить, чтобы сделать метрики лучше. Разберёмся, ретраить или нет и если да, то как. Идентифицируем узкие места в архитектуре и реализации Cassandra и рассмотрим некоторые инженерные трюки, чтобы их обойти. Затронем наболевший регулярный repair и compaction без деградации производительности.
Отказоустойчивость:
Железо не вечно, поэтому аварии происходят постоянно, да и рука коллеги может дрогнуть и мы удалим лишнее, поэтому обсудим восстановление после сбоев дисков, машин или датацентров, а также откат к консистентному состоянию из бекапов в случае ошибок оператора.
Регистрируйтесь и рассказывайте про мероприятие друзьям и коллегам.