Comments / Profile of akonyaev / Habr

Коняев Андрей@akonyaev

Инженер

Apache Bigtop и выбор Hadoop-дистрибутива сегодня

@akonyaev Apr 30 2020 at 13:50

Я не понимаю в чём тогда вендор-лок у arenadata, если форк bigtop их открыт
Менеджер они тоже открыли.
Хоть сейчас форкайся и дорабатывай.

Во имя нового продукта

@akonyaev Aug 6 2019 at 19:27

Доклад пропитанный болью и страданиями на 100 процентов.
За то продукт классный новый продукт)

Как мы в ivi переписывали etl: Flink+Kafka+ClickHouse

@akonyaev Jan 25 2018 at 19:19

Да. Это около 1ТБ данных.
Мы собираем на новой платформе аналитики практически все возможные события.
Показы всех секций интерфейса, всех элементов, любые взаимодействия с клиентом, очень много событий от плеера, масса событий от бекенда.
С учётом того, что на новую платформу мы перевели только двух клиентов, данных будет ещё больше.

Как мы в ivi переписывали etl: Flink+Kafka+ClickHouse

@akonyaev Jan 24 2018 at 19:17

4 тачки, по 2 в разных датацентрах. каждая по 56 ядер и 256ГБ оперативы.
Диски в raid10, для ускорения чтения.

Как мы в ivi переписывали etl: Flink+Kafka+ClickHouse

@akonyaev Jan 24 2018 at 19:14

1) Вполне резонный вопрос. sequenceMatch мы пробовали. Но нужно было чтобы от одного шага воронки, до другого было определённое колличество сообщений.
Я потом увидел доклад от Yandex (https://www.youtube.com/watch?v=YpurT78U2qA), где ребята решают это на основе массивов. В ближайшее время буду изучать этот вариант. Возможно, что надобность в предрасчитанных воронках отпадёт, если аналитикам понравится считать их прямо в базе.

2) Честно говоря, я не знаю как именно в redis у нас настроены снепшоты. Скорости вполне хватает. Мы используем redis-cluster, 4 шарда, каждый реплицированный.

Как мы в ivi переписывали etl: Flink+Kafka+ClickHouse

@akonyaev Jan 24 2018 at 18:56

Около 1.5 миллиардов сообщений

Как мы в ivi переписывали etl: Flink+Kafka+ClickHouse

@akonyaev Jan 24 2018 at 09:55

Ну про checkpoint's я согласен. Мне этот механизм не очень нравится. И дело не в том, что он где-то течёт. Это всё недоказано, а может быть и пофикшено. Дело в том, что восстанавливаться из них сложно, когда меняешь граф.

Чуствителен к сетевым проблемам. Если у Вас распределённый движок для вычислений, происходит общение между нодами и тут бац, сети нет — ну я даже не знаю, что Вы ещё хотите? Все таймауты можно настраивать в akka.

Про то что неудобно деплоить. Тут я не соглашусь. Мы используем в качестве среды запуска YARN. Мы написали для Cloudera Manager своё расширение и следим за flink из него. Очень удобно. Залили новый JAR, новый конфиг, нажали restart в CM и поехали считать дальше с новым графом.

Сейчас мы используем версию 1.4.0, но и в начале когда был 1.1.4 было вполне стабильно.

Как мы в ivi переписывали etl: Flink+Kafka+ClickHouse

@akonyaev Jan 24 2018 at 09:45

1) Flink CEP — никогда не использовали. Посмотрел, и даже не знаю где у нас применить.
2) Мы не стали делать свою реализацию state backend, так как для этого нужно научить её всему API что есть в Flink (savepoint, checkpoint, восстановление из них и многое прочее). Мы просто во всех наших RichFlatMapFunction используем Cache на основе JedisCluster. Это позволяет избавится от ненужных keyBy перед flatMap и не парится о всех контрольных точках.
Если мы упали, то весь кеш гарантировано на месте.