Комментарии / Профиль barloc / Хабр

Станислав@barloc

Руки-ножницы

Подписчики

ПрофильСтатьи2ПостыНовости1Комментарии277

barloc 28 июн 2020 в 15:20

Про camel было бы интересно послушать.
Сейчас Nifi достаточно прочно занял нишу бесплатного EL данных, даже среди энтерпрайза — сужу по московскому митапу и активности комьюнити. А вот про Camel никогда и ни от кого не слышал.
Может дело в том, что степень вхождения в Nifi много ниже — как правило администраторы/аналитики способны управиться, нет никакого программирования включая написание конфигов (до поры, до времени :).

Где в России убивают больше всего? Анализ данных

barloc 26 июн 2020 в 13:27

Спасибо, хорошая работа. Недавно читал фрикономику, там было про число случайных смертей детей от оружия в доме или утопления в домашних бассейнах — бассейны конечно выиграли.
Так и тут, внезапно города Дагестана оказались одними из самых безопасных по сравнению с суровым Забайкальем.

Как идет внедрение DNS-over-HTTPS

barloc 21 июн 2020 в 16:26

Выдержал примерно месяц дох. Задержки адовые, 3 из 10 запросов не возвращают записи. Если такое включат, пользователи взвоют.

6 мифов о разработке в финтехе

barloc 21 июн 2020 в 16:20

Очень интересно было бы послушать чем плох мезос с марафоном и чем так хорош кубернетис. Кроме хайпа и вроде бы исключения девопсов из пайплайна выкатки.
Можно даже отдельной статьёй :)

Учимся разворачивать микросервисы. Часть 4. Jenkins

barloc 24 мар 2020 в 09:24

Странные альтернативы.
Ну ладно, разве что гитлаб подходит.
Но как только пайплайн в гитлабе выходит за пределы стандартной сложности начинаются пляски с шаблонами, переменными, ямлом и привет полтыщи строк вместо 50-100 в дженкинсе.

Продаем Architecture Refactoring клиенту или в чем проблема девелоперов

barloc 16 мар 2020 в 12:40

>На классический вопрос есть классический ответ. Этот архитектурное решение было хорошо год назад, но бизнес растет и меняется и архитектура должна меняться вместе с ним.

Отличное обоснование :)

Планирование за час и другие оптимизации scrum ивентов

barloc 7 мар 2020 в 09:12

Стоит заметить, что это команда сеньоров. При попадании в нее слабых в профессиональном смысле людей все станет хуже.

Из разработчика в менеджеры и обратно

barloc 6 мар 2020 в 10:12

Архитектора?
Того, кто еще больше должен общаться с людьми со всех сторон? :)
От разработчиков до генеральных директоров )

Как в Солнечной галактике Clickhouse выбирали

barloc 29 янв 2020 в 18:50

Странный выбор, учитывая что в последнем запросе кх просто упал. То есть у вас неполный функционал, зато быстро. Джойны, словари обошли стороной.

Битва двух якодзун, или Cassandra vs HBase. Опыт команды Сбербанка

barloc 17 янв 2020 в 05:31

>Рационально вставлять раз в секунду или по ~100К, а как-то сильно иначе — просто нагрев.

Посмотрите что происходит с КХ в режиме вставки около 1,5 млн/сек в реплицированные таблицы. Как раз верхняя граница буфера чуть больше 1 млн.

>Что касается эффективности представления данных на диске, то CH хранит данные по-колоночно со сжатием — придумать что-либо эффективнее сложно.

Поколоночно и с сжатием хранят все, для спарка аж 2 формата — паркет и орц так хронят. В кх еще есть сортировка.

HighLoad++, Юрий Насретдинов (ВКонтакте): как VK вставляет данные в ClickHouse с десятков тысяч серверов

barloc 14 янв 2020 в 05:02

Хороший вопрос про кафку. Вот только после пробы кафки автор доклада вернулся бы на свою схему. На большом потоке чтение из кафки становится проблемой.
И непонятно почему не юдп. Это логи, можно терять какую-то часть. Ценность невелика.

Использование Clickhouse в качестве замены ELK, Big Query и TimescaleDB

barloc 8 янв 2020 в 16:37

Глаз тоже резануло.
А с другой стороны уметь то умеет, вопрос как умеет. Не зря все обвешаны го-консумерами со всех сторон.

Apache NiFi: что это такое и краткий обзор возможностей

barloc 7 дек 2018 в 08:08

Нашлепка поверх найфая, которую можно отдать пользователям и в которую ты забиваешь как раз свои шаблоны и бестпрактис.
То есть позволяет ее дать малоопытным пользователям или ДС, которые сами смогут строить свои флоу. И при этом будет не так страшно, как на продовом кластере найфая.
В чатике дата инженеров есть Антон из Терадаты, у него хороший опыт с kylo.

Apache NiFi: что это такое и краткий обзор возможностей

barloc 7 дек 2018 в 08:06

Kafka всеми нодами забирается без проблем, там же консамер группы. А hdfs/sftp, если говорить про чтение, с primary-ноды, потом через РПГ все разлетается на другие ноды. Если про запись говорить, то это из коробки работает, считай что пишется в несколько потоков в дестинейшн.

Понятно, я то надеялся какой-то интересный механизм впилили, а все осталось примерно по разному :)

Apache NiFi: что это такое и краткий обзор возможностей

barloc 7 дек 2018 в 05:12

Ради интереса подскажтие, большой выигрыш в скорости по сравнению с скриптованием внутри ExecuteScript скажем на груви?
С документацией полный швах, по апи скриптов раньше было 3 заметки на сайте хортона и все.

Apache NiFi: что это такое и краткий обзор возможностей

barloc 7 дек 2018 в 05:09

Согласен, но создать темплейты в nifi на все случаи жизни и описать бестпрактисы на вики, чтобы «новичок» смог сделать простые загрузки самостоятельно — это куда проще, чем объяснять flume/sqoop, линукс и написание скриптов на bash/python.

И тут мы приходим к Apache Kylo :)
Многое, конечно, зависит от. Я наблюдал как опытный девопс делал первый етл на Nifi и получилось достаточно плохо. Оно работало, но без погружения именно в тонкости nifi — работало плохо и завешивало все серверы кластера.
И все равно внутри обмазано житонами, кафками и всякими секьюрными штуками, чтобы разобраться в которых нужна опсовская практика :)

Если мы говорим про загрузку данных из kafka/hdfs/чего угодно, то все это как правило масштабируется в nifi.

Не понял слова масштабируется в этом контексте. У меня опыт версии 1.2 — но масштабирования там особо нет, или все на примари, или РПГ.

РПГ уже не нужен для балансировки для случая, когда трафик идет с primary node. Это пофиксили в версии 1.8 и теперь балансировка работает на уровне connection, пруф.

А вот это круто. Как раз готовимся к миграции на 1.8. Значимый бонус, если это так.

Apache NiFi: что это такое и краткий обзор возможностей

barloc 6 дек 2018 в 17:14

Статья неплохая. И если бы не знал всех потрохов найфая в работе даже сошло бы :)
Но:

Первое, что нам, как администраторам, не нравилось – это то, что написание конфига Flume для выполнения очередной тривиальной загрузки нельзя было доверить разработчику или аналитику, не погруженному в тонкости работы этого инструмента.

Это все сохраняется и для найфая. Вернее как, бестпрактис и стандартные шаблоны выстраданы квалифицированной командой дев+опс, но никак не первым встречным, который в первый раз увидел найфай. Он просто уронит сервер, а вместе с ним и все остальные таски на нем. Ведь у найфай нет изоляции заданий, все крутится вместе.

Вторым моментом были отказоустойчивость и масштабирование. Для тяжелых загрузок, например, по syslog, нужно было настраивать несколько агентов Flume и ставить перед ними балансировщик. Все это затем нужно было как-то мониторить и восстанавливать в случае сбоя.

Ситуация с балансировщиком остается и в случае найфая. Если у вас эндпойнт внутри кластера, то кто же будет клиентов перенаправлять на него в случае падения/обслуживания ноды?
И масштабирование у найфая весьма специфичное, только через РПГ, которые не работают внутри ПГ.

В-третьих, Flume не позволял загружать данные из различных СУБД и работать с некоторыми другими протоколами «из коробки». Конечно, на просторах сети можно было найти способы заставить работать Flume с Oracle или с SFTP, но поддержка таких «велосипедов» — занятие совсем не из приятных. Для загрузки данных из того же Oracle приходилось брать на вооружение еще один инструмент — Apache Sqoop.

Процессоров куча, а в итоге нет-нет да и предется расчехлять скрипты на груви. И не дай бог влезть в житон, более багованной штуки еще не встречал.

А так приятно видеть, что найфай набирает обороты. Не так активно конечно, как эйрфлоу, но все же. Особенно отрадно видеть сетевых ребят в первом ряду (есть у вас коллеги с ним).

Ну и добро пожаловать в чатик в телеге: @nifiusers

1 2 ...

12 13

Информация

Специализация