Comments / Profile of bigdata-dev / Habr

@bigdata-dev^{read⁠-⁠only}

User

MySQL в финансах: реакция или созидание?

bigdata-dev Mar 9 2021 at 11:06

с чего бы это? в нормальных субд, например, оракл в принципе если запрос затрагивает более 25% строк — таблица full scan достается. но это не повод же блокировать всю таблицу.
а у mysql получается, что с дедлогами могут запросто завалится даже INSERT INTO… SELECT

-1

MySQL в финансах: реакция или созидание?

bigdata-dev Mar 9 2021 at 10:47

mysql в финансах я бы не рискнул. у mysql мягко говоря странноватый подход к блокировкам, при full scan блокировки накладываются на все что вычитывает запрос, а не то что требуется заблокировать.

Роскомнадзор потребовал от Telegram заблокировать боты, которые собирают и распространяют персональные данные россиян

bigdata-dev Mar 9 2021 at 10:36

и что будет если откажут? снова бесплодные попытки заблокировать?

Роскомнадзор требует от Facebook обосновать блокировку 530 российских пользователей Instagram

bigdata-dev Mar 4 2021 at 14:33

там написано не нравится, не приходи.

«Облака были созданы, потому что все задолбались»: в чём отличие облачной инфраструктуры от своих серверов

bigdata-dev Mar 4 2021 at 08:05

сказать вы можете, но кому интересны ваши слова? всем интересны тенденции и причины. а тенденция — бизнес массово мигрирует в облака ради экономии. даже не смотря на то что найдутся лапухи, которые сожгут бюджет по глупости. риски с глупцами есть, но дешевизна…

«Облака были созданы, потому что все задолбались»: в чём отличие облачной инфраструктуры от своих серверов

bigdata-dev Mar 3 2021 at 19:51

глупости. постройка чего-то типа data lake, где данные лежат на S3 сторидже за $30 терабайт может запросто стоить в несколько тысяч раз дешевле, чем лицензировать серьезную субд и жечь 24x7 виртуалку. то же самое какой-нить стриминг. SaaS сервис где ты платишь только за выкаченные/записанные месседжи запросто могут быть дешевле чем жечь 24x7 виртуалки

«Облака были созданы, потому что все задолбались»: в чём отличие облачной инфраструктуры от своих серверов

bigdata-dev Mar 2 2021 at 14:16

где-то к 19 годам приходит понимание, что против уборщицы с тряпкой игровой ПК беспомощен.
к 20 для чего люди ставят пожарную систему, к 24 годам что жечь 24х7 виртуалку невыгодно, на фоне SaaS.

«Облака были созданы, потому что все задолбались»: в чём отличие облачной инфраструктуры от своих серверов

bigdata-dev Mar 2 2021 at 13:28

нормально там объясняют — используйте SaaS сервисы и не тупо жгите 24x7 виртуалки.

Hadoop мертв, да здравствует Hadoop! Или что новенького в Cloudera?

bigdata-dev Feb 26 2021 at 16:19

нет. переподписки нет, запрос падает потому что не может получить свои законные 64G на Executor, который хоть и имеет 80G, но выполняет сразу несколько запросов.
Memory left in process limit: 9.51 GB

тому запросу еще 9.51 GB дозволялось скушать, но Executor уже съел свои 80GB лимита выполняя другие запросы. если убрать конкруентов, запрос замечательно исполняется.

Hadoop мертв, да здравствует Hadoop! Или что новенького в Cloudera?

bigdata-dev Feb 26 2021 at 14:10

как же так — в соседней теме я вам уже рассказывал, но вы предпочли слиться
habr.com/ru/company/itsumma/blog/539328/#comment_22622646
на счет «100500 ущлов 8 CPU 64 Gb» (tm) это реально рекомендация клоудеры. их хренатень под названием kudu рекомендует 1000 таблетов на узел, т.е. если у тебя тысяча таблиц, с сотнями партиций и всякие dev, uat, pre-prod разделы, понадобится невообразимое кол-во мелких узлов. и врятли 100500 хватит

Hadoop мертв, да здравствует Hadoop! Или что новенького в Cloudera?

bigdata-dev Feb 26 2021 at 12:03

$8k было до поглащения hdp, сейчас они нам $6к в месяц уже насчитали. не знаю, может бедным странам на востоке скидки какие дают, нам видно скидки не полагаются. но все равно, на кой кастрированный клоудерой хадуп, не имеющего полноценного решения даже за $240к? то что клоудера продвигает в своей коробке все равно мусор. Импала это по сути интерфейс на медленный hdfs, как источник к BI не годиться. Импала все тянет в инмемори, чуть серьезней нагрузка и executors ноды валятся с Memory limit exceeded. но самое потрясающее, что нода координатор тянет себе в память весь датасет, какой надо отдать клиенту.
поэтому к клоудере приходится ставить нормальную субд для ad-hoc BI запросов.

Hadoop мертв, да здравствует Hadoop! Или что новенького в Cloudera?

bigdata-dev Feb 26 2021 at 11:05

вы видно не в теме, mapr помер, hdp ушел на дно и был поглощен полуживой клоудерой. у клоудеры акции в глубоком минусе, явно облака все перетягивают.
клоудера вымогает $6к за узел в месяц. месяц Карл. 10 узлов тянут на $2M за 3 года. при том, что к клоудере все равно какую-то полноценную субд надо будет закупать. это сравнимо со всякими oracle exadata, если не дороже. при этом нам, к примеру, пришлось выкидывать их сборку spark, свой hue собирать и многое другое. в тюнинг Импалы у нас думаю тысяча человекочасов вложено и все равно валится с ошибками памяти.

Hadoop мертв, да здравствует Hadoop! Или что новенького в Cloudera?

bigdata-dev Feb 26 2021 at 08:07

в мире полно бесплатного софта, начиная с ubuntu и firefox, до ngnix и mariadb.
странный ход от клоудеры конечно. и ценник убийственный. может конечно в краткосрочной перспективе удастся вытянуть денег с тех кто подсел на бесплатную сборку, но в долгосрочном это убивает интерес к хадуп, который и так уже не на взлете.
большинство будет ориентироваться на альтернативы хадуп экосистемы, что то типа k8s+spark.

Apache Spark на Kubernetes: чем полезен Apache YuniKorn

bigdata-dev Feb 26 2021 at 08:06

да, тоже интересно куда предлагается писать спарку в клоудеровской k8s? на hdfs?

Как мы переходили на Java 15 или история одного бага в jvm длиной в 6 лет

bigdata-dev Feb 12 2021 at 12:23

у нас миграция с cloudera 5.x на 6.x заняла более года. когда мы будем готовы запустить что-то на кластере уже java 20 будет деприкатед, а клаудера будет мертва.

Как мы переходили на Java 15 или история одного бага в jvm длиной в 6 лет

bigdata-dev Feb 12 2021 at 12:09

я проверял на винде, локально map-reduce и spark 2.4 работают на java 15. т.е. что-то делать сейчас на 8, что бы потом переделывать, смысла нет. следующий хадуп уже не запуститься на 8.

Как мы переходили на Java 15 или история одного бага в jvm длиной в 6 лет

bigdata-dev Feb 12 2021 at 10:01

на жава большинство работает в серьезных канторах, соответственно не будут переделывать проекты, что бы пописать на груви или скале. а вот ради синтаксического сахарка с текстовыми блоками, var, рекордами — почему бы и нет. никто же не требует в одну ночь перевести весь проект, сервисов то много.
пока ты выявишь и углубишься в проблемы на 15, как раз и выйдет 17.

-1

Самый большой радиотелескоп снял место посадки Apollo 15

bigdata-dev Feb 5 2021 at 13:09

заинтригован. а пояснения будут как он увидел Аполон на обратной стороне Луны?

-8

Зарплаты украинских разработчиков за 2020 год. В среднем — $2500

bigdata-dev Feb 2 2021 at 12:36

переместили в фолдер «спам» приглашение об опросе :)

Медведев заявил о технической готовности РФ сделать Рунет автономным

bigdata-dev Feb 1 2021 at 16:44

опять с телеграмом задумали бороться?

1 2