Comments / Profile of Yo1 / Habr

если бы он посидел на проекте дольше двух недель врядли бы рассказывал о ненужности хадуп админа в менеджет хадупе облака. acid в хадупе говорит о том, что далее рекламных брошюрок он не смотрел. кое где в халупе есть атомарность на уровне таблицы, но никак не acid.

Look

Строим аналитическое хранилище данных с готовыми модулями ML на Google BigQuery: просто, быстро, доступно

Yo1 Aug 6 2021 at 11:09

по мне так тоже разорительно выйдет. я полагаю текст был для примера, в реальности то никто не будет выкачивать каждый раз все со всех источников. т.е. придется воротить инкрементную загрузку, наверняка не раз в день и с постройкой истории.

значит будет некая MERGE команда на bigquery, она явно будет читать все хранилище накручивая счетчик.

а если еще захочется разные витрины ... может выйти слишком дорого.

Look

Пион-НКС №1 | Союз 2.1б

Yo1 Jun 22 2021 at 06:48

имел настолько мощный радар, что его пришлось обеспечить ядерным реактором.

не было там реактора, там ядерная батарея. распад сам по себе идет, без заоблачных температур.

Look

PHP — я бы купил это за доллар

Yo1 Jun 16 2021 at 20:58

не соглашусь. если бы это было так, мы бы видели крупные проекты на пхп. пхп же можно масштабировать, но крупных сайтов не видно

Look

PHP — я бы купил это за доллар

Yo1 Jun 16 2021 at 20:29

в контексте хайлоад о пхп не слышно на конференциях от слова совсем, я не углублялся в вопрос, но лично мне кажется очевидно, что не встречается из-за подхода с умиранием.

Look

PHP — я бы купил это за доллар

Yo1 Jun 16 2021 at 20:17

потому что вижу что пхп обкладывает себя костылями что бы нивилировать этот недостаток, а противоположный лагерь вытесняет пхп и на подход «умирать» не смотрит.
в контексте хайлоад о пхп не слышно на конференциях от слова совсем, я не углублялся в вопрос, но лично мне кажется очевидно, что не встречается из-за подхода с умиранием.

Look

PHP — я бы купил это за доллар

Yo1 Jun 16 2021 at 19:37

ну да, обходные пути есть. собственно они и подсвечивают то, что должно было бы быть в языке, что бы стать клевым в вебе.

Look

PHP — я бы купил это за доллар

Yo1 Jun 16 2021 at 18:09

пхп это это однопоточный скриптик, который по завершении теряет весь контекст. как на таком же что то сделать, ведь сайты это про многопоток и ассинхронность?
в 90х у пхп было понятие сессии, он на каждый хттп реквест лезла в базу и останавливала контекст пользователя. каждый раз. наверняка же ничего не изменилось.

Look

Паша Финкельштейн о Big Data, Apache Spark и DevRel

Yo1 Jun 15 2021 at 15:25

тем, кому интересно узнать, как работает Apache Spark. Мы научимся писать простенькие пайплайны на этом фреймворке. Станет понятно как, например, взять и написать пайплайн обработки данных на Apache Spark или проанализировать данные в датасете.

таких туториалов не одна и не две тыщи, на кой тысяча первый то?
самое обидное что именно по спарку и нифига нет на темы чуток сложней считать/записать.

Look

Cloudera Data Platform как многогранное ценностное предложение

Yo1 Jun 10 2021 at 15:14

10-20 нод это $300-600к за 3 года. если дело лишь в удобстве, точно ли удобство стоит таких денег? «HDFS+Kafka±Storm+Hive» не столь уж сложно развернуть с амбари и на ваниле, за $10-20k вам легко бы кто-то помог нарисовать скрипты для ванилы и еще тучи денег остались бы на эксперименты.

Look

Платформа данных в Леруа Мерлен – 2 года, сотни источников и более 2.000 пользователей

Yo1 Jun 10 2021 at 09:22

ну на s3 то у вас явно просто временное хранилище, а не дата лейк с витринами. там же персональные данные, так просто в папочку не набросаешь.
т.е. что бы начать анализ новых данных, вам надо пройти все квесты с очисткой и интеграцией этих новых данных в dwh и только после этого тянуть из dwh на анализ, где выяснится…

Look

Платформа данных в Леруа Мерлен – 2 года, сотни источников и более 2.000 пользователей

Yo1 Jun 9 2021 at 14:50

а как у кликхауса с join? я слышал он заточен на агригирование плейн таблиц, но очень не любит тяжелые джойны.

Look

Платформа данных в Леруа Мерлен – 2 года, сотни источников и более 2.000 пользователей

Yo1 Jun 9 2021 at 14:02

странный выбор для 2019 года. а как захороненное в dwh анализировать то теперь? тянуть через jdbc в spark? имхо сейчас все же стараются дата дейк разлить перед витринами в dwh.

Look

Cloudera Data Platform как многогранное ценностное предложение

Yo1 Jun 9 2021 at 12:53

я к тому, что клоудера не отменяет содержание штата админов, но если админы есть, нет особого смысла платить за дистр и погружаться в его странные нюансы.
без боли думаю не собрать, есть некие скрипты bigtop, говорят помогают в сборке и мне кажется это более перспективно, чем выяснять, чего клоудера выпилила из спарк.

Look

Cloudera Data Platform как многогранное ценностное предложение

Yo1 Jun 8 2021 at 08:52

а по мне бесполезная трата денег. более $10k в год за ноду, это совсем перебор и сравнимо с oracle exadata. on-perm даже заплатив, все равно нужны админы присматривать, ну и в чем смысл выкладывать как за exadata? разумней тем же людям платить чуток больше и собирать себе ванильный хадуп со свежим софтом.
тем более что перспективы у клоудеры не очень, никогда не было прибыли, генерирует лишь убытки. многих клиентов обманула, закрыв доступ репозиториям. т.е. те кто были вынуждены заплатить расстроены и в ближайшее время будет массовый отток клиентов что не по своей воли заплатили. не факт что клоудера это переживет, не зря ее на днях продали какому-то фонду.

Look

Озеро, хранилище и витрина данных

Yo1 Apr 29 2021 at 15:30

исправьте заголовок, озера данных — взгляд из индии.

Озеро данных (data lake) — это большой репозиторий необработанных исходных данных

может в индии это исходные данные, но Инмон описывает озеро с application pond, куда пишутся трансформируемые данные. databriks продвигает озеро с silver и golden таблицами, тоже после обработки и трасформации в их delta lake формат.

Look

Business Intelligence на очень больших данных: опыт Yota

Yo1 Mar 31 2021 at 07:32

там чуть выше товарищ утверждает, что на 5.х у них какие-то секретные договоренности с клоудерой, каких нет на 6.х.

Look

1 2

4 5 ...

18 19