Побуду немного адвокатом дьявола, ибо статья вызывает столько вопросов, что её даже комментировать не вижу смысла.
1) "Delta Lake от Linux Foundation"
Ну не, изначально это поделка бриксов и в 2019 году они его заопенсорсили. Так что мимо. https://www.databricks.com/blog/2019/04/24/open-sourcing-delta-lake.html "With the advent of Delta Lake, we are seeing Databricks customers building reliable data lakes effortlessly at scale. Now we are open sourcing the Delta Lake project for the broader community to benefit as well."
2) "ни одна надстройка над файликами ACID не поддерживает"
А давайте без страшных тайн, почему собственно ACID на уровне таблиц это не ACID, можете раскрыть мысль? Какой из пунктов ACID накладывает подобное ограничение и что конкретно по этим пунктам нарушается?
И вообще, а классическая транзакционная СУБД это не "надстрока над файликами"?
Я еще больше страшную вещь открою, используя "нативный" спарк, мы еще и ограничены не только одной таблицей, но и одной action, ибо явных транзакций у нас нет и ACID гарантии применяются только к действиям выполняемым в рамках одной операции на одной таблице. Но тем не менее, эти гарантии есть, и, разумеется, специфичные для OLAP инструментов.
Что происходит, когда многоработничество раскрывает работодатель? Сотрудника просят бросить другие источники дохода.
Вопрос, а почему раскрывает? Зачастую неэффективный сотрудник, качество работы которого примерно сопоставимо с 2 часами работы в день и не на связи с командой. Его просят не бросить другие источники дохода, а избавляются от него.
В IT можно работать на двух работах и укладываться в 8 часов.
Можно. Иногда. А что ты будешь делать, когда нельзя? Или когда вчера можно было, а этот месяц (или год) нельзя. И сразу на двух проектах. Или переоценил свои силы. Зрелище печальное в обе стороны, я видел это что на многих примерах.
Если твой труд измеряют по результатам, не важно, сколько у тебя работ.
Все так, у меня на проекте есть человек, который еще подрабатывает на одном проекте. Но работает так, что мне абсолютно пофиг где он и сколько еще работает и я даже готов прикрывать в критичный момент. Но он так работает не потому, что уделает работе 2 часа в день, это точно.
Но сейчас компании не умеют оценивать труд в IT, а с AI сотрудники добиваются крейсерской эффективности.
Вот уж точно, что AI позволяет проще создавать иллюзии крейсерской эффективности для компании. Но вот по факту тут речь о том, что надо искать компании которые не умеют правильно оценивать труд. Это да, работает. Иногда без последствий. Я видел целую команду которая адаптировалась работать понемногу для клиента и в команде все были довольны происходяшим. Откуда я знаю? Меня приглашали спасать этот проект для критичного клиента.
Две работы позволяют расти как разработчик в два раза быстрее.
Миф. А пять работ в пять раз быстрее? Если работать полноценно, то ты не успеваешь развиваться, сфокусирован на решение задач, быстро что то клепаешь через AI до конца часто не разбираясь до конца, нет времени рефлексировать и систематизировать. А если работать мало, то про какое развитие речь? Работай не по 2, а по 8 часов и внезапно будешь развиваться в 4 раза быстрее.
Про «Собеседовать стало проще». Тут скорее кандидатам стало собеседоваться проще. Как следствие, они больше работают с большим числом предложений. Отчасти поэтому компаниям приходится идти на сокращение цикла интервью, и стали появлятья one day offer и мемы про то, что «собеседуйте быстрее, к концу собеседования кандидат уже вырастает в цене». Так что теперь, чтобы получить одного сотрудника приходится проводить больше собеседований.
Я к этому отношусь проще. Сохраняю интересные книги по всем релевантным мне темам (аналитика, разработка, тестирование, ML, инфра и т.п.). Их дофига. Но когда надо что-то резко изучить или покопать по конкретной теме, вуаля, у меня есть сравнительно небольшая подборочка по нужной мне теме, которую реально пролистать за пару дней и разобрать наиболее интересные места. Ибо часть книг слегка треш когда на них посмотришь. Выручало не раз и никакой трагедии по поводу того что «о-божечки-я-не-читаю-книги-которые-скачиваю» не испытываю)
Побуду немного адвокатом дьявола, ибо статья вызывает столько вопросов, что её даже комментировать не вижу смысла.
1) "Delta Lake от Linux Foundation"
Ну не, изначально это поделка бриксов и в 2019 году они его заопенсорсили. Так что мимо. https://www.databricks.com/blog/2019/04/24/open-sourcing-delta-lake.html "With the advent of Delta Lake, we are seeing Databricks customers building reliable data lakes effortlessly at scale. Now we are open sourcing the Delta Lake project for the broader community to benefit as well."
Плюс посмотрите кто контрибьютит в спецификацию формата, большинство явно сотрудники Databricks
https://github.com/delta-io/delta/commits/master/PROTOCOL.md
2) "ни одна надстройка над файликами ACID не поддерживает"
А давайте без страшных тайн, почему собственно ACID на уровне таблиц это не ACID, можете раскрыть мысль? Какой из пунктов ACID накладывает подобное ограничение и что конкретно по этим пунктам нарушается?
И вообще, а классическая транзакционная СУБД это не "надстрока над файликами"?
Я еще больше страшную вещь открою, используя "нативный" спарк, мы еще и ограничены не только одной таблицей, но и одной action, ибо явных транзакций у нас нет и ACID гарантии применяются только к действиям выполняемым в рамках одной операции на одной таблице. Но тем не менее, эти гарантии есть, и, разумеется, специфичные для OLAP инструментов.
Вопрос, а почему раскрывает? Зачастую неэффективный сотрудник, качество работы которого примерно сопоставимо с 2 часами работы в день и не на связи с командой. Его просят не бросить другие источники дохода, а избавляются от него.
Можно. Иногда. А что ты будешь делать, когда нельзя? Или когда вчера можно было, а этот месяц (или год) нельзя. И сразу на двух проектах. Или переоценил свои силы. Зрелище печальное в обе стороны, я видел это что на многих примерах.
Все так, у меня на проекте есть человек, который еще подрабатывает на одном проекте. Но работает так, что мне абсолютно пофиг где он и сколько еще работает и я даже готов прикрывать в критичный момент. Но он так работает не потому, что уделает работе 2 часа в день, это точно.
Вот уж точно, что AI позволяет проще создавать иллюзии крейсерской эффективности для компании. Но вот по факту тут речь о том, что надо искать компании которые не умеют правильно оценивать труд. Это да, работает. Иногда без последствий. Я видел целую команду которая адаптировалась работать понемногу для клиента и в команде все были довольны происходяшим. Откуда я знаю? Меня приглашали спасать этот проект для критичного клиента.
Миф. А пять работ в пять раз быстрее? Если работать полноценно, то ты не успеваешь развиваться, сфокусирован на решение задач, быстро что то клепаешь через AI до конца часто не разбираясь до конца, нет времени рефлексировать и систематизировать. А если работать мало, то про какое развитие речь? Работай не по 2, а по 8 часов и внезапно будешь развиваться в 4 раза быстрее.
Где в статье хоть слово про борьбу за миллисекунды? Про время тут говорят с погрешностью в несколько секунд. В целом кликбейт.
Напрашивается шаг 12: Сменить пол