tangro Jun 12 2017 at 09:26

Вы — не Google

7 min

103K

Инфопульс Украина corporate blogGoogle Cloud Platform*System Analysis and Design*High performance*Designing and refactoring*

Translation

+246

197

Comments 197

AlexLeonov Jun 12 2017 at 09:36

Статья напомнила одну компанию, в которой мне удалось (крайне недолго) поработать.

«Медовая» неделя, знакомлюсь с состоянием дел.

— А вот тут у нас основная база данных, мы сделали горизонтальный шард на 6 (шесть!) инстансов, запись в БД у нас делается специальной процедурой, вот тут в ней идет вычисление ключа шарда…
— Ну ОК, сделано довольно грамотно, молодцы. А сколько записей сейчас в самой большой таблице?
— 50 000…

facepalm.jpg

Я это называю «удовлетворять своё любопытство за счёт работодателя».

Biggo Jun 12 2017 at 13:06

Удовлетворять любытство за счет работодателя не такая уж и дурная идея. Ведь это ж лучше, чем за свой счет, не так ли?

AlexLeonov Jun 12 2017 at 13:14

Это отвратительная идея с точки зрения бизнеса.

Бизнесу, как ни странно, нужно решение его задач. Бизнес нанимает людей, наивно полагая, что они знают, как решать задачи бизнеса максимально эффективно.

Оказалось же, что задачу «сделать шардинг» никто не ставил, более того: она не была обоснована необходимостью решения какой-либо бизнес-задачи.

А теперь представьте себе. Скажем, три человека (тим-лид и два его подчиненных) в той или иной мере 2-3 месяца работали над реализацией этой идеи (я про ненужный шардинг, если вы не забыли). Грубый подсчет дает около полутора миллионов рублей, потраченных за это время только на их зарплату с начислениями. И это я еще не считаю стоимость аренды и оборудования рабочих мест и прочие косвенные расходы.

То есть ребята взяли и просто так, без всякой необходимости, распылили в воздухе полтора чужих миллиона. Потому что им стало любопытно.

Я думаю, что если бы им предложили возместить расходы, они бы сильно задумались в следующий раз, стоит ли проводить такие эксперименты.

Biggo Jun 12 2017 at 13:24

Да, бизнес от этого может пострадать, но только в случае, описанном вами. Представьте себе другую ситуцию, в которой разработчики пытаются рости в профессиональном плане и их инициатива не стоит компании сильно бОльших денег, чем какой либо иной подход. Не смотря на то, что казалось бы бизнесу надо быстрее и дешевле, эксперименты(удачные, пусть и требующие чуть большего времени) могут оказаться полезнымии самому бизнесу в среднесрочной или долгосрочной перспективе. Потому что на выходе мы имеем:
1. Запас по прочности и масштабируемости(для приведенной выше ситуации)
2. Прокаченных и довольных разработчиков, которые могут решать теперь и более сложные задачи.

DrPass Jun 12 2017 at 13:31

Да, бизнес от этого может пострадать, но только в случае, описанном вами. Представьте себе другую ситуцию, в которой разработчики пытаются рости в профессиональном плане и их инициатива не стоит компании сильно бОльших денег, чем какой либо иной подход

В подавляющем большинстве случаев работодателю нужно оптимальное решение задачи подходящим инструментом в оптимальные сроки. Что подразумевает отсутствие экспериментов с незнакомыми платформами. Ну просто потому, что даже если платформа и решает поставленную задачу (по слухам, которые донеслись из Stack Overflow и прочих интернетов), то в 99% случаев незнакомый с ней разработчик потратит непозволительное количество времени на набивание шишек и обход подводных камней. И если и вправду она такая хорошая, то при осознанном выборе зовут сторонних консультантов, имеющих опыт работы с ней, и внедряют под их руководством, одновременно обучая своих специалистов. В этом случае как раз на выходе будет и запас по прочности, и прокачанные свои разработчики.
А когда собственный разработчик убеждает работодателя: «А давайте возьмем эту новую клёвую штуку и попробуем сделать проект на её основе», при том, что инструмент ему незнакомый, но ему интересно просто с ним поработать, то это, как правило, чистой воды халтура и обман своего работодателя.

SirEdvin Jun 12 2017 at 19:15

Что подразумевает отсутствие экспериментов с незнакомыми платформами

А если задача ставится так, что оптимально использовать незнакомые платформы, по сравнению с знакомыми? Например, вы всегда работали с postgresql, а тут вам нужен полнотекстовый поиск с кучей других параметров.

И опять же таки, в подавляющем большинстве случаев vision проекта (а его может и не быть) может кардинально менятся, и выбрать один инструмент, а не другой в итоге может получится выгоднее, хотя и не очень видно вначале.

AlexLeonov Jun 12 2017 at 19:29

А если задача ставится так, что оптимально использовать незнакомые платформы, по сравнению с знакомыми? Например, вы всегда работали с postgresql, а тут вам нужен полнотекстовый поиск с кучей других параметров.

Найдите специалиста по незнакомой платформе и оплатите консультацию. Это будет на порядки дешевле, чем по вляпаться в зря потерянное время по причине своей некомпетентности и нежелания эту некомпетентность признавать.

И опять же таки, в подавляющем большинстве случаев vision проекта (а его может и не быть) может кардинально менятся

Меняются требования — перепроектируем. Это нормальный процесс.

SirEdvin Jun 12 2017 at 20:13

Найдите специалиста по незнакомой платформе и оплатите консультацию. Это будет на порядки дешевле, чем по вляпаться в зря потерянное время по причине своей некомпетентности и нежелания эту некомпетентность признавать.

Или взять некомпетентного специалиста на коснультацию. Ведь шанс напоротся на некомпетентного специалиста особенно на рынке СНГ довольно велик, ведь вы не знаете технологию нормально.

avkoval Jun 13 2017 at 05:12

> Найдите специалиста по незнакомой платформе и оплатите консультацию

Иногда сделать это будет значительно дороже, чем разобраться самим. Имеем: компетентную команду, застафленную на проекте, которой поставлена задача на исследование оптимальной технологии для данного бизнеса. Принимать решение о привлечении внешнего специалиста команда сама не может, при этом уровня локальных специалистов вполне достаточно чтобы разобраться с новыми незнакомыми технологиями.

Так бывает достаточно часто — над проектами работают сложившеяся команды. Да, конечно же удобно когда те технологии, которые полностью знакомы команде совпадают с текущими задачами, но что делать если нет? Сразу вот так вот менять команду? Добавлять/менять специалистов? Время и ресурсы потраченные на это часто превысят расходы на до-обучение текущих.

Мы обычно сами пытаемся решить возникающие трудности, привлекаем специалистов для коротких консультаций, но честно, этих специалистов-архитекторов не очень то и много, и почти никто не занимается фрилансом, т е в выгодном свете здесь стоит корпоративная разработка, где есть пул архитекторов решений, а для маленьких команд проще всё таки опираться на свои силы.

Ну и главное — почти все решения не окончательны. Всегда можно что то попробовать, fail fast, и вернуться на правильный путь. Путём небольших экспериментов продвигаться к цели.

VolCh Jun 13 2017 at 08:52

Найдите специалиста по незнакомой платформе и оплатите консультацию.

Разработчик, пускай даже глава разработчиков оплатить может разве что из своего кармана, как правило.

Это будет на порядки дешевле, чем по вляпаться в зря потерянное время

В плане затрат, как правило, не на порядки. Разовые коммерческие консультации стоят порядка месячной зарплаты штатного разработчика минимум при сроках порядка недели. Хотя бы потому что в цену входит не только зарплата специалиста, но и зарплаты персонала от уборщицы до гендира, плюс прибыль.

grossws Jun 13 2017 at 09:52

В плане затрат, как правило, не на порядки. Разовые коммерческие консультации стоят порядка месячной зарплаты штатного разработчика минимум при сроках порядка недели.

Это как-то сильно близко к себестоимости, если мы ищем спеца высокого уровня для консультации мидлов.

VolCh Jun 13 2017 at 13:33

Я про консультации спецов высокого уровня спецом высокого уровня по неизвестной первым технологии. Грубо — 300% накрутки к зарплате спеца по популярным темам.

AlexLeonov Jun 12 2017 at 13:32

Да не вопрос. Пожалуйста. Но при соблюдении двух условий:

1. Затраты на эксперименты и «прокачку» разработчиков посчитаны, хотя бы в условных человеко-часах, что позволяет оценить себестоимость, и доведены до бизнеса.
2. Бизнес согласен на такие затраты. Причем согласие тоже зафиксировано каким-то образом, а не на уровне «Ну мне Петя сказал, что можно этим заниматься».

Ansin Jun 13 2017 at 09:08

1. Затраты на эксперименты и «прокачку» разработчиков посчитаны, хотя бы в условных человеко-часах, что позволяет оценить себестоимость, и доведены до бизнеса.

Посчитаны кем? Разработчиками? С чего вдруг? А если бизнес не счел нужным посчитать — почему разработчик этим должен заниматься? Причем в рабочее время, ага, которое тоже, между прочим, денег стоит.

2. Бизнес согласен на такие затраты. Причем согласие тоже зафиксировано каким-то образом, а не на уровне «Ну мне Петя сказал, что можно этим заниматься».

Если речь идет о ФОТ — то он будет, при условии что бизнес доволен конечным результатом. Причем этот результат — с т.з. бизнеса, а не наши с вами рассуждения об избыточности примененной технологии. Выплаченная ЗП — это и есть подтверждение согласия, увольнение — неподтверждение.

AlexLeonov Jun 13 2017 at 09:25

Посчитаны кем? Разработчиками? С чего вдруг?

С того, что в любой методике разработки первичная оценка дается исполнителем. Это совершенно нормальная часть любого процесса.

— Тут надо применить Монгу
— ОК, сколько тебе примерно надо времени, чтобы попробовать и решить точно?
— Ну дня три…
— Хорошо, пишем 40 часов на research

Выплаченная ЗП — это и есть подтверждение согласия, увольнение — неподтверждение.

Как-то у вас всё категорично :)

relia Jun 13 2017 at 09:32

Посчитаны кем? Разработчиками? С чего вдруг? А если бизнес не счел нужным посчитать — почему разработчик этим должен заниматься? Причем в рабочее время, ага, которое тоже, между прочим, денег стоит.

Не Вам конкретно, но вообще:

В нормальных бизнесах исследования новых решений должны идти особняком, а не при выполнении текущего заказа от клиента (исключая случаи, когда это нужно именно здесь и сейчас и сам факт эксперимента согласован с заказчиком и он согласен это оплачивать). Заказы выполнять надо только с помощью проверенных разработчиком решений.
Но такая схема работает только в случае, когда цену на свои услуги разработчик нормально формирует, закладывая в расчеты себестоимости и затраты на эти исследования и повышение квалификации персонала, а не тупо «ЗП + 100% наценки + любой наш каприз за ваши деньги». Работающие по последней схеме долго не выживают — их первые методично сожрут рано или поздно.

qw1 Jun 13 2017 at 11:39

Что значит «проверено разработчиком»?
Разработчик написал игрушечное demo-приложение?
Так все нюансы проявляются только в реальном проекте, и иногда не в первый месяц разработки.

relia Jun 13 2017 at 11:44

Именно это и значит: разработчик перед предложением мне использовать какую-то технологию должен, как минимум, прочесть ее описание и сделать в ней хотя бы с десяток-другой тестовых «Hello world». И если бы так и происходило всегда и везде, то в этой статье не было бы примера с использованием Амазоновской Кассандры.

qw1 Jun 13 2017 at 11:47

И в чём разница между MySQL и Кассандрой для Hello-world приложения?
Стандартный деплой СУБД контейнером, стандартные компоненты доступа, малый объём тестовых данных, никакой разницы не заметишь.

relia Jun 13 2017 at 11:52

малый объём тестовых данных, никакой разницы не заметишь

Генерация тестовых данных, нагрузочные тесты, не? Тогда почитайте о бенчмарках баз данных — многие «решения» отпадут даже после их прочтения. А потом можно провести по этим методикам и свои исследования.

Вы отрицаете самое главное: что бы быть в мейнстриме надо не просто распихивать модные фишки направо и налево, а предлагать клиентам апробированные хотя бы на тестах решения. Для этого нужно постоянно выделять ресурсы и время на исследования и обучение. Конечно если Вы строите бизнес, а не стрижете капусту здесь и сейчас.

VolCh Jun 13 2017 at 13:36

Вы про коммерческую разработку для внешних заказчиков? Как быть с чисто внутренними проектами?

relia Jun 13 2017 at 13:40

В смысле? Свой собственный саппорт какого-либо ИТ-решения, используемого в рабочем процессе компании? И как быть с чем? С нагрузочными тестами? Почему у Вас не получается?

VolCh Jun 13 2017 at 13:53

Собственный отдел разработки не ИТ-компании, например.

Как быть с "предлагать клиентам апробированные хотя бы на тестах решения"? На каком уровне должен решаться вопрос "давайте попробуем новую технологию", если бизнес (внутренний заказчик) не отличит ReactJS от ReactOS?

relia Jun 13 2017 at 14:04

Как быть с «предлагать клиентам апробированные хотя бы на тестах решения»?

Очень просто: если руководство поставит мне задачу «должен появиться вот такой-то воркфлоу» и я начну его реализовывать применением нового хромированного молотка за 100500 баксов по антикварному хрусталю, то пойду искать другую работу.

На каком уровне должен решаться вопрос «давайте попробуем новую технологию», если бизнес (внутренний заказчик) не отличит ReactJS от ReactOS?

Внутри службы. Но руководитель службы несет ответственность за этот выбор. И, в случае фиаско зачастую идет искать другую работу.

:) :)

Или Вы про клинические случаи, когда руководители не просто отдают заявку «нам надо то-то и то-то» в работу ИТ-службе, а еще и указывают чем и где это реализовывать? Тогда все равно рано или поздно лучше начать искать другую работу :)

qw1 Jun 13 2017 at 14:52

и я начну его реализовывать применением нового хромированного молотка за 100500 баксов по антикварному хрусталю, то пойду искать другую работу

А иначе можно всю жизнь на Фортране просидеть. Как руководство поймёт, что это хромированный молоток, а не самый подходящий инструмент для задачи?

relia Jun 13 2017 at 14:55

Как руководство поймёт, что это хромированный молоток, а не самый подходящий инструмент для задачи?

А Ваше руководство счета подписывает не глядя? Куда слать резюме?

qw1 Jun 13 2017 at 15:00

Счета на закупку лицензий или какие?
Хромированным молотком может быть и бесплатный ClickHouse.

relia Jun 13 2017 at 15:07

Хромированным молотком может быть и бесплатный ClickHouse.

Я без руля что это, но если Главная Система упадет, и это произойдет по причине того, что простую задачку, решаемую небольшой допиской существующими инструментами, Вы решили с помощью какого-то новомодного ClickHouse, который Вам просто понравился на рекламном баннере, то таки хороший штраф или искать другую работу.

PS
Не вижу смысла обсуждать сферических коней в вакууме, которых Вы вырисовываете на основании моих предыдущих ответов. Можете считать, что Вы победили.

VolCh Jun 14 2017 at 08:33

если руководство поставит мне задачу «должен появиться вот такой-то воркфлоу» и я начну его реализовывать применением нового хромированного молотка за 100500 баксов по антикварному хрусталю, то пойду искать другую работу.

А если вы его начнёте реализовывать с изобретения палки-копалки?

Внутри службы. Но руководитель службы несет ответственность за этот выбор. И, в случае фиаско зачастую идет искать другую работу.

О чём и речь. Выбирают техсредства техспециалисты, а не бизнес. Бизнес может доверять выбор полностью (если он условно бесплатный), может требовать ТЭО различного уровня детализации и достоверности, может применять меры дисциплинарной ответственности за выходы из бюджетов/сроков и т. п. — это его решения.

reinvent Jun 14 2017 at 07:59

Наверное, в таком случае надо спросить работодателя, не против ли он таких экспериментов за его деньги. И в подавляющем большинстве случаев работодатель скажет, что ему нужно решение задачи (он сам определит — тактической или стратегической) минимальными средствами. В этом смысл бизнеса и конкурентоспособности. Никому не приходит в голову строить склад на 100.000 метров, когда продукции на 10.000 метров).
Теперь понятно, почему в разных компаниях стоимость одних и тех же решений задач отличается в десятки раз. Бизнес в незавидном положении.

VolCh Jun 14 2017 at 08:48

На ассемблере решать задачи того же складского учёта?

Суть сколь-нибудь оригинальной разработки в экспериментах на всех уровнях. Нет "золотых пуль".

reinvent Jun 18 2017 at 20:00

Ресурсы должны подбираться адекватные задачам. А если берется что-то суперское по принципу «там точно все есть, надо или не надо» — это, наверное, не вполне эффективно.

VolCh Jun 19 2017 at 09:55

Адекватность — понятие субъективное. Какой выбор по вашему более адекватный — берём фреймворк, закрывающий 90% функциональности, пускай и содержащий ещё 400% кода, который использовать в обозримом будущем не планируется, или берём набор библиотек, закрывающий процентов 50 функциональности, а остальное пишем сами?

DrPass Jun 19 2017 at 10:07

В этом случае скорее всего правильный первый вариант. Лишь бы не было так, что «берём фреймворк, закрывающий 30% функциональности и 500% ненужного кода, а остальное пишем, пилим, и лепим воркэраунды для неподдерживаемых, но нужных фич. Просто потому, что он сейчас модный». К сожалению, этот вариант не редкость.

AlexLeonov Jun 22 2017 at 20:35

и содержащий ещё 400% кода, который использовать в обозримом будущем не планируется

А вы что конкретно экономите-то? Место в пять мегабайт на диске под «неиспользуемый» код?

И нужно ли его экономить?

DrPass Jun 23 2017 at 08:56

А вы что конкретно экономите-то? Место в пять мегабайт на диске под «неиспользуемый» код?

Обсуждать некий абстрактный теоретический фреймворк — дело неблагодарное, но в общем случае «400% ненужного кода» совсем не означает, что он просто лежит на диске и никому не мешает. Он может быть задействован, негативно влиять на производительность приложения, наконец, содержать баги и нежелательные фичи, которые как-то влияют на остальные 100% нужного и полезного кода. Поэтому тут каждый конкретный случай надо рассматривать отдельно.

AlexLeonov Jun 23 2017 at 10:11

«Ненужный» может быть задействован. ОК.

DrPass Jun 23 2017 at 12:38

«Ненужный» может быть задействован. ОК.

Вы зря так это скептически восприняли. Это не какая-то неожиданность, а повсеместная практика. Вот, например, простое веб-приложение на ASP.NET MVC. Я там использую один классический маршрут «сущность\идентификатор», под него контроллер и пару представлений. Фрейморк мне пошарится в поисках кастомных обработчиков, поищет файлы на диске, поищет фильтры и т.д.
Весь этот код для решения моей задачи совершенно ненужный. Но фреймворк так устроен, этот код там есть для других целей и других задач, и я никуда от него не денусь, он будет и в моём приложении и будет вызываться при обработке каждого запроса.

reinvent Jun 23 2017 at 12:11

Покупаю принтер, проприетарный драйвер 80 мб.
Файл настройки под сервер печати Линукс — 20 кб (при этом файлы, к примеру, от Самсунга подходят для Ксерокса).
Мне кажется, что-то здесь не так. Мало того, что место на диске, он еще и висит в процессах.

mayorovp Jun 23 2017 at 05:38

Надо еще учитывать, что некоторые фреймворки, закрывая какую-то функциональность, увеличивают стоимость оставшейся функциональности.

andreysmind Jun 27 2017 at 08:46

Адекватно было бы не придумывать синтетический пример, который явно показывает преимущество одного из вариантов.
А почему я не могу взять набор библиотек закрывающий процентов 95% функциональности, а остальное написать сам?

RPG18 Jun 12 2017 at 13:41

Это отвратительная идея с точки зрения бизнеса.

А где в этот момент был бизнес, почему он не контролировал?

AlexLeonov Jun 12 2017 at 13:42

Хороший вопрос, но, думаю, не для обсуждения здесь.
Вкратце: поверили вместо «проверили». Более подробно вряд ли смогу здесь рассказать.

xcore78 Jun 12 2017 at 14:06

Почему же, вполне для обсуждения здесь.

Некомпетентность сверху привела к некомпетентности снизу (я считаю тезис о том, что только такая причинно-следственная связь возможна, доказывать не требуется).

DrPass Jun 12 2017 at 14:14

Некомпетентность сверху привела к некомпетентности снизу

Почему некомпетентность? Обычное делегирование полномочий. Топ-менеджмент доверяет руководителю ИТ-департамента в этом плане, а тот также выбором фреймворков не занимается, а делегировал это своим девелоперским подразделениям.
Такое точно делегирование и в финансовом учете, и в маркетинге, и в производстве. Просто специфика разработки софта такова, что у программистов обычно возникает и желание, и возможность поковыряться в чём-то новом сугубо для утоления любопытства. Такого нет ни в маркетинге, ни в бухгалтерии.

RPG18 Jun 12 2017 at 14:23

руководителю ИТ-департамента в этом плане, а тот также выбором фреймворков не занимается

А тогда что у вас делает CTO? Делегирует дальше и зарплату получает, а ответственность на ком?

AlexLeonov Jun 12 2017 at 14:32

CTO, к сожалению, может преследовать свои цели, перпендикулярные целям бизнеса. Например «имитировать бурную деятельность и занятость, чтобы не сокращался поток бабла».

Поверьте, так тоже бывает.

RPG18 Jun 12 2017 at 17:39

Все всегда преследуют свои интересы. Тот же архитектор может преследовать сделать самую совершенную систему с масштабированием и отказоустойчивостью.

AlexLeonov Jun 12 2017 at 17:47

Зачем?

Вменяемый архитектор сначала уточнит бизнес-требования, а затем превратит их в технические.

У вменяемого архитектора не может быть своих интересов, не обусловленных требованиями бизнеса, ведь вполне может стать так, что бизнесу просто не нужно никакое масштабирование. И отказоустойчивостью в разумных пределах тоже можно пренебречь.

Если он это не понимает — он не архитектор пока еще.

SirEdvin Jun 12 2017 at 19:13

Архитектор же должность. Разве нет?

Все люди подвержены своим интересам, и архетектор в том числе. Превращение бизнес-требований в технические не очень однозначный процесс, так что тут остается простор для своих решений в духе "у меня был полезненный опыт касательно X, так что тут я заложу масштабирование, даже если заказчик не хочет, то он точно захочет это в дальнейшем и так далее",

AlexLeonov Jun 12 2017 at 19:31

Архитектор — это роль.
Если ресурсы позволяют вам иметь выделенного «освобожденного» архитектора — я вас поздравляю, такое случается нечастно.

я заложу масштабирование, даже если заказчик не хочет

Об этом и был мой самый первый коммент. Удовлетворение своего любопытства за чужой счет. Имхо, один из самых страшных грехов «разработчиков», которые никак не хотят понять, что «творцы тут не нужны» (с)

SirEdvin Jun 12 2017 at 20:12

Это не удовлетворение любопытства. Архитектор уже делал много таких систем и у него это скажем, больное место. Он в каждую систему добавляет масштабирование не из интереса, а потому что так правильно и так или иначе будет нужно в дальнейшем, по его мнению.

DrPass Jun 12 2017 at 14:40

А тогда что у вас делает CTO?

СТО должен заниматься стратегическими вопросами — в каком направлении развивать ИТ инфраструктуру. Финансовыми вопросами по своей части — определять и защищать бюджеты на поддержание и развитие ИТ, и обеспечивать контроль их выполнения. Планированием работ по своей зоне ответственности должен заниматься. Должен контролировать приоритетные ИТ-задачи для бизнеса. Ну а фреймворки — это уже ответственность системного архитектора (иногда в одном лице с тимлидом), а никак не СТО.
Ну т.е. когда проблема всплывёт, как раз СТО будет раздавать люлей своим подчинённым, и будет отчитываться перед руководством компании, что-то сочинять про «обстоятельства, которые невозможно было предусмотреть на этапе проектирования». Но вот на уровне СТО заранее избежать подобной проблемы, как правило, действительно не получается.

RPG18 Jun 12 2017 at 17:41

А кто требования к системе формирует? Архитектор лишь создает архитектуру исходя из требований и ограничений(в том числе и финансовых)

DrPass Jun 12 2017 at 20:11

А кто требования к системе формирует?

Требования к системе формирует бизнес. Или продакт-менеджер, если разрабатываемый софт не для внутреннего потребления, а для внешних клиентов. И в требованиях могут быть условия «нужно реализовать интеграцию с Х» или «нужно уметь выполняться в среде Y», но практически никогда не бывает условий «нужно писать на фреймворке Z». Этот Z уже определяется архитектором, исходя из его видения, насколько Z подходит для решения задачи.

splav_asv Jun 12 2017 at 21:59

Распространённое заблуждение: делегирование задач не означает делегирование ответственности. Ответственность перед бизнесом остаётся у делегирующего, а у того, кому делегируют появляется ответственность перед делегирующим. «Вассал моего вассала — не мой вассал»

DrPass Jun 12 2017 at 23:13

Я, честно говоря, не понял — вы таким образом решили подтвердить мой пост, или наоборот, возразили мне, не прочитав его до конца?

xcore78 Jun 12 2017 at 14:24

Вы совершенно правы, но мы с вами разговариваем про разные вещи, а именно про конкретную реализацию и общую механику соответственно.

В контексте существовала определенная ситуация.

VolCh Jun 13 2017 at 08:57

Сугубо для утоления любопытства, это, пожалуй, редкость. Чаще сочетание двух основных факторов в той или иной пропорции:

повышение (или хотя бы не понижение) своей востребованности на рынке труда
решение текущих проблем разработки и эксплуатации

По второму фактору, увы, разработчики часто ведутся на маркетинг, то есть проблема реально есть, и разрекламированный инструмент вроде как её должен решить судя по рекламе. Но подводные камни и(или) полная цена решения проблемы разработчику неизвестны.

botyaslonim Jun 13 2017 at 07:34

Это очень сложный вопрос, на самом деле. Насколько компетентен бизнес в том, чтобы контролировать новые технологии. Другая опасность, которая может ждать бизнес в таком случае: «зачем делать что-то новое, если у нас сайт работает на Joomla 1.5 и есть не просит уже 10 лет?»

botyaslonim Jun 13 2017 at 07:21

С другой стороны, если посмотреть диалектически, завтра тому же бизнесу вдруг срочно потребуются люди, знающие о крупных распределённых системах. И возьмёт их бизнес на рынке, потому что существует достаточно специалистов, уже освоивших эти технологии за чужие деньги.

AlexLeonov Jun 13 2017 at 08:09

Вы опять путаете причину со следствием. Бизнесу обычно не нужны никакие «крупные распределенные системы». Им нужны продажи, расширение рынков, поле для маркетинговых экспериментов, новые каналы продаж, обратная связь с клиентами и так далее.

То, что эти потребности бизнеса будут удовлетворяться «распределенной системой» — это уже техническое решение. И не факт, что верное.

botyaslonim Jun 13 2017 at 08:14

Это всё понятно. Но я призываю смотреть на процесс шире, диалектически. Завтра бизнесу могут понадобиться специалисты другой квалификации. Здесь и сейчас понадобятся (долго обучать за свои деньги у нас никто не стремиться). И он их выхватит с рынка, потому что на рынке уже есть специалисты, ранее изучившие новые технологии.
Конечно, кажется, что дела идут вразрез с идей оптимизации затрат каждого конкретного бизнеса, но зато существует экосистема как таковая. Некая избыточность для системы — благо, именно избыточность даёт ресурс для быстрого развития.

AlexLeonov Jun 13 2017 at 08:48

А я призываю смотреть на процесс честнее и объяснять тому, чьи деньги вы собрались тратить — на что именно они будут потрачены.

Вполне возможно, что бизнес просто не захочет оплачивать избыточность, осознав, что она ему не нужна. А вы, не сказав про альтернативу и заложив в архитектуру эту избыточность, фактически просто обманете заказчика.

Смысл всех моих комментов можно свести к фразе «Обманывать — нехорошо».

botyaslonim Jun 13 2017 at 08:59

Бизнесу именно что нужна избыточность. Я в третий раз призываю смотреть диалектически :)
Не зря же говорят, допустим, что IT-бизнес лучше всего делать в Силиконовой долине. Почему? — Потому что концентрация людей, которые умеют и знают, там наибольшая.
Никто конкретно не оплачивает эту самую избыточность из своего кармана, но всем объективно хорошо, когда она есть, потому что дела растут быстрее у всех. Но я, конечно, понимаю, что с точки зрения микроэкономики, атомизированного субъекта отношений «купи-продай» это всё ересь. Однако — работает в реальной жизни!

ps. Понятие «обман» вообще очень размытое в нашей отрасли. «Вася, сколько тебе нужно на этот таск? — Два ч/д… Вася, прошло два ч/д, где коммит? — Обнаружились новые обстоятельства...» :)

mayorovp Jun 13 2017 at 09:10

Прошу обратить внимание, что вашим собеседником слово "избыточность" используется совершенно не в том смысле, в каком его используете вы.

AlexLeonov Jun 13 2017 at 09:27

Вася, сколько тебе нужно на этот таск? — Два ч/д… Вася, прошло два ч/д, где коммит?

Какая прекрасная в своей нелепости ошибка.

Вася сказал честно — два человеко-дня, примерно 15 часов работы.
Тот, кто спрашивал, не сумел превратить оценку трудозатрат в календарный срок, составив план-график, и теперь сваливает вину за свою некомпетентность, как PM-а, на бедного Василия.

А ведь Вася срок не говорил!

kentaskis Sep 18 2017 at 03:14

Кстати.
Все эти миллионы были распылены только в том случае, если разработчики в течение всего этого задвигали важные задачи подальше и весь рабочий день до последней минуты тратили на шардинг. Но я сильно сомневаюсь, что руководство будет терпеть то, что выдаваемые им задачи (зачастую срочные, весьма вероятно) начнут решаться через 2-3 месяца.
Куда вероятнее, что они тратили на него свое свободное время (а между задачами руководства почти всегда можно найти час-другой в день, либо задержаться на работе), и все задачи руководства решали в срок, либо с небольшой (да, в 3,14 раза)) задержкой срока, которая совершенно не влияла на бизнес.
Не было бы шардинга, у них всего лишь было бы свободное непродуктивно потраченное на баш и хабр время. Зарплата выплачивалась бы все равно в том же объеме.
И в чем тут "распыление"? В изношенной клавиатуре? Протертых байтами проводах? Километрах пробега мыши?

SirEdvin Jun 12 2017 at 10:08

MapReduce, которые создавались, на минуточку, для хранения поискового индекса ВСЕГО ИНТЕРНЕТА.

И если вы это используете для чего-то меньшего, то вы не правы?) Я вот для обработки 100кб данных использовал что-то похожее на MapReduce, правда самописное.

Идея использовать инструменты по предназначению довольно неплохо, но проблема в том, что на уровне мелких компаний откровенно все равно, что использовать.

А на уровне больших все равно нужно будет передылывать.

knstqq Jun 12 2017 at 12:12

И сколько сотен серверов было в вашем чём-то похожем на MapReduce для 100кб данных?

SirEdvin Jun 12 2017 at 12:14

Целых 0, потому что MapReduce — это парадигма, и к ней не обязательно поднимать гиганские кластеры.

Я к тому, что не совсем не понимаю спича по поводу "Не используйте MapReduce", ведь это парадигма работы с данными, которая масштабируется от одной маленькой базы до ВСЕГО ИНТЕРНЕТА.

knstqq Jun 12 2017 at 12:21

MapReduce — модель распределённых вычислений, представленная компанией Google, используемая для параллельных вычислений над очень большими, несколько петабайт, наборами данных в компьютерных кластерах.

Но парадигма Group-By обработки данных конечно появилась задолго до этого.
Это тот случай когда копировальный аппарат начали называть ксероксом, хотя это всего лишь производитель

SirEdvin Jun 12 2017 at 13:37

Для меня профит от MapReduce — это количество нормальных инструментов, которые ее поддерживают. Включая такие, которые чисто для запуска вне кластера и для малого количества данных.

sfi0zy Jun 12 2017 at 11:03

У нас во фронтенде похожая ситуация происходит. Все решили, что если google и facebook делают у себя SPA (single page application), то любой сайт должен строиться именно таким образом. В результате теперь какой-нибудь интернет-магазин на три с половиной товара имеет серверный рендеринг, выносящую мозг архитектуру со встроенными в нее старыми решениями и костылями, а чтобы что-то во всем этом изменить, необходимо скачать себе зависимостей на пол гигабайта…

wert_lex Jun 12 2017 at 13:01

Но ведь на текущем витке фронтендовых технологий SPA и правда удобнее и проще делать. Каноничный клиент-сервер кажется проще ровно до тех пор, пока внезапно не оказывается, что фильтры в интернет-магазине должны работать без перезагрузки страницы, справа внизу должен быть уютный чятик, а блок сравнения товаров желательно сделать так, чтобы он тоже не требовал перезагрузки страницы.
Современный веб уже очень сильно не про "отдать отрендеренную сервером страничку".

AlexLeonov Jun 12 2017 at 14:35

Разницы между «отдать страничку с данными» и «отдать эти же данные в JSON» для вменяемого backend-разработчика почти нет. Разве что заголовок про content-type правильный не забыть.

Весь адъ начинает твориться уже на фронте. Это какой-то отдельный мир :)

wert_lex Jun 12 2017 at 17:39

Это далеко не всегда так.
Отдать страничку с данными и правда не сильно сложно, гораздо сложнее отдать часть приложения с данными. Потому что вдруг выясняется, что у фронтенда есть:

внутреннее состояние (любимый цвет кнопок, текст не до конца набранного комментария, настройки какого-нибудь фильтра и еще уйма интересных штук, которые разумеется более чем реализуемы в парадигме "отдать страничку, а при переходе по ссылке отдать следующую страничку", но по какой-то причине очень часто приводят к "я тут накидал на jquery, пожалуйста не трогай это никогда")
архитектура. Потому что на чистом HTML, CSS и JS можно реализовать всё что угодно, но на Angular (фанатам фейсбука читать как "React") оно почему-то выходит более поддерживаемым и работоспособным.
как ни странно, команда, которая обычно этим самым фронтендом занимаются фуллтайм, и обычно, при SPA подходе decoupling (как это по-русски правильно?) получается значительно выше.

UFO landed and left these words here

AlexLeonov Jun 12 2017 at 20:01

Сверстать шаблон? Причем тут разработчик backend-а?

Шаблоны в отдельный репозиторий, описываем в документации объекты, передающиеся в шаблоны, отдаем верстку на аутсорс в менее развитый регион, при сборке объединяем с основным репозиторием.

andreymal Jun 12 2017 at 14:55

Не забываем про PJAX и аналоги. Те же ВК, ютуб, гитхаб (правда, хз зачем это ему) работают без перезагрузки и имеют «уютные чятики» и прочие аудиоплееры, однако сервер им по старинке отдаёт отрендеренную страничку (точнее, часть), которая через innerHTML запихивается куда надо. По своему опыту могу сказать, что делать такое нетрудно.

aamonster Jun 12 2017 at 15:58

(с печалью) и в итоге мы имеем бесконечную прокрутку в стиле xkcd#1309 ("Почему ты переворачиваешь страницы так странно? — Если я притронусь не в том месте, то потеряю открытую страницу, и придётся листать с самого начала")

SPA требует много работы, и об этом забывают — в итоге 95% SPA хуже, чем тупая пачка страниц со ссылками. Примерно все, которые сделаны не самыми крупными разработчиками.

herr_kaizer Jun 12 2017 at 20:38

Крупные разработчики тоже постоянно лажают и пользование их сайтами при определенных сценариях превращается в муку.

aamonster Jun 12 2017 at 21:02

Бывает. Но у них значительно больше ресурсов на тестирование и багфикс — так что если даже они со всем этим лажают, то простому разработчику уж точно не стОит использовать в вебе сложные вещи.

PsyHaSTe Jun 13 2017 at 13:34

Проблема исключительно в one-way binding'е данных на UI. Когда при прокрутке странички (допустим, у нас статья с кучей подзаголовков) хэштег страницы автоматически подменяется на текущий позаголовок (и при обновлении страницы мы попадем на него) такого не происходит никогда.

aamonster Jun 13 2017 at 15:15

Понятно, что конкретная проблема решаема (в конце концов, работают же SPA у Гугла, Мейлру и прочих). Но при этом на куче сайтов (к примеру, мобильный сайт fontanka.ru — не самое мелкое СМИ) всё криво (случайно тапнул по статье, нажал back — листай с начала).

Т.е. масса народу лажает в SPA и т.п. — при том, что SPA им не особо и нужны, люди просто погнались за модой.

PsyHaSTe Jun 13 2017 at 15:41

Начал писать длинный ответ, но потом понял, что он ни к чему.

SPA сложнее, и сломать его легче — это понятно. Но разработка любого современного портала, окромя возможно сайта-визитки ученика школы 1218 требует этой сложности.

Понятно, что конкретная проблема решаема (в конце концов, работают же SPA у Гугла, Мейлру и прочих). Но при этом на куче сайтов (к примеру, мобильный сайт fontanka.ru — не самое мелкое СМИ) всё криво (случайно тапнул по статье, нажал back — листай с начала).

Тайпнул по статье, нажал back, прокрутка вернулась назад — всё нормально работате. Правда, я смотрел в responsive-вкладке дебага хрома, не на телефоне, мб особенности железа. Но на первый взгляд я не вижу там никаких проблем.

Мода — понятие растяжимое. Мода мыть руки — тоже мода. Носить одежду после каменного века — тоже. Нужно только разделять полезную вроде этих, и бесполезный хайп. SPA я считаю скорее полезной тенденцией, в среднем.

А использовать инструмент без его понимания вредно в любом случае, что для SPA, что для Pure-HTML only, что для чего угодно. Не вина инструмента в этом.

aamonster Jun 13 2017 at 18:06

Только что проверил: m.fontanka.ru, листаете до полного списка статей (или просто жмёте "все новости"), несколько раз нажимаете "ещё новости", чтобы подгрузить список дальше (при этом url не изменяется). Дальше тап по статье, бэк — всё, позиция потеряна.

В общем, хочется посоветовать разработчику: "не льсти себе, встань ближе" ;-)

VolCh Jun 14 2017 at 08:51

при том, что SPA им не особо и нужны, люди просто погнались за модой.

Мне, как разработчику, SPA нужны. Их легче разрабатывать и поддерживать чем традиционные "серверные HTML-генераторы". Естественно при наличии соответствующего инструментария.

IvaYan Jun 16 2017 at 07:31

При наличии соответствующего инстрементария может оказаться легче использовать "серверные HTML-генераторы", разве нет?

VolCh Jun 16 2017 at 08:19

Нет. При наличии сопоставимого инструментария легче разрабатывать и поддерживать при чётком разделении на фронтенд и бэкенд, которые общаются между собой по фиксированному API.

mayorovp Jun 16 2017 at 11:11

Разработка сразу двух слоев не может быть проще чем разработка одного слоя при наличии сопоставимого инструментария.

acmnu Jun 16 2017 at 13:11

Разработка монолита дешевле, но поддержка дороже.

mayorovp Jun 16 2017 at 13:24

Смотря в чем поддержка заключается.

VolCh Jun 18 2017 at 07:16

Может. Уменьшение связанности, увеличение связности, уменьшения количества ответственностей и прочие подобные принципы созданы для упрощения разработки, а не усложнения.

Но до недавнего времени с инструментарием на фронтенде было гораздо хуже, чем с инструментарием на бэкенде.

mayorovp Jun 19 2017 at 06:18

Согласен, но это работает только когда слои были выделены разработчиком. Когда же разделение на слои произведено непреодолимой силой — вместо уменьшения связности появляются костыли.

VolCh Jun 19 2017 at 09:57

Ну я исключительно о сознательном внедрении.

batyrmastyr Jun 13 2017 at 06:32

Если у кого-то проблемы с тем, чтобы сделать всё это на жикверях (или голом js), то ему явно рано лезть в более сложное по своей сути SPA.

botyaslonim Jun 13 2017 at 07:54

Возьму на себя смелость сказать: 90% сайтов делать быстрее и проще на vanilla JS+jQuery, даже с интерактивом, чем внедряя очередной 100500-й фреймворк. Просто кривая обучения не выйдет на отрезок «окупаемость»: идеи, заложенные в тот же React, никак не помогут обычному малому бизнесу продать его полтора мешка картошки. А костылей нахватать и столкнуться потом с проблемой поддержки всего этого хозяйства — как будьте-нате.
У нас во фронт-енде действительно с этим полный адЪ :)

relia Jun 13 2017 at 08:30

Возьму на себя смелость утверждать, что 90% сайтов клепается ради самих сайтов. Типа создадим красивый сайт и посещаемость или продажи втридорога сами по себе потекут рекой. Главное, чтобы все было красиво. Точно так же, как снять самый дорогой магазин на центральной улице города и на прилавках с вензелями выложить эту картошку с 146% наценкой и пипл выстроится в очередь к кассе. Главное — идея! И при разработке нового бизнеса в Сети создатель должен думать об идее, а не навороченности инструментов для ее претворения в жизнь. Получится из этого стартап с кучей венчурных инвесторов и другими вкусностями — прекрасно. Получится просто еще один бизнес — тоже неплохо :)

VolCh Jun 13 2017 at 13:39

Если каждый сайт начинать с нового стэка, модного на этой неделе, то да, проще и быстрее написать на коленке.

Если же писать приложение, с расчётным сроком эксплуатации лет в 5 хотя бы...

pm_wanderer Jun 13 2017 at 09:10

А почему нельзя сделать все тоже самое, но на виджетах, внедренных в стандартный html?
Пусть страницы останутся нативно-индексируемыми, а все что требует сложной интерактивности будет внутри неких компонентов. Я возлагал надежды на web-components в этом плане, но как то у них медленно все продвигается.

jMas Jun 13 2017 at 21:18

Вы забываете задать себе вопрос: а нужно это бизнесу? То есть, возможно этот магазин и не будет сколько ни будь популярным, может оно ему это все пока и не нужно. Ну и всегда есть возможность масштабированя другими инструментами, не только так сказать SPA-first.

Gemorroj Jun 12 2017 at 11:05

В целом очень нужная, правильная статья.
Только хотел бы отметить один момент:

Я прочёл оригинальный документ, в котором описывались принципы работы Dynamo и, зная, что Cassandra достаточно близка к Dynamo, понял, что эти системы строились на принципе приоритизации операций записи.
И они даже добились этого, пожертвовав, однако, гарантированной консистентностью и функциональностью традиционных реляционных баз данных. Но компания, с которой я обсуждал применения этого решения, не ставила запись данных в приоритеты (все данные приходили одним блоком раз в сутки), а вот консистентность и производительное чтение были как-раз очень нужны.

Чтобы прийти к таким выводам, нужно достаточно глубоко изучить инструмент, что, на самом деле, не так просто и требует времени. Усугубляет ситуацию обилие выбора, особенно в NoSQL решениях.
Разработчик зачастую не хочет копать достаточно глубоко, проще и приятнее — «чик-чик и в продакшен».

AlexLeonov Jun 12 2017 at 11:26

Для этого в компании нужен системный архитектор. Задача разработчика — код писать, а не выбирать решения.

Даже если компания экстремально маленькая, всегда можно найти на почасовку грамотного человека, который подготовит вам архитектурное решение.

Иначе так и будут плодиться «CRM на mongoDB», которые потом приходится переписывать, тратя человеко-годы, или просто выкидывать (причем бывает, что вместе с командой, которая такое накодила)

AllexIn Jun 12 2017 at 12:38

Системный администратор, который выбирает фреймворки под задачу?
И много программистов согласится на такое?

AlexLeonov Jun 12 2017 at 12:47

Архитектор, а не администратор, вы невнимательно прочли.

Системный архитектор — это роль, отвечающая как раз за обоснованный выбор технологий и архитектурных решений.

Отсутствие в команде такой роли приводит обычно к Битриксу :)

AllexIn Jun 12 2017 at 13:02

Да, да, невнимательно прочитал. А коммент «изменен» по какому поводу, если не секрет?
Но то что не обновился перед отправкой — это да, ошибся.

AlexLeonov Jun 12 2017 at 13:04

«Комментарий бы изменен» — добавил строчку про Битрикс.

IgorStepin Jun 12 2017 at 13:40

Это больше Software Architect, но не принципиально. Системный архитектор ближе к аналитикам: API между компонентами и т.п.

AlexLeonov Jun 12 2017 at 13:43

Вы правы, конечно, но разница на практике не настолько принципиальна.

AlexLeonov Jun 13 2017 at 08:15

О, выходные закончились, прибежали отдохнувшие «архитекторы», начали ставить минусы. Не понравилось про «CRM на mongoDb»? Так это суровая правда жизни. Мне и CRM с монгой, как с основной базой приводилось видеть, и интернет-магазины и много еще чего. С реализацией left join и constraints в коде приложения :)

И всегда эти истории заканчивались печально. «Архитекторы» увольнялись, кому-то приходилось, употребляя весьма непечатные выражения, наводить порядок в их хозяйстве и объяснять бизнесу, что решение фактически придется написать заново…

mayorovp Jun 13 2017 at 08:40

Нет, не понравилось что вы отбираете право влиять на выбор архитектурных решений у того, кто потом ими и будет пользоваться.

По моему опыту — именно специальные системные архитекторы и имеют привычку выбирать странные решения вроде монги, шарепоинта или SSIS. Просто потому что читали об их плюсах — но не читали о минусах.

AlexLeonov Jun 13 2017 at 08:44

Вступайте в дискуссию, обсудим. Если я неправ, я способен это признать.

Но пока считаю ровно так, как написал выше: архитектор и разработчик это разные роли, и тот, кто пишет код, не может нести ответственность за выбор архитектурного решения.

Выбор — это ответственность прежде всего. А ответственность может быть только персональной.

qw1 Jun 13 2017 at 11:46

Как минимум, тут страдает мотивация разработчиков.

Если им сверху спустить sharepoint, они будут плеваться и брыкаться, делать пусть не на от^&%сь, но строго в рамках ТЗ (чуть шире им не интересно).

Если они сами выбирают технологию, они смогут с ней поиграться, как им нравится, и сделать намного больше и красивее, чем в ТЗ.

AlexLeonov Jun 13 2017 at 12:02

Вы с другой стороны, уважаемый коллега.

Со стороны бизнеса «поиграться» равносильно «выкинуть деньги в никуда». Когда бизнес нанимает разработчика, он полагает, что нанял профессионала, который знает решение его (бизнеса) проблем, и что разработчику не нужно «играться», но он может сесть и сделать.

Вы же предлагаете немного по-детски наивный подход: «дайте нам бабла, мы поиграемся и сделаем, как нам нравится, и пофигу на ТЗ».

В реальной жизни не нужно делать лучше, чем в ТЗ. Нужно сделать то, что написано и как можно быстрее.

Мотивация? Ну да, отчасти здесь я с вами соглашусь. Однако существует множество методик управления, которые создадут у разработчиков иллюзию их причастности к принимаемым решениям. Так что не вижу большой проблемы.

Neikist Jun 13 2017 at 12:13

Возможность «поиграться» также является фактором выбора места работы, и можно нанять более высококвалифицированного специалиста, платя ему меньше, позволяя при этом эксперименты.

qw1 Jun 13 2017 at 12:30

Вы с другой стороны, уважаемый коллега.

Возможно, и нет. Для вашего решения требуется больше затрат. Нужны отдельные люди на много новых ролей: дизайнеры, UI-специалисты, архитекторы решений, и т.п.

Если разработчик не будет прилагать усилий, а тупо кодить, кто-то другой должен приложить эти усилия и описать, что нужно. Причём в случае заинтересованного разработчика он уже в «теме» проекта. А вводить 100500 лишних людей в проект, чтобы они вникли во все детали — это время, значит, и деньги.

Однако существует множество методик управления, которые создадут у разработчиков иллюзию их причастности к принимаемым решениям

Если какой-то разработчик зевает от упоминания sharepoint, можно его убедить, что он сам его и выбрал?

AlexLeonov Jun 13 2017 at 12:33

Нужны отдельные люди на много новых ролей

Я нигде не утверждал, что роль == должность или что каждая роль — это отдельный человек. Напротив, если вы внимательно почитаете мои комментарии, то найдете прямо противоположные утверждения.

Один человек вполне может сочетать несколько ролей, не вижу никаких проблем. Важно только, чтобы роли были выделены, формализован список обязанностей и зафиксирована ответственность по каждой роли.

Если какой-то разработчик зевает от упоминания sharepoint, можно его убедить, что он сам его и выбрал?

Плохой пример, потому что никто в здравом уме не будет выбирать sharepoint :)) Но в целом да, решение можно подать, как якобы принятое коллективно.

qw1 Jun 13 2017 at 13:46

Один человек вполне может сочетать несколько ролей, не вижу никаких проблем. Важно только, чтобы роли были выделены, формализован список обязанностей и зафиксирована ответственность по каждой роли

Как это в реальности выглядит?

Мол, ты, Вася — сегодня архитектор. Пишешь дизайн-документ для себя — завтрашнего кодера. Обоснуешь принятое решение.

И что от этого изменится? Если Вася хочет Кассандру, он напишет в документе, какая она крутая и как используется в решениях всякими знаменитостями типа Cisco и т.п.

AlexLeonov Jun 13 2017 at 14:03

Как это в реальности выглядит?

Это выглядит как документ. На бумаге. Который фиксирует должностные обязанности, скажем, некоего «Ведущего разработчика». В котором написано «Исполняет роль DBA, включая следующие обязанности: ...».

Условный Вася знакомится с этим документом и приказом о введении его в действие, после чего начинает нести ответственность в соответствии с возложенными на него обязанностями.

И что от этого изменится?

Появляется понятие «ответственность». Если аудит покажет, что решение было неверным, но принятым Васей в рамках его обязанностей (которые он на себя принял), то Вася может пострадать материально (возмещение убытков) или морально (увольнение).

qw1 Jun 13 2017 at 14:58

Были случаи, когда консультант или архитектор лично возмещал убытки за неверное решение?

Кто и по каким канонам решает, что верно, а что — неверно? Нет никаких формальных документов, значит — произвол «эксперта».

Если какая-то контора это практикует, вокруг них должна сложиться репутация, что там, мягко говоря, странные руководители. Адекватный человек туда не пойдёт.

AlexLeonov Jun 13 2017 at 15:57

Я случаев возмещения убытков в рамках формальных процедур лично не знаю. Но это не значит, что их нет.

Случаи увольнения за профнепригодность (дада, с той самой комиссией и аттестацией) по итогам внешнего аудита мне известны.

navion Jun 13 2017 at 12:08

Шарепоинт или какой-нибудь WebSphere/WebLogic Portal скорее будет продвигать CIO, которому сейлы промыли мозг «чудесами интеграции», поддержкой из одного корыта и большой скидкой.

Galangetan Jun 13 2017 at 09:11

Задача разработчика — код писать, а не выбирать решения.

Извините, конечно, но «код писать» — это задача кодера, а не разработчика.
На мой взгляд, тем и отличается хороший разработчик от плохого, что плохой просто сидит и пишет код, а хороший разработчик создаёт законченное, надёжной и качественное решение безнес-задачи.

grossws Jun 13 2017 at 09:59

Извините, конечно, но «код писать» — это задача кодера, а не разработчика.

Можно рассматривать кодера как одну из ролей разработчика. Т. е. разработчик может выполнять роли архитектора, проектировщика, ПМа, кодера, тех писателя и т. п, если он, например, на фрилансе.

jehy Jun 12 2017 at 12:37

Очень хорошая и правильная статья. Но до своей ЦА вряд ли дойдёт. А этих ребят, как ни странно, безумное количество. Раз в неделю вижу примеры, например, переписывания с PHP на Go неких проектов, которые годами исправно тащили все свои полтора rps. Причём уже несколько раз видел, когда это закономерно проваливается, и люди делают вывод, что нужно было подражать другому популярному тренду. И начинают новый виток бессмысленной разработки.

AlexLeonov Jun 12 2017 at 12:52

А всё потому, что программист должен писать код.
Очень жаль, что эту простую истину приходится каждый раз объяснять заново.

— Не выбирать фреймворк и не подбирать библиотеки: это роль архитектора
— Не закупать железо или облачные ресурсы: это сисадмин
— Не проектировать базу данных: это DBA
— Не заниматься выкладкой кода в бой и обновлением: это dev-ops
— Не тестировать и не писать тестовые сценарии: это QA
— и даже не настраивать себе софт на рабочем месте

А просто писать код. И всё.

К сожалению, в 95% случаев всё заканчивается на уровне «тыжпрограммист? вот иди и сделай!» и ни о каком разделении ролей внутри команды говорить не приходится. А нет разделения ролей — нет и ответственности, получается, что ответственность «коллективная», за ошибочные решения как бы никто не отвечает, виноватых нет.

IvanTamerlan Jun 12 2017 at 13:01

Зависит от штата. Для команд в 2-3 человека будет динамическое совмещение ролей. Мне чаще всего встречались команды, где один выполняет все операции, а другой ответственен за внешнее оформление, контент и тестирование. Это в лучшем случае.
Либо разбиение внутри команды идет бюрократическими методами и не учитывает специфики работы, т.к. за назначение ролей ответственен менеджер, которому надо иной раз подсказывать как пользоваться Word (и такие случаи бывали. Встречалось на предприятиях с низкой з/п)

AlexLeonov Jun 12 2017 at 13:06

Поэтому я и пишу «роль», а не «должность». Даже на трех человек всегда можно выделить и формализовать роли.

Есть такой классный документ, называется «должностные обязанности». Так вот, там можно писать примерно так: «Выполняет роль инженера QA, включая следующие обязанности:… „
Только не говорите, что это “бюрократия», просто банальный порядок.

IvanTamerlan Jun 12 2017 at 13:39

Этот неловкий момент, когда я даже не знал должностных обязанностей, т.к. роль у меня вообще другая. Получилось такое из-за жесткого задания должностей и их несоответствия современным потребностям, когда на целый отдел с десятком ПК ни одного ITшника, который может настроить этот парк.

AlexLeonov Jun 12 2017 at 13:44

Вы не можете не знать должностных обязанностей, потому что обязаны с ними ознакомиться под роспись.
Если не знакомились — считайте, что никаких обязанностей у вас нет :)

DrPass Jun 12 2017 at 13:45

Я помню, как мы делали как-то софт для автоматизированной вёрстки газеты объявлений. Архитектор выбирал фреймворки и библиотеки, сисадмин подбирал железо и настраивал софт, DBA проектировал базу, тестер тестировал, программист программировал, дизайнер рисовал всякие графические штуки. Мой друг работал дизайнером, я работал архитектором, сисадмином, DBA, тестировщиком и программистом. Ещё попутно работал нашим бухгалтером и директором. Так многие мелкие команды работают.
P.S. Проект, кстати, тогда взлетел и проработал, пока не померла газета :)

Deroy Jun 13 2017 at 09:11

К сожалению слепое следование подобному подходу порождает до ужаса однобоких специалистов.

Я бы сказал что так должно быть в идеале в крупных проектах с большими командами (и обычно так и есть),
однако, если программист "только пишет код" и никогда даже не пытался "во все остальное", это чаще всего крайне посредственный программист.

Специалист должен знать смежные области, чтобы быть специалистом в своей.

Не выбирать фреймворк и не подбирать библиотеки: это роль архитектора

Программисту необходимо понимать почему был выбран именно этот фреймворк.
в зависимости от политики и размера команды и состояния проекта (например в начале) — принимать участие в обсуждении выбора оного вместе с архитектором.

Не закупать железо или облачные ресурсы: это сисадмин

Закупать железо не должен, но как минимум должен иметь представление на каких мощностях и платформах его код может/должен работать.

Не проектировать базу данных: это DBA

Очень спорно что программист не должен принимать в этом участия, выделенные DBA — это больше удел "у нас половина бизнес логики в БД", а обычно же бизнес-логика БД сильно переплетена с приложением (во всяком случае приложения рассчитывают на те гарантии что дают им БД), и знать реляционную теорию и принципы работы с массивами данных — прямая обязанность программиста, также как и принимать участие в проектировании процессов работы с данными.

Не заниматься выкладкой кода в бой и обновлением: это dev-ops

Да, хорошо когда этим занимаются отдельные люди, но понимание должно быть и приложения должны быть написаны таким образом, чтобы упрощать этот процесс, а это уже обязанность программиста а не dev-ops.

Не тестировать и не писать тестовые сценарии: это QA

Смотря что подразумевать под тестированием: автотесты (юнит, апи, интеграционные), само понимание того как сделать софт "тестируемым", проверка функциональности того что программист непосредственно пишет, да и вообще всяческий самоконтроль — это только в плюс, очень тяжело работать с людьми которые даже базово не пытаются проверять что пишут.
Я сталкивался с подобным, когда на ревью / к тестерам / в сборку отправляли вообще никак не работающий и не проверенный код, и это в больших компаниях, а в малых то и тестер не всегда есть.

и даже не настраивать себе софт на рабочем месте

Вот это, простите уже перебор, я бы даже не стал работать в месте где не могу настроить себе машину так как мне нужно, а человека который не может себе настроить рабочее окружение, никогда не возьму на работу.
Да, могут быть всякие штуки по безопасности которые настраиваются централизованно, и контролируется это отделом безопасности, но — рабочее окружение — это не их водчина.

В заключении скажу, что по моему опыту, огромная доля профессионального роста происходит как раз за счет понимания смежных областей. Огромное количество хороших практик разработки пришло как раз из понимания как облегчить жизнь себе и другим.

Программист должен знать те инструменты с которыми он работает.

Статья как раз о том — что нужно понимать почему мы выбираем тот или иной инструмент, нужно понимать как он работает изнутри, чем он нам поможет, а чем может навредить. А что бы хоть на каком то уровне это понимать нужно хоть немного (а чем больше тем лучше) "мочь в смежные области" — это и для себя хорошо и для работодателя. Без понимания этих вещей, которыми программист вроде бы не должен заниматься, невозможно грамотно этот самый инструмент выбрать и избежать тем самом казусов описанных автором.

Заодно такое понимание может привести вас к возможности исполнять те самые роли, которые "должны" этим заниматься, а иначе откуда же возьмутся все те "разбирающиеся в технологии" консультанты и крутые архитекторы которые подскажут что же надо выбрать и почему.

Foxeed Jun 13 2017 at 12:12

Полностью подписываюсь под всем, но хотел бы еще добавить, что, например, архитектором невозможно стать, не принимая мелких решений по библиотекам/фреймворкам/утилитам, которые будут в тулчейне использоваться.
В сообщении, на которое вы ответили, вообще не предполагается, что человек из одной области может в другую перейти — какие-то дискретные непересекающиеся области получаются. А в реальности стать, к примеру, devops нельзя, никогда не программировав, имея только опыт развертывания чего-то в вакууме или какие-то системные понятия. Очень сомнительные советы.

VolCh Jun 13 2017 at 13:48

В технике выделяются: средняя техническая квалификация техник-программист (ранее «программист-лаборант») и высшая техническая квалификация инженер-программист. Предметом деятельности специалистов с соответствующей квалификацией (техников и инженеров) является проектирование, разработка и производство программного обеспечения, как промышленной продукции, удовлетворяющей заданным функциональным, конструктивным и технологическим требованиям (результатом деятельности является программное обеспечение).

nikitasius Jun 12 2017 at 12:38

Замечательная статья!

IvanTamerlan Jun 12 2017 at 12:50

Чаще всего сталкиваюсь с ситуацией, когда находятся советчики и предлагают инструменты, которые используют Google и другие огромные корпорации, для решения проблем как наколеночных (скрипт на Bash справится), так и некоторых предприятий, где сейчас решается все в стиле «бабушка с блокнотиком» (секретарша с MS Word).
Особенно смешно слышать рекомендации о том, какие использовать инструменты, только вдумайтесь, — в экспериментах! Даже не в серьезной разработке!
При выборе инструмента исхожу из доступных сроков (при дедлайне через неделю не до новых инструментов, которые могут потребовать куда больше времени на изучение), работоспособности инструмента (минимум велосипедописания для типичных операций), целевой платформы.
Если в качестве целевой платформы выступает ПК с параметрами типа для WinXP x32 (192 МБ оперативы DDR1, HDD 20гб) для преусловутой «бабушки с блокнотом», то и современные инструменты типа .NET будут под очень большим вопросом, а сейчас так вообще из-за отказа от поддержки WinXP многие инструменты просто не заведутся.

IgorStepin Jun 12 2017 at 13:27

Замечательно, лишь бы маятник не пошел в другую сторону: без разбора обвинять все новые технологии как игрушки. Нужно действительно думать о применимости технологии с учетом текущего состояния проекта и компании, планов, текущих бизнес и технических задач. И кто-то должен выполнять роль архитектора.

AlexLeonov Jun 12 2017 at 13:45

Если смотреть на современный JS — лучше бы маятник действительно пошел в другую сторону.

UFO landed and left these words here

botyaslonim Jun 13 2017 at 08:05

Кстати, а зачем корпорациям пиарить технологию? Они же отдают её бесплатно, за использование Angular никто не платит

grossws Jun 13 2017 at 10:02

Больше людей пользуются — больше ошибок находится, больше сообщество, более равномерное развитие и т. п.

relia Jun 12 2017 at 14:12

Как минимум на постсоветском пространстве еще и низкая квалификация персонала играет роль. Особенно ТОПов, которые считают, что падение продаж в компании можно решить «перестановкой кроватей», как в том анекдоте. Вот и начинают вместо оптимизации расходов и углубленного тюнинга имеющихся решений вбухивать немалые деньги в просто другое решение. Проходит год… А продажи как падали, так и продолжают падать. Меняют ИТ-ного ТОПа и тот приносит новую и свежую идею и все по новой… :(

С другой стороны:

США, один достаточно средний из мелких интернет-магазинов со специализированным предложением страдает от падений сервера при обновлении карточек товаров бэкендом Magento с допиливанием каких-то разрабов. Страдает до полной падучей и последующего внешнего ребута виртуалки. Заглядываю вовнутрь: две виртуалки (веб-сервер и MySQL) в Amazon. Обе с 32 ГБ ОЗУ и по 16 каких-то ядер. В системе постоянно уходит в полный даун MySQL из-за нехватки памяти, летят индексы и дальше по тексту. Хорошо что в минимум нагрузки на их сервер (глубокая ночь в Калифорнии) у меня разгар рабочего дня — запустил этот пересчет и просматриваю логи MySQL и данные session manager. Проблема нашлась просто: в карточке каждого товара надо внизу вывести 6 подобных товаров, которые выбираются из номенклатурного справочника одним селектом: в данной категории товаров сделать выборку, исключив текущий товар, рандомно ее отсортировать и выбрать первых 6 результатов. Этот единственный запрос возвращает готовый результат, содержащий в т.ч.наименование товара (поле varchar(512) и краткое описание (поле TEXT)… Этому модулю никогда не хватает памяти и он начинает свопить результаты через диск. Некоторые свопы могут длиться более 40 секунд…
Неделю с ними развлекался постоянно предлагая разработчикам только одно решение: запрос должен возвращать только id карточек похожих товаров, а потом уже по ним подтягивать все эти поля-монстры. Знакомый аутсорс-администратор сказал, что через месяц они перешли на более производительный хостинг…

PS
У вас есть 3 попытки угадать из какой страны происхождение фамилий владельца этого интернет-магазина и разработчиков :)

igordata Jun 13 2017 at 00:10

Как это вообще связано со страной? Это как-то оскорбительно для тех, кто в той же стране живёт и не так тупит как вышеобозначенные неизвестные. Не говоря уже про то, что страна происхождения фамилии вообще не при чём.

relia Jun 13 2017 at 09:23

А Вы о какой стране подумали?

Politura Jun 13 2017 at 09:13

Проблема нашлась просто: в карточке каждого товара надо внизу вывести 6 подобных товаров, которые выбираются из номенклатурного справочника одним селектом: в данной категории товаров сделать выборку, исключив текущий товар, рандомно ее отсортировать и выбрать первых 6 результатов. Этот единственный запрос возвращает готовый результат, содержащий в т.ч.наименование товара (поле varchar(512) и краткое описание (поле TEXT)… Этому модулю никогда не хватает памяти и он начинает свопить результаты через диск.

Что-то я не очень понял, почему 6 записей с полями varchar(512) и TEXT должны что-то там нагружать и свопить?
Итоговые поля возвращаемые для такого мизерного количества записей вообще не должны ничего стоить, здесь надо было оптимизировать то, как эти записи отбираются, смотреть план запроса.

relia Jun 13 2017 at 09:23

Когда номенклатурный справочник за 2 млн записей, то может проявляться много интересных вещей :)
И самое главное — в таком запросе присутствие текстовых полей вредно независимо от текущего плана выполнения запроса.
А план запроса нормальный был — 3 индекса и последующий «file sort».

acmnu Jun 13 2017 at 09:45

Все же действительно непонятно. То что вы предложили (если я правильно понял) это антипаттерн за который хороший DBA вас казнит: вместо одного селекта вы сделали 7. Проблема была явно в чем-то другом.

relia Jun 13 2017 at 09:52

Хороший DBA??? Вы прочтите еще про запрос: в нем делается фактически select * from table1 записей с кучей полей, где много данных, и потом производится рандомная сортировка результата. Такое может быть условно хорошим при паре тыс записей и приемлемым при определенных условиях на паре десятков тысяч записей, но дальше это превращается в АД, который будет просто пожирать железо и деньги владельца.

acmnu Jun 13 2017 at 11:06

Опять ничего не понял. Давайте без эмоций. Есть таблица:

id, name (varchar), param1 ... paramN, description(text)

Фактически вам надо сделать по ней select

select * from table where <filter(param1 ... paramN)> limit X

Основная трудность здесь в наборе фильтров, которые приходят с интерфейса. Фактически у вас получается динамический sql. C этим будут определенные технические трудности, но они решаемы разными методами в разных DB. Вторая особенность которая мне видится: вам врятли нужен весь description. Скорее всего его нужно подрезать некой ограничевающей размер функцией.

Теперь я пытаюсь играть в угадайку. Похоже у вас сделано так:

-- Не делайте так - это антипатерн. Индексы не используются!
select * from table
<фильтр на стороне клиента BD>

А вы предложили так:

-- Не делайте так - это антипатерн. 
select id,param1...paramN from table
<фильтр на стороне клиента BD>
foreach id in <filter_result>:
   select name, text from table where id=id

Вы так сделали?

Politura Jun 13 2017 at 11:28

Как я понял — фильтр всегда известен:

в карточке каждого товара надо внизу вывести 6 подобных товаров, которые выбираются из номенклатурного справочника одним селектом: в данной категории товаров сделать выборку, исключив текущий товар, рандомно ее отсортировать и выбрать первых 6 результатов.

Полагаю, проблема здесь именно в рандомной сортировке, которая, очевидно, не будет использовать индексы, соответственно сложность будет сильно расти с ростом количества товаров данной категории и запрос будет тормозить даже есть вернет только идентификаторы товаров.

relia Jun 13 2017 at 11:37

Politura все правильно понял. Такое гуано нельзя писать независимо от текущей нагрузки — сегодня тянет, завтра умрет.

acmnu Jun 13 2017 at 12:01

Ну тогда не понятно, почему рандомная сортировка приводит к чтению текстовых полей. Особенность Mysql или баг?

relia Jun 13 2017 at 11:34

Нет, все не так.

У клиента таблица номенклатурного справочника, где для каждой записи, в т.ч. есть поле с name товара типа varchar(512) и поле с description товара типа TEXT. Названия товаров примерно от 100 символов и более, описания — от 2к. В справочнике более 2 млн записей в нескольких десятков групп товаров и тьме подгрупп.

У клиента для каждого товара из справочника выполняется один селект по данной таблице примерно такого вида:

SELECT * FROM t1 where cat_id = 1 and subcat_id in (2, 3, 4) and id <> 12346 ORDER BY RAND() LIMIT 6;

И на такой большой таблице с объемными строками Мускул естественно уходит в своп…

Результаты этого селекта (точно используются поля parent_id (id товара, для которого используется этот список), id, cat_id, subcat_id, name, description) записываются в отдельную таблицу. Поэтому я им настойчиво предлагал сделать так:

SELECT id  FROM t1 where cat_id = 1 and subcat_id in (2, 3, 4) ORDER BY RAND() LIMIT 6;

Результат записать в итоговую таблицу, а потом отдельным селектом подтянуть в эту таблицу значения cat_id, subcat_id, name, description. Делать это заполнение после каждого основного селекта или по итогам всей работы — решать разрабам, т.к. в заказ, а соответственно и оплату, не входило ковыряние в их Magento и допилах в нем. Я им указал на то, из-за проблем с чем они оплачивали мою работу. Но даже если существующий СЕЛЕКТ разбить на предлагаемые мной две части, то все равно имеем колоссальное уменьшение объема операций чтения-записи данных.

Независимо от размера таблицы объясните мне смысл тащить в СЕЛЕКТ с рандомной сортировкой результатов поля varchar(512) и text?

Ну мало ли — может Мускул примитив, а летящие в облаках Oracle и MS SQL это щелкают как орешки? Задал вопрос о существующей реализации у клиента сертифицированному и практикующему DBA ORACLE — его ответ не привожу по соображениям цензуры. :)

PS
Отдельный респект заминусившему мой предыдущий коммент — это однозначно был «хороший» DBA :)

mayorovp Jun 13 2017 at 11:40

А на самом деле надо делать вот так:

SELECT *  FROM t1 where cat_id = 1 and subcat_id in (2, 3, 4) ORDER BY subcat_id, id LIMIT /* тут случайное число */, 1;

И так 6 раз.

acmnu Jun 13 2017 at 12:14

Не очень вариант.

limit n,k делает чтение из нисходящего итератора n раз, плюс k раз делается выборка результата. Т.е. если у вас 1м позиций, то в пределе вы можете получить 6М-1 чтений. Да, если все пойдет нормально, то вы не будете читать те самые текстовые поля, но крутиться по максимальной выборке будете.

mayorovp Jun 13 2017 at 12:22

Лишняя сортировка — хуже, в моем же варианте от нее можно избавиться, если правильно подобрать индексы и то, что стоит в ORDER BY. Главное — даже при дальнейшем росте базы никакого случайного filesort уже не случится.

Кстати, если использовать оконные функции — то можно и вовсе ограничиться одним проходом, так, наверное, будет еще лучше.

acmnu Jun 13 2017 at 11:55

Странно, что в вашем случае этот запрос дает чтение description и name больше 6 раз. В нормальном движке план выполнения строится так, что столбцы не участвующие в where/group/order выбираются на финальном (самом верхнем цикле), а limit не является фильтром, он тупо обрывает выполнение построенного итератора. Ну, т.е. по факту этот запрос в Oracle прочитает поля name, description только 6 раз.

Если взлезть глубоко, то есть еще проблема блоков. Т.е. так может сложится, что name окажется в одном блоке (8k — default) с id и тогда они всегда будут читаться одновременно, что вы не делайте, но это уже проблема другого масштаба.

Я щас не возьмусь сказать, почему эта ерунда просиходит с mysql, но небольшой опыт с этой базой наводит меня на мысль, что дело в функции RAND(), точнее в её применении с order by, возможно именно она корёжит план выполнения. Ибо limit в этой базе работает как надо.

У клиента для каждого товара из справочника выполняется один селект по данной таблице примерно такого вида:

Вот это место тоже непонятно. Почему не join? Зачем плодить запросы над одними и теми же данными, когда можно написать один запрос?

mayorovp Jun 13 2017 at 12:04

Проблема тут не в самой RAND(), а в том, что делается сортировка по выражению, по которому не построен индекс. А если уж СУБД решила делать сортировку — то упорядочиваться будут записи целиком. Отсюда и filesort — в память такие объемы не влезают.

Не уверен что даже Oracle знает, что в такой ситуации можно прочитать только часть полей, потом выполнить сортировку, применить LIMIT и уже потом дочитать оставшиеся поля. По крайней мере, я о таких алгоритмах не читал ни разу.

acmnu Jun 13 2017 at 12:23

прочитать только часть полей, потом выполнить сортировку, применить LIMIT и уже потом дочитать оставшиеся поля.

Не, не так. Там, насколько я понимаю работать будет так (адовый псевдокод):

iterator=function (filter) {
     for rowid in (<тот самый селект>){
         yield rowid     
     }
}

i=0
while (rowid = next(iterator)) {
   i++
   if (i>6) break
   select * from table where rowid=rowid
}

acmnu Jun 13 2017 at 12:26

Т.е. там будет не <тот самый селект> а select rowid from table where <то самое условие>

mayorovp Jun 13 2017 at 12:27

Вы написали то же самое, что и я (только про сортировку забыли). Повторюсь — я ни разу не слышал про такие эвристики.

acmnu Jun 13 2017 at 12:30

Это не эвристика, это дефолт. Т.е. он всегда так делает.

mayorovp Jun 13 2017 at 12:46

Всегда = при любом запросе или всегда = при любой сортировке?

acmnu Jun 13 2017 at 15:03

Хороший вопрос. Я бы его конкретизировал до "при сортировке по индексу или без". Поскольку при сортировке по индексу я в этом алгоритме уверен. Это видно в плане выполнения. А вот что происходит при сортировке по безиндексоному полю я понять не могу однозначно.

relia Jun 13 2017 at 16:07

Опыт почти 10-летней эксплуатации высоко нагруженного Oracle 9i показывает, что даже у него на достаточно простых и массовых запросах вдруг съезжает статистика и он их начинает выполнять через одно место. Поэтому в критичных для общего здоровья системы местах у нас в тяжелых запросах используются все эти nls() и т.д.

mayorovp Jun 13 2017 at 16:21

Сортировка тут — лишняя сущность. Если используется индекс, в котором нет каких-то полей, нужных для выполнения запроса — в плане появляется операция загрузки этих полей из таблицы.

И эту операцию оптимизатор запросов может передвинуть в плане выполнения так, чтобы уменьшить стоимость. Это особенность работы индексов, а не сортировки.

Но разбивать одну операцию сканирования таблицы на две чтобы одну из них передвинуть в другое место — это именно дополнительная эвристика, и про нее я не слышал.

acmnu Jun 13 2017 at 12:34

Сортировка добавит ещё одни итератор, который будет читать сортируемое поле и возвращать rowid.

relia Jun 13 2017 at 12:06

Вот это место тоже непонятно. Почему не join? Зачем плодить запросы над одними и теми же данными, когда можно написать один запрос?

Я не знаю. Это индийцы, живущие в Калифорнии, а 2 из 3-х разработчиков в переписке живут в Индии, если следить за временем их ответа. Зачем мне рыться в их архитектуре сверху вниз, когда стоит простая задача оживить магазин и сказать почему он сдох? Оживил, указал на причину, предложил пути решения, они выбрали другой вариант — больше платить за хостинг… Магазин вырастет по оборотам, упадет — я опять подниму денег на них :)

mayorovp Jun 13 2017 at 12:09

Вот это место тоже непонятно. Почему не join? Зачем плодить запросы над одними и теми же данными, когда можно написать один запрос?

Вот это место как раз понятно. Запрос, который содержал join, уже падал раньше :-)

Politura Jun 13 2017 at 12:30

А что если сделать что-нибудь типа такого:

SELECT * FROM t1
where cat_id = 1
and subcat_id in (2, 3, 4)
and id <> 12346
and RAND() < 100 / (SELECT count(*) where cat_id = 1 and subcat_id in (2, 3, 4))
ORDER BY RAND() LIMIT 6;

Я давно не работал с базами, а с MySQL вообще почти никогда, не уверен будет ли подзапрос на выборку количества записей выполняться один раз для всех, или для каждой записи свой, но его всегда можно вынести наружу, если что.
Идея такая: изначально ограничиваем выборку примерно сотней случайных записей, а уже потом для этих 100 записей делается случайная сортировка и выборка ровно 6-и штук.

mayorovp Jun 13 2017 at 12:49

Да, так тоже можно.

PsyHaSTe Jun 13 2017 at 13:57

Разве в MySQL orderby не является блокирующим? То есть мы взяли и посортировали 2млн записей

SELECT id  FROM t1 where cat_id = 1 and subcat_id in (2, 3, 4) ORDER BY RAND() LIMIT 6;

Чтобы потом достать 6 штук в случайном порядке...

relia Jun 13 2017 at 14:09

Разве в MySQL orderby не является блокирующим?

Так, чиста с потолка:

Если можно выбрать что отсортировать: 2ГБ байтов или 10МБ байтов, то так уж принципиальна разница в механизмах блокировок? Ведь каждый байтик надо считать в память, подвигать его туда сюда, выгрузить потом… Данный запрос валится из-за колоссального объема ввода-вывода.

PsyHaSTe Jun 13 2017 at 14:26

Тут вообще непонятно, почему движок так поступает. В том же MSSQL выгрузка всех полей не производится до непосредственной выдачи результатов. То есть там движок выдал бы что-нибудь в духе:

SELECT *  FROM t1 where id IN (
   SELECT id  FROM t1 
   where cat_id = 1 and subcat_id in (2, 3, 4) ORDER BY RAND() LIMIT 6
)

Нашли 6 айдишек, достали для них поля, вернули.

mayorovp Jun 13 2017 at 14:35

Да ладно?

Все поля выгружаются сразу же и проходят через все этапы плана.

PsyHaSTe Jun 13 2017 at 14:51

Ок, неправ. Интересно, как дела у оркакла и постгре с этим.

jkjkjirf Jun 13 2017 at 19:04

Таки не 7, а 2.

Проблема на самом деле очень распространненая и на том же StackOverflow не один топик есть.

Суть в том, что ORDER BY RANDOM() начинает безбожно тормозить на хоть сколько-то больших объемах данных, даже на 100к записей это заметно. И самый простой способ оптимизирвать это «в лоб», первым запросом выбрать id записей, а потом уже выбрать нужную информацию по этим id.

В идеале, конечно, делается это через подзапросы к БД с более сложными штуками для оптимизации, но даже это примитивное решение джуниора, которое гуглится за 5 минут дает ощутимый прирост производиетльности.

mayorovp Jun 13 2017 at 10:07

Вот тут-то — и последующий «file sort» и зарыта собака.

relia Jun 13 2017 at 10:34

Кэп, это Вы?

mayorovp Jun 13 2017 at 12:05

И тем не менее, несмотря на очевидность этого, вы предлагаете не избавляться от корня всех проблем (сортировки), а пытаетесь уменьшить число полей чтобы в память влезло больше мусора.

relia Jun 13 2017 at 12:09

Для того чтобы избавляться от сортировки необходимо провести полный анализ архитектуры этого модуля и как используются результаты его работы. Это выходило далеко за пределы поставленной передо мной задачи.

navion Jun 12 2017 at 17:01

Вы тоже читаете cron.weekly? Уже второй перевод статьи оттуда.

Terras Jun 12 2017 at 17:23

Делаю «глючную» хрень на питоне, которая работает чуть быстрее черепахи, и у меня аж слезы идут, от того, как это убого. Однако:

— это решает бизнес-задачи;
— бизнес устраивают сроки и «качество», которое получается.

Нужно ли что-то лучше, если это работает?

Думаю нет!

dimm_ddr Jun 15 2017 at 12:35

Есть еще вопрос поддержки — если вашу глючную хрень легко понять и поддерживать, либо поддерживать это все будет не нужно — тогда точно не нужно сильно что-то менять. В противном случае может получится больно, но потом.

Iqorek Jun 12 2017 at 19:23

Да да, так и есть, прям болезнь какая то, вместо того чтобы трезво оценить свои потребности, начинаются рассуждения, а что если через два года к нам придет трафик в 50к параллельных запросов? Вместо того чтобы выбрать правильный ответ «Откроем бутылку шампанского за успех и сядем писать более мощный сервер», начинается…

AlexLeonov Jun 12 2017 at 19:35

Совсем недавно была ситуация полного обоюдного непонимания:

— А представьте, что вот на эту вашу архитектуру придёт миллион rps?
— Откуда они возьмутся?
— Ну неважно, вдруг так случилось? Что тогда? Как масштабироваться будем?

Смотрю на собеседника и не понимаю — то ли он шутит, то ли серьезно рассуждает, что его планово-убыточный магазин никому не нужной обуви должен работать в условиях миллионов реквестов в секунду…

Iqorek Jun 12 2017 at 19:47

Это практически классический вопрос на собеседовании в маленький стартап :) Хотя в больших конторах это тоже спрашивают, но в стартапах это более комично.
Совет стартапам, вас больше должен интересовать вопрос, как по скорей выкатить нечто работающее и где взять бабло на его продвижение (я не видел, чтобы что то выстрелило само, без толкания паровоза). Вопрос о масштабировании, в ближайшие два года вас интересовать не должен :)

JediPhilosopher Jun 12 2017 at 21:17

Я на такой вопрос обычно отвечаю в духе что «когда у нас будет миллион запросов в секунду — это будет означать что мы уже богаты и знамениты, и сможем себе позволить сделать то-то и то-то, а пока это нерационально».
Что характерно, ни один из проектов где подобные вопросы задавали, не то что до миллионов, а даже до просто хотя бы одного запроса в секунду в среднем не доходил.

igordata Jun 13 2017 at 00:14

но в стартапах это более комично.

В стартапах как раз не комично.
Стартап это по-определению нечто, что дико-бешено растёт, и за несколько месяцев аудитория может вырасти до миллионов посетителей.
Иначе это не стартап, а просто некий бизнес, возможно даже предпринимательство, на просторах интернета.

Проблема в том, что если на стартап набегают юзеры вдруг и резко, то он крякает и получается потеря аудитории, что для стартапа критично, т.к. кроме аудитории у него зачастую ничерта и нет.

Беда только в том, стартап ты или нет, выясняешь уже постфактум, когда миллионы юзеров что-то не набежали и ты не стартап =(

Iqorek Jun 13 2017 at 07:56

Стартап это по-определению нечто, что дико-бешено растёт, и за несколько месяцев аудитория может вырасти до миллионов посетителей.

Стартап, это кучка энтузиастов, которая имеет идею, которая по их мнению выстрелит. Вырастить аудиторию стартапа за несколько месяцев до миллионов, это ~~очень тяжело~~ невозможно.

если на стартап набегают юзеры вдруг и резко

Это заблуждение, извините за категоричность, но на вас никто не нападет. Это будет большой успех, если за первые месяцы вы заинтересуете хотя бы несколько тысяч.

acmnu Jun 13 2017 at 09:55

А представьте, что вот на эту вашу архитектуру придёт миллион rps?

Я очень часто задаю этот вопрос коллегам. Дело не в том что я хочу map-reduce и кластеризацию, а просто потому, что я хочу, чтоб паджинация на списках была сразу, а не когда припечет. Или чтоб индекс на таблице появился заранее в очевидных местах (селектим товар по цене — индексируем цену). Или чтоб вся статика на сайте кешировалась (это требует соблюдения определенных правил), а jquery был заменен в проде на jquery-mini.

Таких примеров привести можно много. Именно они дают реальный результат, а стоят копейки. Но обычно все происходит не так: "приждевременная оптимизация вредна", "эта таблица никогда не вырастет"

botyaslonim Jun 13 2017 at 07:15

/* pechal' mode on */
Очередная статья в стиле «давайте кушать суп ложкой, это лучше, чем кушать рукой… давайте, переходя дорогу, смотреть по сторонам, это лучше, чем не смотреть по сторонам...»
Вроде бы это всё относится к таким вещам, которые идут нулевым шагом: это само собой подразумевается.
Но каким-то образом индустрия попала в эти рамки, и если, скажем, по рынку труда пошла очередная волна моды на фреймворк или архитектурный подход, ты хошь-не хошь, а выучишь. Чтобы участвовать в том, что не имеет особого смысла.
/* pechal' mode off */

shgurbanov Jun 13 2017 at 19:04

интересная статья, спасибо!

HDDimon Jun 13 2017 at 19:54

как только они решили, что MapReduce недостаточно хорошо работает для построения поискового индекса, они перестали его использовать.

а что они сейчас используют? где можно об этом прочесть?

VolCh Jun 16 2017 at 08:24

Вопрос на засыпку: Нужен ли Kubernetes если вы не Google? Несколько раз присматривался, но каждый раз решал, что слишком сложно и не даёт ощутимого профита для оркестрации небольших (20-30 сервисов) SOA-приложений в контейнерах на пятке серверов в одном ДЦ — вполне достаточно docker swarm, docker-compose и bash.

Есть другие мнения?

Anarchist Sep 30 2017 at 02:46

Вам не нужны также хорошие программисты. Они слишком дорогие для вас. Они знают страшные слова map-reduce, которые так пугают менеджмент. Вы не гугл и, самое главное, вы никогда не станете гуглом. Ваш удел — маленький кусочек локального рынка и постоянно меняющие студенты-программисты.