DmitrySokolov27 ноя 2012 в 13:50

Кто использует Node.js: Trello (Часть 2)

5 мин

16K

Node.JS *

Перевод

+19

Комментарии 63

dmitriid 27 ноя 2012 в 15:52

> node.js
> Redis
> MongoDB

три пункта, которые наглядно показывают, что вдохновляться этими ребятами не надо — повторить не удастся. О чем, собственно, они и говорят:

> мы истекали кровью на всем протяжении разработки

btd 27 ноя 2012 в 16:04

А можно поподробнее — что именно плохо? (Пробую писать с использованием node.js)

dmitriid 27 ноя 2012 в 16:12

А что подробнее?

— node.js: vm неспособна утилизировать больше одного ядра, их надо запускать несколько штук и кластеризовать, единствьенный способ решать проблемы: «а, убъем и перезапустим, это быстро», большое количество сырых библиотек непонятного качества, асинхронные коллбэки — это хорошо, пока не начинается достаточного размера система, которую надо как-то отлаживать

— mongodb: настраивать, настраивать, и еще раз настраивать. Про проблемы MongoDB под нагрузкой, про проблемы с репликацией, локами и т.п. в инете не писал только ленивый

— ну и поверх всего этого езе и redis, который надо примирять со всем вышесуществующим (то есть +еще одна технология, которую надо интегрировать)

Что имеется в итоге? «мы истекали кровью на всем протяжении разработки» Неудивительно

Silver_Clash 27 ноя 2012 в 17:43

А про проблемы с блокировками в MongoDB можно подробнее? Хоть про них не писал только ленивый, гугл мне не смог помочь…

dmitriid 27 ноя 2012 в 17:46

До 2.2 в MongoDB был глобальный lock на базу данных (!) при записи

Silver_Clash 27 ноя 2012 в 17:50

Сейчас актуальной является 2.2.1 — выходит ваша информация устарела?

dmitriid 27 ноя 2012 в 17:57

Когда Trellio только начинал разрабатываться, уже была 2.2.1? То есть они и машину времени изобрели?

Silver_Clash 27 ноя 2012 в 18:00

Мне гораздо интереснее что есть сейчас, а не то что было тогда. Сейчас изучаю mongo на досуге, мне пока нравится. :)

Вот когда то ваш коммент мог быть актуален, но сейчас как Вы сами написали — поздновато.

dmitriid 27 ноя 2012 в 18:29

> Мне гораздо интереснее что есть сейчас, а не то что было тогда.

Да и сейчас с Монго не все в порядке. Сейчас, к сожалению уже не найду :( Но где-то месяц назад была серия статей разных компаний о проблемах с Монго (срочно переходили на что угодно — от редиса до mysql)

Быстрый гуглинг находит, например, www.zopyx.de/blog/goodbye-mongodb Там описаны основные проблемы, многие из которых есть до сих пор

Silver_Clash 27 ноя 2012 в 18:47

Спасибо, почитаю на досуге.

seriyPS 27 ноя 2012 в 21:34

Использую монго как хранилище для горячих данных: около 30Мб, которые очень быстро обновляются. Оно умудряется время от времени создавать серьезную нагрузку на диск и совершенно не ясно как это регулировать.
Вот взять Postgres: есть частые обновления/запись — включаем delayed_commit небольшой; нагрузка возросла — увеличиваем задержку; совсем уж не справляется — делаем репликацию и отключаем fsync.
много запросов на чтение — загоняем всю базу в shared_buffers.

В монго ничего такого нет. Есть mmap файл и хз как с ним обращаться. Разве что в последних версиях прикрутили журналирование. Но и журналирование не синхронное — остается возможность потерять часть данных. Если использовать getLastEror, то производительность станет ничем не лучше того же Postgres и красивых бенчмарков уже не получится.

meettya 27 ноя 2012 в 21:17

— nide,js великолепная штука

да, она не может больше одного ядра и нужен кластер. так он ис каропки есть, в чем проблема-то?
да, много сырых либ странного вида — в чем проблема переписать то, что вас смущает?
да, асинхронные коллбеки — тот еще ад, но есть масса способов решить вопрос, как async ko, так и message passing-ом, типа обсерверов всяких

но она очень простая, быстро разворачивается и стабильно живет + под ноду можно писать на CoffeeScript — самом человечном из языков :)

dmitriid 27 ноя 2012 в 22:29

> да, она не может больше одного ядра и нужен кластер. так он ис каропки есть, в чем проблема-то?

В том, что это — костыль. «Масштабируемая мегасуперсистема», которая неспособна использовать более одного ядра? В топку.

> в чем проблема переписать то, что вас смущает?

И сколько времени займет переписывание?

> но есть масса способов решить вопрос, как async ko, так и message passing-ом, типа обсерверов всяких

Ни один из которых не является стандартным или обкатанным в деле, да еще в комбинации с вышеупомянутой кластеризацией.

В итоге «мы истекали кровью на всем протяжении разработки»

> но она очень простая, быстро разворачивается и стабильно живет + под ноду можно писать на CoffeeScript — самом человечном из языков :)

Аргументы школьников

meettya 28 ноя 2012 в 05:26

> В том, что это — костыль. «Масштабируемая мегасуперсистема», которая неспособна использовать более одного ядра? В топку.

У Вас пруф отклеился :) Смысли какая фик разница как она это делает? Кроме ощущения фатального недостатка?

> И сколько времени займет переписывание?

Ну, вы же не школьник, можете сами прикинуть время разработки :)

> Ни один из которых не является стандартным или обкатанным в деле, да еще в комбинации с вышеупомянутой кластеризацией.

Эрлангерам расскажите, вот они удивятся :) И еще тем типам, которые книжки пишут. По паттерны программирования и всякое такое. Вы на ноде писали чего-нить? Маны читали?

> Аргументы школьников

Да я на большее и не претендую, ИМХО лучше писать на приятном языке стройные алгоритмы в понятных программах, чем пехепешить на перле, потому что «риальному спицу сирано на каком языке быдлокодить», а в результате ад и израиль — экспорт переменных, везде глобали, ре-юз кода копипастой и ифы с пролетом на триста-четыреста строк :)

dmitriid 28 ноя 2012 в 05:31

> Смысли какая фик разница как она это делает?

В школу! Учить русский язык!

> Кроме ощущения фатального недостатка?

Это не ощущение. Это именно фатальный недостаток.

> Ну, вы же не школьник, можете сами прикинуть время разработки:

Ну так прикидывайте. Если все подряд переписывать, жизни не хватит.

> Эрлангерам расскажите, вот они удивятся

Я сам эрлангер.Там для этого есть стандартные давно отлаженные приемы. Да-да, те самые паттерны. КОторые в ноде банально отсутсвуют или неприменимы.

> а в результате ад и израиль — экспорт переменных, везде глобали, ре-юз кода копипастой и ифы с пролетом на триста-четыреста строк :)

Это вы как раз про ноду, судя по всему. Как там разработчики Трелло написали? «мы истекали кровью на всем протяжении разработки».

meettya 28 ноя 2012 в 05:42

> Это не ощущение. Это именно фатальный недостаток.

Иииии, «это фатальный недостаток, потому что...»? Что? Общественность в моем лице ждет ломающихся новостей :)

> Я сам эрлангер.

Мммм… и эрленгер недоволен чистой смертью процесса, потому что жизнь того дешевле медяка? Я-то думал у вас так клуб культа процессовой смерти :)

> Там для этого есть стандартные давно отлаженные приемы.

ЛОЛ. Все приемы работы с асинхронностью — по сути дела синтаксический сахар над коллбековым адом, если по сути.

> Да-да, те самые паттерны. КОторые в ноде банально отсутсвуют или неприменимы.

МегаЛОЛ. И какой-же паттерн не может быть применен в ноде?

> Это вы как раз про ноду, судя по всему.

О, Вам виднее что же я на самом деле имел в виду? :) Нет, в ноде все отлично, а если я говорю «пехепешить на перле», значит так оно и есть.

dmitriid 28 ноя 2012 в 05:55

> Иииии, «это фатальный недостаток, потому что...»? Что? Общественность в моем лице ждет ломающихся новостей :)

Действительно, зачем использовать больше одного ядра, если они есть в системе? Обойдемся одним
Действительно, зачем VM возможность оптимизировать исполнение, раскидывая работу по нескольким ядрам
Действительно зачем избегать копирования данных при передачи их с одной VM на другую при работе на одной и той же машине?
Действительно, зачем избегать cache miss, переключения контекстов исполнения, и прочей мишуры связанной с ограничениями на один процессор и необходимостью запускать несколько VM?

Ведь «истинно масштабируемой системе» это все не надо, так ведь?

> и эрленгер недоволен чистой смертью процесса, потому что жизнь того дешевле медяка?

Школота неспособна понять, что я писал не об этом?

> Все приемы работы с асинхронностью — по сути дела синтаксический сахар над коллбековым адом, если по сути.

Нет

> И какой-же паттерн не может быть применен в ноде?

www.erlang.org/doc/design_principles/des_princ.html например

meettya 28 ноя 2012 в 06:16

> Действительно, зачем использовать больше одного ядра, если они есть в системе? Обойдемся одним
> Действительно, зачем VM возможность оптимизировать исполнение, раскидывая работу по нескольким ядрам

Запустите кластер. Я даже и не знаю как вам это еще донести.

> Действительно зачем избегать копирования данных при передачи их с одной VM на другую при работе на одной и той же машине?
> Действительно, зачем избегать cache miss, переключения контекстов исполнения, и прочей мишуры связанной с ограничениями на один процессор и необходимостью запускать несколько VM?

Мы все еще о ноде и JavaScript говорим? Вы не в состоянии сделать первое (во всяком случае разумными методами) и не в состоянии контролировать второе, пусть у VM голова и болит, что и как делать.

> Школота неспособна понять, что я писал не об этом?

Хм, а о чем?

> www.erlang.org/doc/design_principles/des_princ.html например

Многатекста про OTP Design Principles. А я спрашивал — какой конкретный паттерн проектирования не может быть реализован в ноде.

dmitriid 28 ноя 2012 в 06:19

> Мы все еще о ноде и JavaScript говорим?

Да

> Вы не в состоянии сделать первое (во всяком случае разумными методами) и не в состоянии контролировать второе, пусть у VM голова и болит, что и как делать.

Вы не способны понять, что VM неспособна сделать все, о чем я говорил

> А я спрашивал — какой конкретный паттерн проектирования не может быть реализован в ноде.

Школоло. Паттерны программирования не ограничиваются паттернами объектно-ориентированного программирования.

В общем, прекращаю этот разговор в одностороннем порядке. Мне не платят за то, чтобы обучать школьников.

meettya 28 ноя 2012 в 06:34

> В общем, прекращаю этот разговор в одностороннем порядке. Мне не платят за то, чтобы обучать школьников.

Прям пичалька.

PS. Надеюсь никогда не придется столкнутся с тем, за что вам платят. Не в обиду :)

asci 28 ноя 2012 в 08:11

Давайте я вам помогу дочитать, а то вы все время вырываете цитату из контекста — «мы истекали кровью на всем протяжении разработки, но я не никогда не видел команды, делающей интересное приложение, без кровопролития, связанного с инструментами и компонентами».
По поводу многопроцессорности, так в JS совсем недавно появилась поддержка потоков (воркеров), и люди начали ее понимать. Почему бы не сделать по такой же схеме многопроцессорное распределение? Да, печалько, что оно не шарит память, но возможности для машстабирования предусматривают не только наращивание процессоров, а и серверов и вы сможете легко и безболезненно перейти к выполнению скриптов на другом сервере (потому что память у вас не шарится и вы общаетесь только сообщениями).
А вот что меня действительно пугает, так это популярность forever. Это как бы признание того, что быстроподнятное упавшим не считается.

dmitriid 28 ноя 2012 в 08:26

> а то вы все время вырываете цитату из контекста — «мы истекали кровью на всем протяжении разработки, но я не никогда не видел команды, делающей интересное приложение, без кровопролития, связанного с инструментами и компонентами».

Люде не говорят «истекали кровью», а «было сложно», «мы столкнулись с такими-то и такими-то трудностями» и т.п.

> в JS совсем недавно появилась поддержка потоков (воркеров), и люди начали ее понимать. Почему бы не сделать по такой же схеме многопроцессорное распределение?

Ну попытайтесь его сделать в VM/фреймворке, который не поддерживает многопроцессорность и является однопоточной по определению.

> Да, печалько, что оно не шарит память, но возможности для машстабирования предусматривают не только наращивание процессоров, а и серверов и вы сможете легко и безболезненно перейти к выполнению скриптов на другом сервере

Тогда нет никакой разницы между node.js и, скажем, php-fpm. Но я понимаю, хайп, да. Не говоря о том, что возможность использовать несколько ядер не отменяет возможности масштабирования на несколько серверов, и наоборот.

> Это как бы признание того, что быстроподнятное упавшим не считается.

Ситуация с node.js вообще напомниает ранние Rails, в которых тоже все падало, глючило, все было дико сырое, но все делали хорошую мину при плохой игре. И только пару лет спустя DHH, автор Rails, сказал: это было такое говно, что мы его по скрипту прибивали и перезапускали раз в нцать минут. Точно такие же детские проблемы сейчас переживает и node.

aleks_raiden 28 ноя 2012 в 19:45

Извините, а Nginx это костыль или нет? он кстати работает так же )

dmitriid 28 ноя 2012 в 19:56

Выше, в моем комментарии: «Тогда нет никакой разницы между node.js и, скажем, php-fpm. Но я понимаю, хайп, да.»

Только nginx + php-fpm (или ruby или питон или...) не притворяются «platform for easily building fast, scalable network applications».

Если взять только Nginx, то он явно отличается от node.js хотя бы тем, что умеет работать с несколькими ядрами: nginx.org/en/docs/ngx_core_module.html#worker_cpu_affinity

aleks_raiden 28 ноя 2012 в 19:59

Нода так же умеет работать — точно теми же механизмами вроде передачи открытого сокета — nodejs.org/api/cluster.html или вас смущает название кластер — ну термин такой.

P.S. Признайтесь, что пофигу что там нода — важно, что не ваш любимый ерланг?

dmitriid 28 ноя 2012 в 20:05

> или вас смущает название кластер — ну термин такой.

Он меня не смущает. Он показывает, насколько это костыль. здесь я уже все описал

> P.S. Признайтесь, что пофигу что там нода — важно, что не ваш любимый ерланг?

Да пофиг, что. Хоть Ява. Но я понимаю, хайп — это дело такое. Заставляет любить даже очевидные недостатки.

aleks_raiden 28 ноя 2012 в 20:06

Погодите, не понял. Это стандартные механизмы ОС. Или ерланг не использует передачу сокета между процессами?????????????????

dmitriid 28 ноя 2012 в 20:11

> Погодите, не понял. Это стандартные механизмы ОС.

Вы вообще поняли, что я написал?

> Или ерланг не использует передачу сокета между процессами?????????????????

Что вы имеет в виду под «передачей сокета между процессами» и зачем это нужно процессам в Эрланге?

aleks_raiden 28 ноя 2012 в 20:15

А, то есть вы даже не понимаете, как это работает на уровне ОС? ясненько :)

dmitriid 28 ноя 2012 в 20:28

Вы читали комментарий по ссылке, что я привел? Видимо, не читали. Понять, что там написано, вы тоже не в состоянии.

Дам только домашнее задание.

Дано: обработка данных.

В случае, если VM одна, и она способна перекидывать задания самостоятельно между CPU, такая VM способна распределить нагрузку между ядрами самостоятельно. При этом той же VM доступна простейшая оптимизация: так как VM одна, то данные туда-сюда копировать не надо, достаточно передавать указатель.

В случае, если VM несколько? А ничего. Любые данные между этими VM будут копироваться при каждой попытке передать данные туда-сюда. Это, безусловно, архитектурно правильное и мегаудобное решение, ага.

Про то, что VM, знающая, что такое multicore, способна грамотно управлять процессами и структурами данных, чтобы минимизировать прочие накладные расходы, я умолчу, для вас это будет высшая математика. Радуйтесь, что вы переизобрели nginx + php-fpm под другим, более хайповым названием.

seriyPS 29 ноя 2012 в 12:38

Эрланг не использует передачу сокетов между процессами ОС.
В эрланге для SMP используются потоки а не процессы, так что передавать сокеты (как и любые другие данные) по пайпам нет необходимости.

seriyPS 28 ноя 2012 в 12:11

Вот вам пример задачки, которую я не уверен что можно в NodeJS + cluster решить:

Есть сервер с 12 ядрами. На нём запущено 12 копий NodeJS. Они обслуживают, например, 20000 клиентов.
Есть сервер с БД.
NodeJS нужно иногда к этому серверу обращаться. Чтобы не создавать на каждую сессию новое подключение к БД, нужно поддерживать пул подключений.
Как мне сделать общий пул подключений для всех 12-ти воркеров? Или скажете держать отдельный маленький пул для каждого воркера?

meettya 28 ноя 2012 в 12:36

Ох, ну как-то типа так ricochen.wordpress.com/2011/11/01/node-js-improve-mysql-query-performance-with-mysql-pool-and-cluster/
мопэд не мой, но общая идея думаю должна быть ясна.

dmitriid 28 ноя 2012 в 12:52

В итоге и получается набор костылей, скотча и «мы истекали кровью на всем протяжении разработки».

meettya 28 ноя 2012 в 13:21

твердо решили вибиться в топ серпа по ключевым словам «костыль» и «мы истекали кровью»?
фарма? :)

seriyPS 28 ноя 2012 в 13:25

Хм, интересненько.
Смущает только плашка "(!!! The project is dead !!)" на гитхабе github.com/Kijewski/node-mysql-pool

Идея не совсем ясна — как они между собой общаются? Через EventEmitter?

Пока гуглил, наткнулся на вот это: stackoverflow.com/questions/7658333/benchmarking-performance-of-node-js-cluster-with-mysql-pools-lighttpd-php

meettya 28 ноя 2012 в 13:39

наверняка есть другие варианты, у меня задачи такой не стояло, так что не в курсе как это на самом деле решается.

но сейчас под ноду много нового обвязочного кода пишется, черта лысого можно найти.

так, оффтопом — мерялись Perl, Twiggy and Redis VS CoffeeScript, Node and Redis — на разных платформах\конфигах результаты немного разные, но нода как минимум НЕ медленнее, а местами на 30% привозит. на примере простого url-shortener
так что можно спокойно писать, хуже уже не будет.

dmitriid 28 ноя 2012 в 14:58

> на примере простого url-shortener
> так что можно спокойно писать, хуже уже не будет.

# should be
# res.redirect long_url, 301
# but crashes and I dont know why :(

и трижды скопипастеный код в разных файлах.

О да, хуже действительно не будет. Просто некуда.