Их решене скорее всего бездисковое, тут же в каждую ноду встроен диск.
Данные по каждой map/reduces task будут храниться локально, что могло бы дать неплохой прирост скорости.
Если под хостинг 5 x 45 shared сайтов, то 6 x 10G не помешают.
А я про тот случай, когда внешних данных нет в таком объеме.
Задача:
Уже есть NNN Gb данных исторических и каждый час по N Gb данных новых.
Данные обрабатываются параллельно (hadoop).
На выходе 1-10Mb очетов.
На таком железе интересно было бы запустить Hadoop и тогда диски на каждой ноде очень даже пригодились.
Но стоимость убивает…
Дешевле вот такое купить.
Данные по каждой map/reduces task будут храниться локально, что могло бы дать неплохой прирост скорости.
Пока парочку таких берем, а там посмотрим :)
А я про тот случай, когда внешних данных нет в таком объеме.
Задача:
Уже есть NNN Gb данных исторических и каждый час по N Gb данных новых.
Данные обрабатываются параллельно (hadoop).
На выходе 1-10Mb очетов.
Вот зачем тут 6 x 10G?
Более легкая (и дешевая) конфигурация, думается, тоже бы нашла применение.
А вообще для Hadoop хорошо подошло бы…
Но стоимость убивает…
Дешевле вот такое купить.
Ключик пришел в 11:50 MSK