Да, но там эта задача решается запуском сразу нескольких инстансов postgresql на одной ноде. Например хотите что бы на каждом узле распараллеливание было равно 5 — запускается 5 postgresql серверов на ноде и каждый молотит свой кусок данных.
У такого подхода есть свои минусы, накладные расходы, нельзя «на лету» менять степень параллелизма.
Зря вы так, популярные аналитические продукты Vertica, Gpreenplum, netezza, Postgres-XL и т.п. базируются на PG. Они то уж найдут этой фиче применения в будущем.
Не согласен, сам работал инженером после Универа и побывал в двух ипостасиях. Как был постоянный поиск компромиссов, так он и остался. Как было конструирование системы из более простых систем — так и осталось. По сути современный «высокоуровневый» программер — инженер-конструктор.
Ты можешь писать стихи, рисовать картины, но в душе быть инженером. Одно другому не мешает
А как оно определяло эмоциональную окраску текста? Причем Твиттер сеть интернациональная и написанное может быть на любом языке?
Это надо учитывать особенности каждого языка, сленг и т.д.
Вообще, посмотрев демо с ваше сайта осталось больше вопросов чем ответов. Пока не попробуешь не поймешь.
А так штука интересная, за такими идеями будущее!
Вот насчет последнего…
Мне сложно представить как например связывать большие таблицы если мы не понимаем как они хранятся в hadoop, тем более у вас data vault где таблицы по умолчанию как бы «в нормализованном виде». Hadoop не разложит их так, что они будут очень не эффективно вязаться и скорость работы будет еще хуже чем при традиционных СУБД??
А не смотрели в сторону postgre-xl? Бесплатно, работает, можем контролировать то как таблица размазывается по кластеру…
Спасибо, интересно!
Читаю ваши статьи и поражаюсь тому как все быстро и просто у вас все получается
Скажите Informatica platform умеет так же «пушдаунить» трансформации на green plum?
Если да, то зачем вообще Hadoop нужен?
Подписался! Когда можно ждать следующую статью?
Насчет data vault, если возможно то напишите в стиле «for dummies», пока не совсем понимаю данную архитектуру, но очень хочу в этом разбираться. И умоляю, побольше картинок.
P.S.: Не вижу больших проблем с межсетевым обменом при правильном моделировании структуры.
У такого подхода есть свои минусы, накладные расходы, нельзя «на лету» менять степень параллелизма.
Ты можешь писать стихи, рисовать картины, но в душе быть инженером. Одно другому не мешает
Это надо учитывать особенности каждого языка, сленг и т.д.
Вообще, посмотрев демо с ваше сайта осталось больше вопросов чем ответов. Пока не попробуешь не поймешь.
А так штука интересная, за такими идеями будущее!
Мне сложно представить как например связывать большие таблицы если мы не понимаем как они хранятся в hadoop, тем более у вас data vault где таблицы по умолчанию как бы «в нормализованном виде». Hadoop не разложит их так, что они будут очень не эффективно вязаться и скорость работы будет еще хуже чем при традиционных СУБД??
А не смотрели в сторону postgre-xl? Бесплатно, работает, можем контролировать то как таблица размазывается по кластеру…
Читаю ваши статьи и поражаюсь тому как все быстро и просто у вас все получается
Скажите Informatica platform умеет так же «пушдаунить» трансформации на green plum?
Если да, то зачем вообще Hadoop нужен?
Пожалуй, оплачу подписку!
Насчет data vault, если возможно то напишите в стиле «for dummies», пока не совсем понимаю данную архитектуру, но очень хочу в этом разбираться. И умоляю, побольше картинок.
— Нет
— И я не вижу. А он есть©
Но это IDE поюзать хочется.