Pull to refresh

Comments 3

Apache Spark — это типичное «облачное» решение, предназначенное для эффективного использования ресуросов кластера из относительно недорогих машин. Не очень понятно, зачем оно на мэйнфрейме. Не в том смысле, что бесполезно, а в том смысле, что кластер под MR можно было бы сделать из существенно более дешевого железа.
Сначала нам предлагают запускать Hadoop на блейд-серверах с размещением данных в СХД. Теперь нам предлагают запускать Hadoop и Spark на мейнфреймах. Самое печальное здесь то, что люди, принимающие решение о внедрении конкретных продуктов, зачастую не являются экспертами и доверяют крупным брендам вроде IBM и аналитическим агентствам их поддерживающим, вроде Gartner. В итоге внедряются нежизнеспособные системы, которые просто не взлетают
We have put our data into NoSQL for the people who don't know SQL. Then we have installed SQL on top of NoSQL for the people who want to work with the data.
Sign up to leave a comment.