Хабр Курсы для всех
РЕКЛАМА
Практикум, Хекслет, SkyPro, авторские курсы — собрали всех и попросили скидки. Осталось выбрать!
Вот написать стабильный workflow под него — действительно непросто
Но, честно говоря, я ни разу не слышал, чтобы её использовали на практике.
На каких фактах вы строите свои предположения и делаете выводы?
Складывается ощущение, что автор нахватался чего-то по верхам и сделал поверхностный обзор на основе своего небольшого опыта.
Про flume, sqoop, oozie написан бред.
Отличительной чертой Cloudera также является стремление первыми предоставлять на рынке новые фичи
Hive — самая первая и до сих пор одна из самых популярных СУБД на этой платформе. В качестве языка запросов использует HiveQL — урезанный диалект SQL,
HBase — это распределённая версионированная нереляционная СУБДэто не бд, это hashmap of hashmaps с рядом интересных свойств. Почитайте HBase definitive guide. Даже это вам даст понимание того, насколько hbase далек от СУБД.
Oozieодно из самых вменяемых решений. Для отладки есть dryrun и e2e тесты. Для hive/impala и т.д. есть java action. Что у вас там за проблемы с либами, я вообще не понял. Что за пользовательские библиотеки? Делайте бандл и все что нужно коориднатору, воркфле кладите в lib каталог «приложения». Ози сам зацепит ресурсы в classpath. Не превращайте окружение в помойку джарников, и все будет хорошо.
Hue — Работает плохо, с ошибками и по настроению.
Sqoop — на практике Sqoop 1 оказался, по сути, однопоточным и медленным
JDBC интерфейс в виде HiveServer2 работает откровенно плохо, а бросаемые ошибки мало связаны с настоящей причиной проблемы.cool story. Откровенно плохо, это как, как это проявляется? Бросаемые ошибки связаны со спецификой инструмента. попробуйте beeswax интерфейс, тогда поймете, что значит плохо — DoS зукиперов и т.д.
Бред, это не СУБД. Это транслятор SQL в каскад MR job
Attention devops: «learn NoSQL» is not same as «learn no SQL»!
Is no such thing as Big Data. Is only data you not sampled sufficient yet so it fit in RAM and it process with SQLite.
Вранье. HDP пушит самый свежаок, клоудера крайне консервативна. Я >2 лет сижу на клоудере. Единственное, что сделала нового клоудера, так это втащила спарк, который ставится при помощи человеко-машинного комплекса. Позже, эта проблема была устранена.
Бред, это не СУБД. Это транслятор SQL в каскад MR job.
это не бд, это hashmap of hashmaps с рядом интересных свойств. Почитайте HBase definitive guide. Даже это вам даст понимание того, насколько hbase далек от СУБД.
Бред, до 3-5 млн строк в минуту без каких-либо ухищрений/костылей, терадат и экзадат. Обычное загруженное хранилище оралка.
По настроению, ок, исчерпывающее описание.
cool story. Откровенно плохо, это как, как это проявляется?
Спасибо за обзор! Было бы интересно увидеть апдейт статьи спустя 10 лет: что изменилось, куда движемся и т.п. :)
Hadoop: что, где и зачем