• Big Data от А до Я. Часть 2: Hadoop
    0
    Точнее сказать там указаны hadoop related projects at Apache т е проекты имеющие отношение к hadoop в рамках пула проектов ASF И Cassandra как относящаяся к bigdata стеку Apache имеет отношение ...
  • Apache Spark в «боевых» проектах — опыт выживания
    +5
    Сегодня пожалуй лишь Apache Hive можно считать классическим и надежным инструментом для работы с SQL запросами по распределенным данным как и HDFS является классикой среди кластерных файловых ...
  • Как использовать Parquet и не поскользнуться
    0
    К сожалению точного ответа на этот вопрос у нас нет так как непосредственно из java мы с parquet не работали работаем только из Спарка При этом parquet это лишь формат значит теоритически с ним ...
  • Спецпроекты в Сбербанк-Технологиях: как в банках готовят Hadoop, Spark, Kafka и прочую Big Data
    0
    Есть вопросы Задайте их при следующем интервью с архитекторами Сбербанка если это будет возможно 1 Зачем для спецпроектов Сбербанка использовали key value хранилище Hadoop Чем обосновывался ...
  • Map/Reduce: решение реальных задач — TF-IDF
    0
    Амазон конечно молодцы несут Hadoop в массы Но как и везде выгоды эластичного Hadoop а идут не без цены И дело не только в деньгах которые платятся за время работы вашего кластера Я ...
  • Стоит ли платить за Apache Hadoop?
    +1
    Это интеграция Apache Hadoop с SQL Server 2012 то есть они прикрутили поддержку Apache Hadoop к SQL Server Microsoft настойчиво пытаются сказать что SQL Server тоже может быть решением для Big Data ...
  • Oracle, как религия
    0
    Для меня его предназначение Хранение Есть разные способы хранения У всех есть свои плюсы минусы и предназначения На выбор оракла банками никак не влияют его возможности Но есть редкие ...
  • Технология Real Time MapReduce в Яндексе. Как ускорить что-то очень большое
    +4
    У Яндекса очень специфические задачи и хорошие программисты и пилить свой hadoop и impala вполне можно но все кто поменьше пользуются opensource и там жизнь бурлит Даже если у Яндекса выделено ...
  • Вы понимаете Hadoop неправильно
    +2
    2 года работаю c Hadoop не могу согласиться что документация по Hadoop плохая Отличное описание языков программирования Hive Pig Много достойных книг по этой технологии Да есть небольшие ...
  • Hive vs Pig. На что мне столько ETL?
    +4
    Мне кажется в статье упущен важный фактор скорость а кластеры стоят достаточно дорого Я не фанат Hive и в целом не специалист в Hadoop environment но вот мои доводы в пользу Hive В ...
  • Как мы готовим будущих специалистов по большим данным
    +2
    Весь мир переходит на Spark а мы учим умирающий Hadoop 1 0 Может я невнимательно читал но я не увидел где в статье идёт речь про Hadoop 1 0 На задаче где не нужен Hadoop спокойно можно за ...
  • Переход из SQL на NoSQL: опыт проекта СМЭВ 2.0
    +4
    С появлением в картинке Exadata и разворачиванием Cassandra+Hadoop на виртуальных машинах ситуация начинается проясняться Я не в курсе истории но скорее всего она выглядела приблизительно так ...
  • Big Data от А до Я. Часть 2: Hadoop
    0
    С ростом популярности Hadoop появились компании такие как Cloudera Hortonworks MapR которые предоставляют собственные сборки Hadoop и мощные средства для управления Hadoop кластером В ...
  • Майкл Стоунбрейкер — Hadoop на распутье
    +2
    Полезный перевод спасибо Стоунбрейкер давно критикует Hadoop Наверное с 2009г со статьи в SIGMOD 2009 тут есть ссылка database cs brown edu projects mapreduce vs dbms И судя по этим более ...
  • Эволюция структур данных в Яндекс.Метрике
    0
    Hadoop гораздо лучше подходит для offline вычислений когда нужно много ворочать данными В Hadoop больше инструментов для всесторонней обработки данных А ClickHouse лучше подходит для онлайн ...
  • Big Data головного мозга
    0
    Алексей во первых вам большой респект за HAWQ активно слежу за этим проектом Spark не MPP это тот же Batch Processing Понятие МРР я восринимаю буквально массивно параллельный процессинг ...
  • Hadoop Distributed File System
    +1
    следует понимать что проект Hadoop состоит из Hadoop Core HDFS + MapReduce + Api Hbase ZooKeeper Вот если речь идет о Hadoop Core то новая архитектура SpyLog использует только ее
  • Google издевается над веб-сервисами Microsoft
    +2
    Hadoop вышел много позже Источником вдохновения для разработчиков Hadoop послужили материалы по Google File System GFS ru wikipedia org wiki Hadoop
  • С# сейчас гораздо лучше, чем Java
    0
    Dryad делает то же самое что и MapReduce Hadoop research microsoft com en us projects Dryad Hadoop Sharp code google com p hadoop sharp MapReduce NET www developerzen com 2009 05 06 ...
  • С# сейчас гораздо лучше, чем Java
    0
    Не знаю насчет абстрактности wiki apache org hadoop Hadoop MapReduce + DFS Позволяет раздавать кластеризуемые задачи на множество узлов а потом собирать результат компонент MapReduce ...

Самое читаемое