Comments / Profile of facha / Habr

User

Flume — управляем потоками данных. Часть 2

facha Apr 21 2016 at 13:59

Большое спасибо за статью. Есть несколько не связанных между собой вопросов. Если можете, ответьте пожалуйста.
— Когда мы выбираем Avro Source и Avro Sink, Аvro используется только для передачи? Или данные сохраняются в Avro?
— Насколько flume конкурент новомодной kafka?
— Interseptors можно писать только на java?

Как выиграть в игру с неизвестными правилами?

facha Apr 18 2016 at 15:33

Не пойму, в чем принципиальное отличие от Kaggle. В том, где исполнятется код (у меня дома или организаторов)? Но суть самой «игры» ведь та же…

Data Lake – от теории к практике. Сказ про то, как мы строим ETL на Hadoop

facha Apr 8 2016 at 08:47

Можно вопрос немного не в тему? Каких размеров у вас кластер (сколько нод, дисков, ядер, памяти)?

Песочница для программистов

facha Apr 5 2016 at 07:57

нет

-1

Песочница для программистов

facha Apr 5 2016 at 06:58

Покер. Дурак — слишком прямолинейная игра. Да и знают о нем только на просторах бывшего СССР.

-2

Настройка и использование Apache Ignite в качестве MyBatis кэш второго уровня (L2 cache)

facha Mar 30 2016 at 06:45

а также нам было интересно использовать его как единую платформу для spark и Hadoop.

Вопрос немного не по теме. Вы alluxio не пробовали для этих целей?

Большие данные и большие вопросы

facha Mar 23 2016 at 15:17

Технические проблемы, вроде недостатка инфраструктурных мощностей, можно решить с помощью использования новых технологий — например, облаков.

Объясните, кто-нибудь, где в "облаке" предполагается хранить данные? Если это EBS или S3 (предположим, у нас aws), не будет data-locality. Если это ephimeral — диски, тогда кластер нужно все время держать включенным, что дорого.

Как использовать Parquet и не поскользнуться

facha Mar 22 2016 at 07:23

Расскажите, какое вы используете хранилище (насколько я понял, это не HDFS) в кластере.

BDRA – современная архитектура для аналитики больших данных

facha Mar 15 2016 at 08:29

Вычислительные узлы и узлы хранения данных BDRA связывает высокоскоростная сеть.

Было бы интересно почитать, почему выбрано такое решение. Много где рекомендуют обратное — использовать по возможности одинаковые воркер-узлы, не разбивать их на "хранение" и "обработку". При таком подходе сводится к минимуму использование сети (кластер пытается обрабатывать данные там, где они храняться; сеть не ложится при выходе из строя одного из серверов с данными, ...).

Data Driven Realtime Rule Engine в Wargaming: сбор данных

facha Dec 22 2015 at 15:08

Пожалуйста, расскажите подробней, какую задачу решает вся эта инфраструктура. Вы вскользь упомянули про «при помощи анализа больших массивов данных в режиме реального времени позволяет персонифицировать взаимодействие с игроком через рекомендации». Но что именно там такое анализируется и зачем оно пользователю? Могли бы привести конкретные примеры?

Kudu – новый движок хранения данных в экосистеме Hadoop

facha Dec 4 2015 at 09:00

Kudu может хранить и отдавать данные, так что, наверное, надо немного перефразировать вопрос) Может ли хайв работать с таблицами в Kudu? Пока нет. Есть jira issue, но он пока без движения.

Apache Spark как ядро проекта. Часть 1

facha Nov 24 2015 at 15:42

Спасибо за комментарии. Расскажите, пожалуйста, что такое pull и push модели в контексте всех этих фреймворков. Или ссылку, если найдете.

Майкл Стоунбрейкер — Hadoop на распутье

facha Nov 3 2015 at 13:44

> но несколько лет назад они заменили MapReduce реализацией BigTable

Меня терзают смутные сомненья… Аналог BigTable в экосистеме Hadoop это HBase. HBase и MapReduce прекрасно в этой экосистеме сосуществуют: HBase — для random read, MapReduce — для batch. Другими словами, BigTable и MapReduce — это сравнение теплого с мягким.

RedHat блокирует российские учетные записи

facha May 13 2014 at 14:52

Слышал про GPS краем уха. Расскажите, пожалуйста, или дайте ссылку, что именно закроют. Всегда считал, что GPS — это спутники. Ан нет. Есть и какие-то наземные станции.

Врач-линуксоид или сисадмин-кузнец? Экосистема Хабрахабра

facha Dec 21 2013 at 15:38

IT-шникам проще. Перед тем, как вносить изменения в «продакшн» можно протестировать все в «виртуалочке». У медиков такой возможности нет. Ну и уровень ответственности отличается. Даже если IT-шник где-то очень сильно накосячит — все останутся живы :-)

Робот-автомобиль Nissan LEAF первым в Японии получил номерной знак

facha Oct 8 2013 at 14:34

Ну, я это, собственно, и имел в виду. Если водителем является робот, а хозяин машины — пассажир (у него водительских прав, скажем, нет).

Робот-автомобиль Nissan LEAF первым в Японии получил номерной знак

facha Oct 8 2013 at 14:00

Как-то слабо верится. Если этот робот-автомобиль попадет в дтп, кто будет нести ответственность?

-3

Бесплатный месяц на CodeSchool от NewRelic

facha Sep 18 2013 at 12:49

Никак не найду это «Connect to my application».

Мониторинг воровства кабеля

facha Aug 2 2013 at 12:01

В доме нет света.

Опрос. Хотели бы вы принять участие в таком проекте, как Mars One?

facha Jul 24 2013 at 11:15

Конкретно к Mars One у меня нет ни капли доверия. Уверен, что под эгидой этого проекта ничего к Марсу не полетит. Пособирают заявки (и донейты), попродают с сайта чашки… Этим все и кончится.

+13

1 2

4 5 ...

15 16