Комментарии / Профиль alexkrash / Хабр

Как стать автором

Крашенинников Александр @alexkrash

Пользователь

Профиль Публикации 2Комментарии 40Закладки 2

Мы на Highload++ в этом ноябре: задай вопрос инженерам Badoo

alexkrash 23 окт 2017 в 11:59

В настоящий момент мы проводим эксперименты по применению ClickHouse к нашей системе потоковой агрегации событий. В общем и целом, нам удалось найти схему хранения, которая удовлетворяет нашим задачам. Осталось дело за одним нюансом — мы ждём кастомного партицирования. Нужно оно нам из соображений партицирования — мы не хотим хранить месяц данных (на самом деле — два, т.к. удалять можно только по месяцу), т.к. нам нужно максимум 1-2 дня.
Когда система войдёт в production использование, мы выпустим статью на эту тему.

+1

Посмотреть

Выбор алгоритма вычисления квантилей для распределённой системы

alexkrash 10 июл 2017 в 13:35

Ваши замечания вполне справедливы, однако я не был бы столь категоричен насчёт этого:

HDR выглядит явным фаворитом уже из описания

Вставка в него, безуловно, быстра. Однако, как я упоминал выше, у нас все вычисления происходят на M/R, что означает что модель у нас не мутабельна (т.е. мы не производим модификации) — бенефиты от CAS на элементы массива счётчиков нам бесполезны
Необходимость иметь представление о верхней границе диапазона измеряемых значений. Поначалу мы считали, что имплементация с такими ограничениями для нас неприемлема, но со временем решили включить её в API системы дополнительно, наряду с неограниченными рядами на основании Algebird.

+1

Посмотреть

Как получить оффер в день собеседования. Часть вторая, для PHP-разработчика

alexkrash 20 июн 2017 в 11:15

В BI мы разрабатываем распределённые приложения для обработки данных. Стек технологий — Spark + Hadoop + Java, т.к. Java нативна для Хадупа. Система построена в тесной интеграции с PHP-backend'ом (существует DSL для описания событий, PHP-API для их отправки, различные GUI для работы с данными), так что можно смело называть связку «Java + PHP».

+1

Посмотреть

Как получить оффер в день собеседования. Часть вторая, для PHP-разработчика

alexkrash 9 июн 2017 в 12:33

Если вы больше про backend всё же (прямо огонь, если Java + PHP), то можно мне написать.

+2

Посмотреть

О том, как мы начинали разрабатывать собственную систему управления проектами и что из этого получилось

alexkrash 23 мар 2017 в 13:12

Внутри система представляла собой обыкновенный сайт, написанный функциональным стилем.

К проектам на PHP, как правило, применимо «процедурным» стилем (если имелось в виду нагромождение функций, а не оперирование функциями высших порядков).

+1

Посмотреть

Badoo time-series storage: итак, она звалась Кассандрой

alexkrash 23 мар 2017 в 12:39

Такой вариант уже существовал в виде rrd-кластера (за вычетом резервирования), и менять шило на мыло выглядит не вполне целесообразно.

+4

Посмотреть

Распределённый xargs, или Исполнение гетерогенных приложений на Hadoop-кластере

alexkrash 15 фев 2017 в 17:10

Спасибо за ещё один инструмент в копилку!
Как я написал в комментарии ниже, за счёт spawn'а remote shell, мы рискуем оставить после себя долгоиграющий неприбитый процесс, что для нас неприемлемо. Ну и да, опять — где брать список хостов, и т.д.

0

Посмотреть

Распределённый xargs, или Исполнение гетерогенных приложений на Hadoop-кластере

alexkrash 15 фев 2017 в 17:04

В общем случае, любой кластер, где производятся подобного рода вычисления, является statless. Это означает, что после выполнения программы, все артефакты (временные файлы), которые она наплодила, должны быть уничтожены. Для сохранения каких-либо результатов следует использовать shared-ресурсы (база данных, HDFS).
Конкретно в случае нашей задачи, мы на Python производим вычисления и записываем результат в файл в текущей рабочей директории. Когда бизнес-логика отработала, файл заливается в HDFS (из этого же процесса).
В случае краха процесса/уничтожения YARN контейнера, рабочая директория контейнера уничтожается, и мы не мусорим локальную FS кластера.

0

Посмотреть

Распределённый xargs, или Исполнение гетерогенных приложений на Hadoop-кластере

alexkrash 15 фев 2017 в 16:50

Спасибо за комментарий и интересный инструмент!
Из входных данных проекта https://github.com/cheusov/paexec/:

Small program that processes a list of tasks in parallel on different CPUs, computers in a network or whatever.

Очень похоже на то, что выполняет наша утилита.
А здесь: https://github.com/cheusov/paexec/blob/master/paexec/paexec.pod

Tasks are read by paexec from stdin and are represented as one line of text, i.e. one input line — one task.

И здесь мы схожи.

Выходит, что реализации схожи, и, с моей точки зрения, обе могут называться «распределённым xargs» :)

Со своей колокольни обратил внимание на пару вещей, из-за которых мы бы не стали этот инструмент брать в рассмотрение:

https://github.com/cheusov/paexec/blob/master/paexec/paexec.pod

Remember that empty line MUST NOT appears in general result lines

Мы ограничены форматом output'а того, что мы запускаем на удалённой стороне.

Последовательность fork-exec

krash@krash:~$ paexec -t '/usr/bin/ssh -x' -n 'cloud1' -c '/usr/bin/uptime; echo ""' -d
nodes_count = 1
nodes [0]=cloududs1
cmd = uptime; echo ""
start: init__read_graph_tasks
start: init__child_processes
running cmd: /usr/bin/ssh -x cloududs1 'env PAEXEC_EOT='\'''\''  /bin/sh -c '\''/usr/bin/uptime; echo ""'\'''

Команды транспорта опускаем, рассмотим то, что запускается на удалённой стороне:

/bin/sh -c "/usr/bin/uptime"

При выполнении этой команды, мы получим на удалённой стороне последовательность fork-exec, которая сначала запустит /bin/sh, а затем — fork-exec для /usr/bin/uptime.
Я запустил paexec, указав в качестве команды пользователя /usr/bin/sleep 1000, затем прервал выполнение paexec через SIGINT.
Что мы получаем в результате? Правильно — на удалённом хосте у нас висит /usr/bin/sleep (аналог нашего долгоиграющего приложения).
Т.е. при прерывании работы управляющего приложения, дочерние не прибиваются. Именно по этой причине, мы в своей реализации не используем spawn shell'а, а сразу зовём execve приложения.

0

Посмотреть

Распределённый xargs, или Исполнение гетерогенных приложений на Hadoop-кластере

alexkrash 15 фев 2017 в 16:10

Честно говоря, мы не сильно углублялись в нутра parallel, т.к. широкого применения он у нас не имеет, а предварительные изыскания показали его неприменимость к нашей задаче.
Помимо загруженности хоста есть ещё понятие «доступности» (выключен, например, или gracefully выводится из эксплуатации :). Также, нам не хочется держать где-то в конфиге список хостов и их технические характеристики — пусть это будет головной болью кластер-менеджера.

0

Посмотреть

SmartMonitoring — мониторинг бизнес-логики в Одноклассниках

alexkrash 14 фев 2017 в 01:39

Скажите, пожалуйста, какова частота обновления точек у одной метрики, с которой работает Anomaly Detector? Т.е. каков временной юнит, которым оперирует AD?

И ещё вопрос — какова «пропускная способность» детектора?
Т.е. сколько метрик обслуживает инстанс AD, в пересчёте на ядра/память?

0

Посмотреть

Обзор конференций, на которых мы побывали в 2016 году

alexkrash 30 ноя 2016 в 12:56

Помимо Android, Java используется только в среде BI (Hadoop, Spark), т.е. массово распространения не имеет.
В связи с этим, тематические Java конференции посетило малое количество народа, и их не включили в список.

+3

Посмотреть

Что такое облака и мифы о них в головах ИТшников: мнения, стереотипы и жизнь в «облаках»

alexkrash 24 авг 2016 в 01:34

«Если в Германии – будет долго»

round trip time из МСК/СПБ до вашего ДЦ можете привести, пожалуста?

+1

Посмотреть

SoftMocks: наша замена runkit для PHP 7

alexkrash 18 мар 2016 в 17:27

Это, бесспорно, круто, но не придётся ли тем же заниматься с новой версией PHP?

0

Посмотреть

Apache Spark или возвращение блудного пользователя

alexkrash 4 сен 2015 в 15:06

У Вас в драйвере по таймеру запускается updateConditions(), который модифицирует rdd.
1.) Насколько я понимаю, размер этой коллекции должен быть мал, т.к. она должна быть послана через broadcast на всех executor'ов — это так? Если нет — расскажите, пожалуйста.
2.) У меня в приложении есть такая же необходимость — со временем обновлять некий конфиг, и доставлять его на executor'ов. Но, согласно документации, чтобы применилось синхронно на всех executor'ах, это должен быть либо ручной broadcast, либо неявный — через сериализатор лямбд. Недокументировано то, что при обновлении в драйвере, изменения разъедутся по executor'ам. Насколько стабильно/синхронно у Вас применяются эти изменения? Или в Вашем случае допустимо несинхронное применение изменений, и Вы о нем знаете?

0

Посмотреть

Apache Spark или возвращение блудного пользователя

alexkrash 4 сен 2015 в 15:00

Наверное, здесь произошла «типичная подмена понятий». Вы имели в виду из executor'а (исполнителя юзерских лямбд)? А какого рода конфигурация нужна? Для своих нужд я вполне обхожусь broadcast'ами, или сериализуемым своим классом с настройками.

0

Посмотреть

36 млн запросов в час, 10000+ постоянно работающих клиентов, на одном сервере, nginx+mysql

alexkrash 14 июл 2015 в 22:22

Честно говоря, 400 инсертов в секунду для одного сервера MySQL это ничто :) Другое дело, что тут всё на одной железяке.

+1

Посмотреть

Badoo PHP Code Formatter. Теперь в open source!

alexkrash 7 авг 2014 в 17:20

Согласен, выглядит несколько пугающе, но при рассмотрении вариантов:

1.) То же самое, в XML (плюсов с ходу не вижу, из минусов — потребить больше памяти, написать парсер конфига)
2.) Инструкции, подобно тому, как PHP: lxr.php.net/xref/PHP_5_5/Zend/zend_language_parser.y (опять же, подсистему парсинга, но теперь уже — псевдокода конфига)
3.) Сделать OOP-интерфейс для правил переходов

$State
->when($ContextPredicate)
->then($Transition)
->done($ReverseTransition); // (а-ля Promises, не обещает быть меннее монстроузным)

и для правил форматирования


$ClassToken
->inContext($ClassDefinitionContext)->do($IndentIncreateAction)
->inContext($ClassReferenceContext)->do($IndentIncreateAction);

4.) Текущая реализация (минимальный memory footprint, возможность программирования конфига на языке приложения)

Последний вариант мне кажется наиболее оптимальным.

+3

Посмотреть

Badoo PHP Code Formatter. Теперь в open source!

alexkrash 6 авг 2014 в 12:35

Проблема форматирования связана с комбинированным использованием PHP + HTML в файле.
По инциденту заведен Issue на github, спасибо за репорт.

+1

Посмотреть

Badoo PHP Code Formatter. Теперь в open source!

alexkrash 5 авг 2014 в 14:42

Наш pre-receive хук проверяет плохое форматирование, используя phpcf. Т.е. производится форматирование измененных строк, и, если там код не отформатирован, коммит не проходит.

+5

Посмотреть

2