Articles / Profile of chemtech / Habr

Пацев Антон @chemtech

DevOps-инженер

ProfileArticles184PostsNewsComments730

chemtech Oct 1 2020 at 08:02

DataHub с открытым исходным кодом: платформа поиска и обнаружения метаданных от LinkedIn

12 min

Big Data * DevOps * IT Infrastructure *

Translation

DataHub с открытым исходным кодом: платформа поиска и обнаружения метаданных от LinkedIn

Быстрый поиск нужных данных необходим для любой компании, которая полагается на большое количество данных для принятия решений на основе этих данных. Это не только влияет на продуктивность пользователей данных (включая аналитиков, разработчиков машинного обучения, специалистов по обработке данных и инженеров данных), но также оказывает прямое влияние на конечные продукты, которые зависят от качественного конвейера машинного обучения (ML). Кроме того, тенденция к внедрению или созданию платформ машинного обучения естественным образом вызывает вопрос: каков ваш метод внутреннего обнаружения функций, моделей, показателей, наборов данных и т. Д.

Читать дальше →

chemtech Sep 28 2020 at 08:27

DataHub: универсальный инструмент поиска и обнаружения метаданных

14 min

14K

Big Data * DevOps * IT Infrastructure *

Translation

DataHub: универсальный инструмент поиска и обнаружения метаданных.

Как оператор крупнейшей в мире профессиональной сети и экономического графика, отдел данных LinkedIn постоянно работает над масштабированием своей инфраструктуры в соответствии с требованиями нашей постоянно растущей экосистемы больших данных. По мере роста объема и разнообразия данных специалистам по данным и инженерам становится все сложнее обнаруживать доступные активы данных, понимать их происхождение и предпринимать соответствующие действия на основе полученных данных. Чтобы помочь нам продолжить масштабировать производительность и вносить инновации в базу данных, мы создали универсальный инструмент поиска и обнаружения метаданных, DataHub.

Читать дальше →

chemtech Sep 17 2020 at 07:42

Kubernetes для тех, кому за 30. Николай Сивко (2018г)

16 min

14K

DevOps * Kubernetes *

Мы в okmeter.io в какой-то момент поняли, что нам тоже нужен k8s в production, хотя у нас нет даже CI/CD, но есть задача делить общий пул серверов между приложениями и достаточно легко добавлять мощности в кластер. При этом был ряд обстоятельств, которые усложняли внедрение k8s:

мы очень заботимся об отказоустойчивости (мы не притаскиваем новые технологии в prod, пока не разберемся в них на достаточном уровне);
у нас есть сервисы со временем ответа меньше 10ms;
у нас очень мало человеческих ресурсов на эту задачу (узнать 10 новых терминов ОК, 50 — уже нет).

+15

chemtech Sep 16 2020 at 07:14

Почему Trunk Based Development – лучшая модель ветвления. Андрей Александров

10 min

115K

Git * DevOps *

В State Of DevOps 2018 от DORA мы видим, что Нigh Performing компании используют Trunk Based Development. Разберемся, почему именно ее, какие ее преимущества и недостатки имеет эта модель.

Читать дальше →

chemtech Sep 15 2020 at 07:23

Возможности ClickHouse для продвинутых разработчиков. Алексей Миловидов (2018г)

23 min

19K

Data storage * Big Data * SQL * System administration * High performance *

В докладе планируется рассмотреть малоизвестные или недостаточно хорошо освещённые в документации возможности ClickHouse: инкрементальная агрегация и манипуляции с состояниями агрегатных функций, межкластерное копирование, выполнение запросов без использования сервера и т.п. Будут приведены примеры из практики разработки сервисов Яндекса: как выжать из системы максимум возможного.

+12

chemtech Sep 11 2020 at 07:41

VictoriaMetrics и мониторинг приватных облаков. Павел Колобаев

9 min

45K

DevOps * IT Infrastructure * Data visualization * System administration *

VictoriaMetrics — быстрая и масштабируемая СУБД для хранения и обработки данных в форме временного ряда (запись образует время и набор соответствующих этому времени значений, например, полученных через периодический опрос состояния датчиков или сбор метрик).

+15

chemtech Sep 9 2020 at 10:26

Continuous Integration как практика, а не Jenkins. Андрей Александров

21 min

5.4K

DevOps *

Обсудим почему CI-инструменты и CI – это совсем про разное.

Какую боль CI призвано решить, откуда возникла идея, какие последние подтверждения что оно работает, как понять что у вас есть именно практика, а не просто установленный Jenkins.

chemtech Sep 8 2020 at 07:27

Типичные ошибки при построении высокодоступных кластеров и как их избежать. Александр Кукушкин

18 min

8.6K

PostgreSQL * Database Administration * System administration *

Вы только что установили PostgreSQL и запустили ваш первый кластер, создали несколько таблиц, загрузили данные, и даже немного подкрутили конфигурацию PostgreSQL для улучшения производительности. Теперь вы думаете о том, как сделать ваш кластер высокодоступным. К сожалению, PostgreSQL не умеет сам выполнять автоматическое переключение при недоступности мастера, но, к счастью для нас, этого можно достичь с помощью сторонних утилит. Задача ясна, и вы начинаете изучать преимущества и недостатки всех утилит, чтобы выбрать лучшую. И… вы уже на неправильном пути, потому что в первую очередь вы должны определиться со значениями SLA, RTO и RPO. В этом докладе я планирую рассказать о ряде ошибок, которые допускают администраторы баз данных при настройке и эксплуатации высокодоступного кластера Постгреса с автоматическим переключением.

Читать дальше →

+11

chemtech Sep 7 2020 at 07:59

Забиваем телескопом гвозди или нестандартные способы использования ClickHouse. Александр Зайцев (2018г)

18 min

6.2K

Data storage * Big Data * SQL * System administration * High performance *

ClickHouse — open-source DBMS от Яндекса — традиционно используется для аналитики различного рода логов или потоков событий от онлайн-систем. Однако, гибкость ClickHouse позволяет применять его для более широкого класса задач.

+14

chemtech Sep 4 2020 at 07:23

Описание инфраструктуры в Terraform на будущее. Антон Бабенко (2018г)

20 min

10K

System Programming * IT Infrastructure * DevOps * Amazon Web Services *

Многие знают и используют Terraform в повседневной работе, но для него до сих пор не сформировались лучшие практики. Каждой команде приходится изобретать свои подходы, методы.

Ваша инфраструктура почти наверняка начинается просто: несколько ресурсов + несколько разработчиков. Со временем она растёт во всевозможные стороны. Вы находите способы сгруппировать ресурсы в Terraform-модули, организовать код по папкам, и что здесь вообще может пойти не так? (известные последние слова)

Проходит время, и вы чувствуете, что ваша инфраструктура — это ваш новый питомец, но почему? Вас беспокоят необъяснимые изменения в инфраструктуре, вы боитесь прикасаться к инфраструктуре и коду — в итоге вы задерживаете новый функционал или снижаете качество…

После трёх лет управления на Github коллекцией community-модулей Terraform для AWS и долгосрочном поддержании Terraform в продакшене, Антон Бабенко готов поделиться своим опытом: как писать TF-модули, чтобы не было больно в будущем.

К концу доклада участники будут лучше знакомы с принципами управления ресурсами в Terraform, лучшими практиками, связанными с модулями в Terraform, и некоторыми принципами непрерывной интеграции, связанными с управлением инфраструктурой.

+17

chemtech Sep 3 2020 at 07:22

Лучшие DevOps практики для разработчиков. Антон Бойко (2017г.)

18 min

DevOps *

В докладе будет рассказано о некоторых DevOps практиках, но с точки зрения разработчика. Обычно все инженеры, которые приходят в DevOps, уже имеют за плечами несколько лет опыта администрирования. Но это не означает что разработчику тут нет места. Чаще всего разработчики заняты тем, что исправляют "очередной срочно-критичный баг дня", и у них нет времени даже одним глазком взглянуть на DevOps сферу. В понимании автора DevOps — это, во-первых, здравый смысл. Во-вторых — это возможность быть более эффективным. Если вы разработчик, обладаете здравым смыслом и хотите быть более эффективным как командный игрок — доклад для вас.

chemtech Sep 1 2020 at 11:06

ELK, SIEM из OpenSource, Open Distro: Case management

8 min

12K

Server Administration * Information Security * IT Infrastructure * DevOps * Big Data *

Translation

В сегодняшней статье мы поставим последний кусочек пазла на его место. Мы собираемся представить вам часть нашего SOC, касающуюся управления делами. Мы использовали две технологии с открытым исходным кодом — TheHive и Cortex.

TheHive будет использоваться в качестве платформы управления оповещениями для нашего проекта, которая может управлять оповещениями об инцидентах от создания до закрытия. Между тем, Cortex — это дополнительный программный продукт от той же команды, что и TheHive, который дополняет его функцией обогащения данных с помощью своих «анализаторов» и «респондентов».

Читать дальше →

chemtech Aug 27 2020 at 07:28

ELK, SIEM из OpenSource, Open Distro: Составление отчетов

3 min

5.6K

Server Administration * Data visualization * IT Infrastructure * DevOps * Big Data *

Чтобы защитить вашу корпоративную сеть от угроз и атак, вы всегда должны выполнять тест на уязвимости в своей системе. Для того, чтобы их исправить. Итак, как вы понимаете, работа с отчетами очень важна для любого SOC, потому что она дает обзор уязвимостей, которые могут быть в вашей системе.

В этой статье мы расскажем вам об инструменте, который мы использовали для создания отчетов и сканирования уязвимостей.

Читать дальше →

chemtech Aug 25 2020 at 07:49

ELK, SIEM из OpenSource, Open Distro: Оповещения (алерты)

6 min

13K

Big Data * DevOps * IT Infrastructure * Data visualization * Server Administration *

Translation

Здравствуйте и добро пожаловать в нашу новую статью, в которой будет рассказано об оповещениях (алертах) в нашем решении SOCaaS. Как вы все знаете, предупреждения в любом SOC играют жизненно важную роль при уведомлении группы реагирования.

Они могут прервать цепочку кибер-атак или отслеживать эту атаку, в зависимости от политики предприятия и команды. Вы, наверное, задаетесь вопросом, зачем нам нужно включать больше предупреждений. Разве модулей предупреждений Open Distro недостаточно? Это потому, что ему не хватает количества выходов и его интегрируемости с остальной частью нашего решения, например Thehive. Мы познакомим вас с другой альтернативой.

Читать дальше →

chemtech Aug 24 2020 at 08:19

ELK, SIEM из OpenSource, Open Distro: Интеграция с WAZUH

6 min

33K

Server Administration * Data visualization * IT Infrastructure * DevOps * Big Data *

Translation

Продвигаемся дальше по нашему проекту. Мы завершили часть SIEM. Пришло время перевести наш проект из простого наблюдателя в активного ответчика. Одним из важных инструментов, которые мы использовали для этого, является Wazuh. В этой статье мы надеемся просветить вас о преимуществах, предлагаемых этим инструментом. А также расскажем как его установить и использовать.

Wazuh — это механизм обнаружения, просмотра и сравнения соответствия безопасности с открытым исходным кодом.

Он был создан как форк OSSEC HIDS, позже был интегрирован с Elastic Stack и OpenSCAP, которые превратились в более комплексное решение.

Wazuh помогает вам получить более глубокую видимость безопасности в вашей инфраструктуре, отслеживая хосты на операционной системе и уровне приложений.

Читать дальше →

chemtech Aug 21 2020 at 07:43

ELK, SIEM из OpenSource, Open Distro: Визуализация информационных панелей ELK и SIEM в ELK

4 min

10K

Big Data * DevOps * IT Infrastructure * Data visualization * Server Administration *

Translation

В этом посте будет описана настройка визуализации информационных панелей ELK и SIEM в ELK
Статья разделена на следующие разделы:

1- Обзор ELK SIEM
2- Дашборды по умолчанию
3- Создание ваших первых дашбордов

Читать дальше →

chemtech Aug 20 2020 at 08:27

ELK, SIEM из OpenSource, Open Distro: Прогулка по open Distro

6 min

14K

Server Administration * Data visualization * IT Infrastructure * DevOps * Big Data *

Translation

В этом посте будет описана установка и настройка open Distro для Elasticsearch.
В open Distro доступны следующие плагины:

Безопасность (Security )
Оповещение (Alerting )
SQL
Управление информационной безопасностью (ISM)
Анализатор производительности (Performance Analyzer )

Читать дальше →

+11

chemtech Aug 19 2020 at 07:31

ELK, SIEM из OpenSource, Open Distro: ELK stack — установка и настройка

7 min

22K

Big Data * DevOps * IT Infrastructure * Data visualization * Server Administration *

Translation

ELK SIEM Open Distro: ELK stack — установка и настройка.

В этой главе будет описана установка и настройка ELK стека. Можно было бы эту главу пропустить и не переводить, но тогда потеряется нить между оригинальными главами.

Читать дальше →

chemtech Aug 18 2020 at 07:33

ELK, SIEM из OpenSource, Open Distro: Введение. Развертывание инфраструктуры и технологий для SOC как Service (SOCasS)

6 min

23K

Server Administration * Data visualization * NoSQL * IT Infrastructure * Big Data *

Translation

ELK SIEM Open Distro: Введение. Развертывание инфраструктуры и технологий для SOC как Service (SOCasS)

За последние пару лет количество кибератак зашкаливает. Эти атаки нацелены не только на отдельных людей, но и на фирмы, правительства, критическую инфраструктуру и т. д. Традиционные решения, такие как антивирус, брандмауэр, NIDS и NIPS, больше не являются достаточными из-за сложности атак и их подавляющего количества.

Эта серия статей были задуманы как построение аналога SIEM на полном опенсорсе. Подробности будут представлены в следующих статьях.

Читать дальше →

chemtech Aug 12 2020 at 07:45

Эффективное использование ClickHouse. Алексей Миловидов (Яндекс)

24 min

34K

High performance * System administration * SQL * Big Data * Data storage *

Так как ClickHouse является специализированной системой, при его использовании важно учитывать особенности его архитектуры. В этом докладе Алексей расскажет о примерах типичных ошибок при использовании ClickHouse, которые могут привести к неэффективной работе. На примерах из практики будет показано, как выбор той или иной схемы обработки данных может изменить производительность на порядки.

+21

1 2 3 4

6 7 8 9 10