Articles / Bookmarks / Profile of kokafff / Habr

@kokafff^{read⁠-⁠only}

User

Profile Bookmarks 19

achekalin Oct 16 at 08:06

Как снизить расходы на мониторинг: замена Prometheus на VictoriaMetrics

6 min

6.4K

Server Administration*System administration*Data storage*

Recovery Mode

Translation

Мониторинг может оказаться дорогим делом из-за огромных объемов данных, которые необходимо обрабатывать. В этой статье вы узнаете о лучших способах хранения и обработки метрик мониторинга для снижения расходов и о том, как VictoriaMetrics может в этом помочь.

(cм. вторую статью из этой серии — Как снизить расходы на мониторинг: более разумный подход к данным.)

+11

cmetikova Oct 15 at 15:58

Нагружаем и отдыхаем: load testing без стресса, ч.1

Easy

10 min

1.3K

Effective Technologies corporate blogIT systems testing*

Opinion

Меня зовут Валентина, я отвечаю за качество low-code платформы Efftech.Factory в компании Effective Technologies. В этой серии публикаций я честно расскажу о практиках нагрузочного тестирования (НТ), которые мы внедрили у себя. Будет признание реальных ошибок, настоящий процесс НТ и попытки его автоматизации. Те, кто предпочитает видео, могут посмотреть моё выступление на Spring QA Meetup 2024, благодаря которому появился этот текст.

Почему я против жанра Success Story?

В историях успеха нет места для тех глупых и болезненных ошибок, которые мы в действительности совершаем. Success Stories маловероятны. Каждая такая история — это лишь узкая тропинка, которая при определенных условиях может привести вас к победе… В остальных случаях может и не повезти!)

Другое дело — «Failure Stories». Это ситуации, которые вызывают понимающую улыбку и позволяют задуматься, как не допустить подобных ошибок у себя в проекте.

Ошибаться — это нормально. На ошибках учатся) Поэтому я хочу поделиться с вами опытом совершённых мной ошибок.

+20

seasadm Nov 17 2021 at 11:17

Погружение в Helm Package Manager. Часть первая

12 min

46K

DataArt corporate blogDevOps*Kubernetes*

Tutorial

Helm — один из самых популярных пакетных менеджеров для Kubernetes. Познакомиться с ним полезно любому DevOps-инженеру и всем, кто сталкивается с задачами деплоя приложений. Эта статья — первый из двух материалов, которые можно вместе можно рассматривать как краткое, но достаточно полное введение в Helm.

+15

virus_xl Oct 3 at 09:28

Обзор k8sgpt: как искусственный интеллект помогает обучать DevOps-инженеров

Medium

28 min

14K

Флант corporate blogArtificial IntelligenceDevOps*Kubernetes*System administration*

Review

В статье мы расскажем, что за утилита k8sgpt, как её поставить, какие есть полезные опции и как подключить к ней AI. Также покажем, какого уровня диагностику можно провести с помощью этого инструмента и на какие ответы чат-бота можно рассчитывать.

+35

MaxRokatansky May 15 2020 at 13:11

Thanos — масштабируемый Prometheus

10 min

16K

OTUS corporate blogDevOps*Data storage*

Translation

Перевод статьи подготовлен специально для студентов курса «DevOps практики и инструменты».

Фабиан Рейнарц (Fabian Reinartz) — разработчик программного обеспечения, фанат Go и любитель решать сложные задачи. Также он мэйнтейнер Prometheus и соучредитель Kubernetes SIG instrumentation. В прошлом он был production-инженером в SoundCloud и возглавлял группу мониторинга в CoreOS. В настоящее время работает в Google.

Бартек Плотка (Bartek Plotka) — инфраструктурный инженер в Improbable. Увлекается новыми технологиями и проблемами распределенных систем. Имеет опыт низкоуровневого программирования в Intel, опыт контрибьютора в Mesos и production-опыт SRE мирового масштаба в Improbable. Занимается улучшением мира микросервисов. Три его любви: Golang, open source и волейбол.

Глядя на наш флагманский продукт SpatialOS, вы можете догадаться, что для Improbable нужна высокодинамичная облачная инфраструктура глобального масштаба с десятками кластеров Kubernetes. Мы были одними из первых, кто начал использовать систему мониторинга Prometheus. Prometheus способен отслеживать миллионы метрик в реальном времени и поставляется с мощным языком запросов, позволяющим извлекать необходимую информацию.

Простота и надежность Prometheus является одним из основных его преимуществ. Однако, пройдя определенный масштаб, мы столкнулись с несколькими недостатками. Для решения этих проблем мы разработали Thanos — проект с открытым исходным кодом, созданный компанией Improbable, для бесшовной трансформации существующих кластеров Prometheus в единую систему мониторинга с неограниченным хранилищем исторических данных. Thanos доступен на Github здесь.

Читать дальше →

vlstrochkov Nov 5 2020 at 15:48

Мониторинг Kubernetes с помощью Prometheus и Thanos

7 min

11K

OTUS corporate blogKubernetes*DevOps*Microsoft Azure*Database Administration*

Translation

Поздравляем! Вам удалось убедить ваше начальство в миграции приложений на микросервисную архитектуру с использованием контейнеров и Kubernetes.

Вы очень довольны и все идет по плану. Вы создаете свой первый кластер Kubernetes (у всех основных облачных провайдеров: Azure, AWS и GCP, — есть простые решения для провиженинга управляемого или неуправляемого Kubernetes), разрабатываете первое контейнерное приложение и развертываете его в кластере. Это было легко, не так ли?

Через некоторое время вы понимаете, что все становится немного сложнее: вам нужно развернуть в кластере несколько приложений, поэтому вам нужен Ingress Controller. Далее вы хотите мониторить нагрузку, поэтому вы начинаете искать решения для этого и, к счастью, находите Prometheus. Разворачиваете его, добавляете Grafana и все!

Позже вы начинаете задаваться вопросом: "Почему Prometheus работает только с одной репликой"? Что произойдет в случае рестарта контейнера? Что будет при простом обновлении версии? Как долго Prometheus может хранить метрики? Что если кластер развалится? Нужен ли еще один кластер для HA и DR? Как мне получить единое представление метрик со всех серверов Prometheus?

Что ж, продолжайте читать, умные люди уже разобрались с этими вопросами.

rosemorozenkova Sep 26 at 13:21

Готовим по рецепту: CI/CD в MLOps

Medium

15 min

4.3K

Купер corporate blogPython*Machine learning*DevOps*

Tutorial

Всем привет! Меня зовут Роза и я MLOps-инженер в Купере. Под катом расскажу, как построить CI/CD-пайплайн для ML-приложений с нуля, поэтапно и без боли. Ну почти :)

Раньше очень часто работа DS-инженера заканчивалась на подготовке кода модели в Jupyter-ноутбуке, а дальше его подхватывали команды разработки и доводили до продакшена. У такого подхода есть минусы. Например, если произойдёт инцидент, непонятно кто ответственен за сервис — команда разработки или авторы ML-модели?

К счастью, культура разработки меняется: теперь ML-инженер — это специалист, который разрабатывает свой ML-сервис на всем пути от общения с бизнесом до продакшена. Этот подход хорошо описывает принцип «you build it, you run it»: кто построил модель, тот её и запускает. Как раз в этом здорово помогает CI/CD.

Погнали!

+21

nabokihms Mar 15 at 13:06

Сбор логов в Kubernetes с помощью Vector: преимущества, архитектура, реальные кейсы

Medium

12 min

8.5K

VK corporate blogФлант corporate blogKubernetes*

Case

Всем привет! На связи Максим Набоких, архитектор и технический руководитель Deckhouse Kubernetes Platform. В ноябре 2023 года я выступил на VK Kubernetes Conf, где рассказал, как мы делаем доставку логов в Kubernetes надёжной и отказоустойчивой с помощью Vector. Эта статья — текстовая версия моего доклада.

Читать дальше →

+45

chemtech Oct 29 2021 at 10:23

Kubernetes monitoring от простого к сложному (Николай Храмчихин)

12 min

17K

DevOps*

Разберём как при помощи VictoriaMetrics замониторить kubernetes. Откуда собирать метрики и как автоматически обнаруживать новые цели. Черная магия релейблинга и как она работает. Аннотации для мониторинга приложений и что делать когда их гибкости не хватает

Читать дальше →

+16

mr_ramzes Feb 1 at 10:12

Prometheus: от основ до mem-saving оптимизации

Medium

13 min

11K

Nixys corporate blogDevOps*IT Infrastructure*System administration*

Tutorial

✏️ Technotext 2023

Мониторинг в контексте современных инфраструктур играет критически важную роль и является неотъемлемой частью успешного управления и обеспечения стабильности систем. С ростом их сложности и масштаба, а также ввиду высоких ожиданий пользователей, возникает необходимость в непрерывном и детальном контроле за работой приложений и расходом аппаратных ресурсов. Мониторинг позволяет оперативно выявлять аномалии, прогнозировать потенциальные проблемы и оптимизировать работу системы, что в свою очередь, способствует повышению производительности, надежности и экономической эффективности инфраструктурных решений. Без качественного мониторинга становится невозможным обеспечить конкурентоспособность и успешное функционирование в реалиях современного рынка IT-продуктов.

Однако, настройка мониторинга сама по себе может стать вызовом, особенно когда речь идет о крупных инфраструктурах. На многих наших проектах в качестве инструмента мониторинга мы используем довольно популярное решение — Prometheus, при работе с которым порой возникают трудности. Их изучение и последующее решение и сподвигли нас на написание данной статьи.

Читать дальше →

distol Apr 24 2018 at 13:04

Устройство и механизм работы Prometheus Operator в Kubernetes

6 min

55K

Флант corporate blogDevOps*Kubernetes*Server Administration*System administration*

В основу этой статьи легла наша внутренняя документация для DevOps-инженеров, объясняющая, как работает Prometheus под управлением Prometheus Operator в разворачиваемых и обслуживаемых кластерах Kubernetes.

С первого взгляда Prometheus может показаться достаточно сложным продуктом, но, как и любая хорошо спроектированная система, она состоит из явно выраженных функциональных компонентов и по сути делает всего три вещи: а) собирает метрики, б) выполняет правила, в) сохраняет результат в базу данных временных рядов (time series). Статья посвящена не столько самому Prometheus, сколько интеграции этой системы с Kubernetes, для чего мы активно используем вспомогательный инструмент под названием Prometheus Operator. Но начать всё же необходимо с самого Prometheus…

Читать дальше →

+25

chemtech Feb 21 2019 at 11:57

Долгосрочное хранение метрик Prometheus (Алексей Палажченко, Percona)

21 min

30K

DevOps*Open source*Database Administration*Server Administration*System administration*

За короткое время Prometheus стал одним из самых популярных средств для мониторинга. Благодаря, в том числе, и высокой скорости своей работы. Его локальное хранилище отлично подходит для краткосрочного хранения метрик и работы с ними. Иногда хочется хранить метрики распределённо месяцы и годы, автоматически разрежая старые данные, но не меняя интерфейса работы с ними.

Как раз об этом расшифровка доклада Алексей Палажченко на RootConf 2018. В докладе: Prometheus, Local Storage TSDB, Remote Storage Prometheus, PromQL, TSDB, Сlickhouse, PromHouse, немного InfluxDB.

Кому интересно, прошу под кат.

+14

shurup Sep 25 2018 at 09:29

Понимаем Container Storage Interface (в Kubernetes и не только)

6 min

19K

Флант corporate blogDevOps*Kubernetes*System administration*Data storages*

Translation

Прим. перев.: о так называемых плагинах хранилищ «вне дерева» Kubernetes (Out-of-Tree CSI Volume Plugins) мы впервые рассказывали в своём обзоре релиза K8s 1.9, где эта фича появилась в статусе альфа-версии. Автор нового материала — Anoop Vijayan Maniankara (ведущий DevOps-инженер финской компании Tuxera) — собрал ключевые сведения об идеях и устройстве CSI, что помогает быстро познакомиться с новой концепцией, которая, как утверждают некоторые наши сотрудники, «будет the next big thing». Для более подробного и технического изучения CSI в конце статьи приведены полезные ссылки, среди которых я особенно выделю презентацию одного из авторов этой спецификации (Jie Yu). Но начать всё равно стоит с «общей картины»…

Container Storage Interface (CSI) — инициатива, призванная унифицировать интерфейс хранилищ, таких как Ceph, Portworx, NetApp и т.п., в системах оркестровки контейнеров: Kubernetes, Mesos, Docker Swarm, Cloud Foundry и других. Идея в том, чтобы реализация одного CSI производителем хранилища гарантированно работала со всеми этими системами.

Читать дальше →

+20

avshkol Aug 23 2022 at 23:54

Все, что вам нужно знать об Airflow DAGs, ч.3.1 — Создание шаблонов

8 min

9.8K

Python*PostgreSQL*Apache*Data storages*Data Engineering*

Translation

Все об использовании шаблонов в Airflow с примерами кода. Продолжение серии публикаций astronomer.io

-1

avshkol Aug 21 2022 at 00:15

Все, что вам нужно знать об Airflow DAGs, ч.3 — Проектирование DAG

9 min

15K

Data Engineering*Data storages*Apache*PostgreSQL*Python*

Поскольку Airflow — это на 100% код, знание основ Python - это все, что нужно, чтобы начать писать DAG. Однако написание эффективных, безопасных и масштабируемых DAG требует учета некоторых моментов, специфичных для Airflow. В этом разделе мы рассмотрим некоторые передовые методы разработки DAG, которые максимально используют возможности Airflow.

В целом, большинство лучших практик, которые мы здесь рассматриваем, относятся к одной из двух категорий:

-3

avshkol Aug 15 2022 at 22:01

Все, что вам нужно знать об Airflow DAGs, ч.2 — Операторы и Датчики

15 min

31K

Python*PostgreSQL*Apache*Data storages*Data Engineering*

Tutorial

Translation

Операторы являются основными строительными блоками DAG Airflow. Это классы, которые содержат логику выполнения единичной работы.

Вы можете использовать операторы в Airflow, создав их экземпляры в задачах. Задача определяет работу, выполняемую оператором в контексте DAG.

Чтобы просмотреть и выполнить поиск по всем доступным операторам в Airflow, посетите Astronomer Registry. Ниже приведены примеры операторов, которые часто используются в проектах Airflow.

avshkol Aug 15 2022 at 01:06

Все, что вам нужно знать об Airflow DAGs, ч.1 — Основы и расписания

20 min

77K

Python*PostgreSQL*Apache*Data storages*Data Engineering*

Tutorial

Translation

Полное руководство по созданию DAG в Apache Airflow DAG, позволяющих создать конвейер данных из разных источников, запускаемый в определенные периоды времени с заданной логикой. Первая часть. Источник: DAGs: The Definitive Guide от astronomer.io

Добро пожаловать в полное руководство по Apache Airflow DAG, представленное командой Astronomer. Эта электронная книга охватывает все, что вам нужно знать для работы с DAG, от строительных блоков, из которых они состоят, до рекомендаций по их написанию, динамической генерации, тестированию, отладке и многому другому. Это руководство, написанное практикующими для практикующих.

chemtech Oct 22 2021 at 12:17

Kubernetes Nginx Ingress: Перенаправление трафика с использованием аннотаций

5 min

38K

Kubernetes*

Translation

Kubernetes Nginx Ingress: перенаправление трафика с использованием аннотаций

Перенаправляйте HTTP-трафик или переписывайте URL-адреса с помощью входных аннотаций Kubernetes и Nginx ingress controller. В этой статье объясняется использование аннотаций и их влияние на результирующий файл конфигурации nginx.conf.

Читать дальше →

SovaSova15 Jul 3 2023 at 18:00

Как отследить pod-to-pod-трафик Kubernetes

8 min

4.7K

Слёрм corporate blogKubernetes*

Tutorial

Translation

В этой статье мы рассмотрим тонкости сетевого взаимодействия Kubernetes и углубимся в фундаментальные принципы и механизмы, которые управляют связью между подами.

+11

Как снизить расходы на мониторинг: замена Prometheus на VictoriaMetrics

Нагружаем и отдыхаем: load testing без стресса, ч.1

Погружение в Helm Package Manager. Часть первая

Обзор k8sgpt: как искусственный интеллект помогает обучать DevOps-инженеров

Thanos — масштабируемый Prometheus

Мониторинг Kubernetes с помощью Prometheus и Thanos

Готовим по рецепту: CI/CD в MLOps

Сбор логов в Kubernetes с помощью Vector: преимущества, архитектура, реальные кейсы

Kubernetes monitoring от простого к сложному (Николай Храмчихин)

Prometheus: от основ до mem-saving оптимизации

Устройство и механизм работы Prometheus Operator в Kubernetes

Долгосрочное хранение метрик Prometheus (Алексей Палажченко, Percona)

Понимаем Container Storage Interface (в Kubernetes и не только)

Все, что вам нужно знать об Airflow DAGs, ч.3.1 — Создание шаблонов

Все, что вам нужно знать об Airflow DAGs, ч.3 — Проектирование DAG

Все, что вам нужно знать об Airflow DAGs, ч.2 — Операторы и Датчики

Все, что вам нужно знать об Airflow DAGs, ч.1 — Основы и расписания

Kubernetes Nginx Ingress: Перенаправление трафика с использованием аннотаций

Как отследить pod-to-pod-трафик Kubernetes

Information

Specialization