Articles / Bookmarks / Profile of kirillkosolapov / Habr

Кирилл Косолапов @kirillkosolapov

CEO Amvera

Profile Publications 34Comments 97Bookmarks 69

clickfreak Oct 8 2013 at 12:59

Система управления Ansible

25 min

237K

Selectel corporate blog

Tutorial

Представьте себе, что вам нужно управлять парком серверов, расположенных к тому же в разных географических точках. Каждый из этих серверов требует настройки, регулярного обновления и мониторинга. Конечно, для решения этих задач можно воспользоваться самым простым способом: подключиться к каждому серверу по ssh и внести необходимые изменения. При всей своей простоте этот способ сопряжен с некоторыми трудностями: он чрезвычайно трудоемок, а на выполнение однообразных операций уходит очень много времени.

Чтобы упростить процессы настройки и конфигурирования серверов, можно также писать shell-скрипты. Но и этот способ вряд ли можно назвать совершенным. Скрипты нужно постоянно изменять, подстраивая их под каждую новую задачу. При их написании необходимо учитывать различие операционных систем и версий. Не будем забывать и о том, что отладка скриптов отнимает много усилий и забирает немало времени.

Оптимальным вариантом решения описанных проблем является внедрение системы удаленного управления конфигурацией. В таких системах достаточно лишь описать нужное состояние управляемого узла. Система должна сама определить, что нужно сделать для достижения этого состояния, и осуществит все необходимые действия.

Со всеми сложностями, о которых идет речь выше, мы хорошо знакомы на собственном опыте: у нас имеется 10 точек присутствия с NS-серверами, расположенные в разных точках планеты. На них необходимо регулярно вносить различные изменения: обновлять операционную систему, устанавливать и обновлять различное ПО, изменять конфигурцию и т.п. Мы решили все эти операции автоматизировать и внедрить систему удаленного управления конфигурациями. Изучив имеющиеся решения, мы остановили свой выбор на Ansible.

В этой статье мы бы хотели подробно рассказать о его возможностях этого инструмента управления конфигурациями и поделиться собственным опытом его использования.

Читать дальше →

+44

chemtech Aug 20 2020 at 11:27

ELK, SIEM из OpenSource, Open Distro: Прогулка по open Distro

6 min

13K

IT Infrastructure*Server Administration*Big Data*Data visualization*DevOps*

Translation

В этом посте будет описана установка и настройка open Distro для Elasticsearch.
В open Distro доступны следующие плагины:

Безопасность (Security )
Оповещение (Alerting )
SQL
Управление информационной безопасностью (ISM)
Анализатор производительности (Performance Analyzer )

Читать дальше →

+11

Cloud4Y Jul 15 2019 at 12:05

5 open-source систем управления событиями безопасности

5 min

34K

Information Security*Open source*IT Infrastructure*Cloud4Y corporate blogIT-companies

Чем хороший безопасник в ИТ-сфере отличается от обычного? Нет, не тем, что он в любой момент времени по памяти назовёт количество сообщений, которые менеджер Игорь отправил вчера коллеге Марии. Хороший безопасник старается выявить возможные нарушения заранее и отлавливать их в режиме реального времени, прилагая все силы, чтобы не было продолжения инцидента. Системы управления событиями безопасности (SIEM, от Security information and event management) значительно упрощают задачу быстрой фиксации и блокировки любых попыток нарушений.

Читать дальше →

+17

kadim Aug 30 2021 at 15:44

Автоматизация из первых рук: что такое платформа ServiceNow и как мы ее используем

6 min

9.9K

IT Infrastructure*Help Desk Software*Service Desk*Quadcode corporate blog

Technotext 2021

Привет, Хабр! Продолжаем рассказывать о собственных кейсах, задачах, проблемах и способах их решения. Сегодня поговорим о платформе ServiceNow и о том, как мы с ее помощью управляем инцидентами.

ServiceNow — это практически универсальный комбайн, который может пригодиться многим компаниям любого масштаба. Наверное, проще перечислить, что платформа не умеет, чем то, что она способна делать, поскольку возможности ServiceNow очень обширные. ServiceNow — это PaaS, который позволяет автоматизировать большинство ITSM-процессов, включая Help Desk, мониторинг сервисов, управление их доступностью, управление поставщиками, изменениями, конфигурациями, инфраструктурой и, конечно, инцидентами и событиями. Это первая статья из цикла материалов о ServiceNow, надеемся, наш опыт пригодится читателям Хабра. Приступим.

+10

JetHabr Mar 30 2022 at 11:28

Как мы «завели» десятки команд в один кластер OpenSearch и разделили доступы

7 min

3.3K

Search engines*Open source*Инфосистемы Джет corporate blog

У OpenSearch неоднозначная репутация. Некоторые специалисты считают, что его развитие остановилось на версии Elasticsearch 7.10.2. Но это не сделало OpenSearch динозавром, обреченным на постепенный упадок. Продукт развивается и выдает аналогичный Elasticsearch функционал, и даже больше — возможности, которые вообще недоступны в базовой лицензии Elasticsearch.В этом посте расскажем о том, на что способен OpenSearch и как мы боролись с его недостатками. Всё это — на примере внедрения, где в одном кластере нам пришлось наладить разделение доступов для десятка команд, не теряя при этом отказоустойчивости.

+11

aIkitan Apr 7 2021 at 10:32

Logstash + ClickHouse + Grafana: Как сделать Logger для логов ИБ умнее и эффективнее?

17 min

17K

Information Security*Machine learning*Data storages*«Кросс технолоджис» corporate blog

В этой статье постараемся рассказать, как на базе всем доступного open-source можно построить эффективный Logger, поддерживающий интеграцию со всеми SIEM системами, и как можно модернизировать уже существующий Logger с помощью алгоритмов машинного обучения, сделав его умнее и эффективнее.

And4w Nov 10 2022 at 10:25

5 шагов до крупного заказчика: что сделать SaaS-приложению, чтобы начать работать с enterprise

12 min

3.2K

Information Security*SaaS / S+S*Selectel corporate blogStart-up developmentProduct Management*

Technotext 2022

Привет, Хабр! Меня зовут Андрей, в Selectel я руковожу отделом продуктов клиентской безопасности. Мы предоставляем и развиваем защищенную IT-инфраструктуру, помогаем клиентам хранить данные в соответствии с лучшими практиками и стандартами.

Мы видим, что число компаний, разрабатывающих SaaS-продукты, постоянно увеличивается. Растут и бизнесы, которые используют SaaS для обработки критически важных данных. Обе категории компаний встречаются среди наших клиентов. Таким образом, мы знаем потребности и разработчиков, и заказчиков SaaS-решений. А вот первые далеко не всегда понимают, что нужно сделать, чтобы их сервис удовлетворял запросам крупного клиента.

Этот текст как раз для разработчиков SaaS — тех, кто сделал приложение, несущее понятную ценность для бизнеса, и хочет, чтобы их сервис подошел средним и крупным компаниям. После его прочтения вы сможете оценить, насколько ваш продукт готов к внедрению в компаниях крупного бизнеса, и увидите ориентиры для его улучшения. Удобный гайд ждет вас под катом.

Читать дальше →

+44

YaGolub Jun 25 2020 at 16:02

Собираем логи с Loki

13 min

122K

Open source*System administration*Badoo corporate blogDevOps*Kubernetes*

Мы в Badoo постоянно мониторим свежие технологии и оцениваем, стоит ли использовать их в нашей системе. Одним из таких исследований и хотим поделиться с сообществом. Оно посвящено Loki — системе агрегирования логов.

Loki — это решение для хранения и просмотра логов, также этот стек предоставляет гибкую систему для их анализа и отправки данных в Prometheus. В мае вышло очередное обновление, которое активно продвигают создатели. Нас заинтересовало, что умеет Loki, какие возможности предоставляет и в какой степени может выступать в качестве альтернативы ELK — стека, который мы используем сейчас.

+44

JuliaKoroleva May 14 2018 at 07:19

SPLUNK VS ELK?

5 min

21K

System administration*IT Infrastructure*Server Administration*Big Data*TS Solution corporate blog

Если вы связаны с эксплуатацией IT, то наверняка сталкивались либо со Splunk, либо с ELK, либо с обоими продуктами. Это два основных игрока на рынке продуктов по лог-менеджменту и операционной аналитике данных.

В нашем блоге мы пишем о Splunk и нам часто задают вопрос, чем же Splunk лучше ELK? За что мы должны платить деньги за лицензию, если есть хороший open source конкурент? На эту тему отрывками в комментариях сказано уже очень много, но мы решили все объединить и посвятить этому вопросу отдельную статью.

Читать дальше →

marked-one Nov 13 2014 at 11:36

Лицензия для вашего open-source проекта

98 min

182K

Open source*

В этой статье я хочу немного поговорить об авторском праве и свободных лицензиях на ПО. Текст является результатом самостоятельного выбора лицензий и их применения к своим проектам.

Статья будет полезна тем, кто хочет:

— в общих чертах понять, что такое авторское право (но лучше обратиться к юристу);
— подобрать свободную лицензию для своего проекта;
— разобраться, что нужно писать в шапке файла исходного кода.

Читать дальше →

+128

117

RadST Dec 10 2021 at 17:55

На каких бесплатных инструментах строить Observability и зонтичный мониторинг: ELK vs Graylog vs Grafana Loki vs Monq

15 min

37K

High performance*System administration*IT Infrastructure*Server Administration*DevOps*

Сами по себе логи, трейсы, метрики - это очень узкие артефакты состояния нашего объекта наблюдения и обслуживания. Для понимания общей картины нужен взгляд сверху, сбор всех важных сигналов в одну систему и работа с большими данными в ней. Зонтичный подход близок по своим целям к RED и Golden Signals, но по своей сути является противоположным по принципу работы с данными. В Golden Signals мы отслеживаем Latency, Traffic, Errors отдельных сервисов и по ним можем быстро, но очень поверхностно определить их состояние. В случае зонтичного мониторинга или AIOps мы собираем данные о всех логах, событиях систем мониторинга метрик и трейсов, далее выстраиваем там топологию сервиса и определяем алгоритмически состояние здоровья, основываясь на сотнях и тысячах событий, метрик и трейсов. И два подхода, кстати, друг друга не исключают. В этой статье я постараюсь сравнить четыре бесплатных инструмента, которые могли бы дать такую зонтичную картину: ELK, Graylog, Grafana Loki и Monq.

+11

AntoniusFirst Jul 29 2018 at 21:10

9 платных, условно-бесплатных и бесплатных программ для трекинга кода приложений

9 min

19K

Python*Java*Django*Node.JS*Go*

Трекинг кода must-have в среде разработки. Но вот насколько нужен этот же инструмент в продуктиве? Тот, кто лишь кропотливо собирает логи скажет «ну его нафиг, мой ELK меня не подводит» и будет по-своему прав. До поры до времени.

Протрейсить как следует

+24

edeshina Jan 24 2022 at 12:10

История внедрения SRE в «Тинькофф»

7 min

16K

IT Infrastructure*TINKOFF corporate blogСлёрм corporate blogIT careerDevOps*

Меня зовут Дмитрий Масленников, и я руковожу Центром надёжности информационных систем в Тинькофф. Недавно я выступал на вебинаре Слёрма «Особенности SRE в России». В поддержку своего курса по «SRE: внедряем DevOps от Google» Слёрм собирает интересные кейсы внедрения SRE в российских компаниях. Я рассказал, как устроена наша экосистема SRE, зачем мы используем самописные сервисы, почему в SRE должна работать инженерная элита и как примкнуть к этой элите за один день. А теперь делюсь этим здесь.

+17

olegbunin Oct 31 2019 at 14:08

Распределенное логирование и трассировка для микросервисов

18 min

25K

High performance*System administration*Конференции Олега Бунина (Онтико) corporate blogDatabase Administration*Data storage*

Логирование — важная часть любого приложения. Любая система логирования проходит три основных шага эволюции. Первый — вывод на консоль, второй — запись логов в файл и появление фреймворка для структурированного логирования, и третий — распределенное логирование или сбор логов различных сервисов в единый центр.

Если логирование хорошо организовано, то позволяет понимать, что, когда и как идет не так, как задумано, и передавать нужную информацию людям, которым предстоит эти ошибки исправлять. Для системы, в которой каждую секунду отправляется 100 тысяч сообщений в 10 дата-центрах на 190 стран, а 350 инженеров каждый день что-то деплоят, система логирования особенно важна.

Иван Летенко — тимлид и разработчик в Infobip. Чтобы решить проблему централизованной обработки и трассировки логов в микросервисной архитектуре при таких огромных нагрузках, в компании пробовали различные комбинации стека ELK, Graylog, Neo4j и MongoDB. В итоге, спустя много грабель, написали свой лог-сервис на Elasticsearch, а как БД для дополнительной информации взяли PostgreSQL.

Под катом подробно, с примерами и графиками: архитектура и эволюция системы, грабли, логирование и трассировка, метрики и мониторинг, практика работы с кластерами Elasticsearch и их администрирования в условиях ограниченных ресурсов.

+36

asagitov Dec 29 2022 at 13:17

GlitchTip вместо Sentry. Как мы бесплатно настроили мониторинг ошибок

4 min

8.6K

DevOps*Constanta corporate blog

Review

Привет, хабр! Меня зовут Алексей и я системный инженер в компании Constanta, мы с командой занимаемся практиками DevOps, развиваем процессы ci/cd и мониторинга.

Представьте, что у вас есть 10 серверов и 20 микросервисов на них, а релизы проходят каждую неделю. Вы уже мониторите жизнеспособность сервисов и докера с помощью zabbix или prometheus, а с помощью ELK или grailog собираете логи. Кажется, что хорошо, но в таком потоке релизов, хотфиксов и строчек кода нужно быстро ориентироваться в ошибках внутри приложения, которые не влияют на жизнеспособность сервиса, но мешают его правильной работе.

Стоп! Есть же Sentry, скажете вы. И будете правы. Он удобен, хорошо описан, есть документация, комьюнити и поддержка. Однако, есть одно "но".

javdet12 Oct 19 2022 at 14:17

Как мы перешли с Elastic на Grafana stack и сократили расходы в несколько раз

8 min

29K

DevOps*m2_tech corporate blog

Technotext 2022

Привет! Хочу поделиться историей миграции сервисов логирования и трейсинга с компонентов Elastic Stack на Grafana Stack и тем, что из этого вышло. До миграции у нас в М2 использовались достаточно классические схемы:

+31

kossik Oct 19 2016 at 12:04

7 сервисов для мониторинга сайтов

4 min

121K

HostingSystem administration*Virtualization*Network technologies*HOSTING.cafe corporate blog

Здравствуйте! Часто перебои в работе сайта могут привести к потере клиентов, репутации, ~~минусам в карму~~ и прочим неприятностям. После покупки виртуального или выделенного сервера важно вовремя получать информацию о недоступности, поэтому сегодня я хочу рассказать о нескольких сервисах мониторинга сайтов/серверов и провести их сравнение.

На обозрение представлены следующие сервисы:

Читать дальше →

+18

dmitrypro77 Jul 27 2022 at 11:52

Лучшие сообщества разработчиков и IT специалистов в 2022 году

4 min

29K

Programming*Social networks and communitiesLearning languages

From sandbox

Намного проще работать в сплоченной команде, где все члены поддерживают друг друга, дают дельные советы, делятся знаниями и накопленным опытом. А если в команде единомышленников сотни и тысячи профессионалов из ведущих стран мира, польза от такого содружества очевидна. Поэтому специалисты разных профилей часто становятся постоянными обитателями профессиональных форумов и сообществ. На таких интернет-площадках задают любые вопросы, обсуждают проблемы, обмениваются мнениями. Каждый участник сможет найти для себя полезную информацию.

Boomburum Dec 26 2022 at 09:30

Итоги 2022 года на Хабре

Easy

10 min

25K

HabrHabr corporate blogSocial networks and communities

Короткий итог — 30000 статей, десятки изменений в логике и интерфейсе сайта, 2 больших конкурса, 85 человек в команде, 359 дней нонстопа. Ещё в начале года мы твёрдо знали: надо продолжать делать крупнейший русскоязычный сервис для IT-специалистов и для этого мы задействуем все свои ресурсы. Были дни и даже недели, когда значительная часть команды работала 24/7, были бессонные ночи, были жалобы и благодарности. В некоторых моментах последняя нервная клетка команды пыталась сорваться в бездну, но мы знали — да что там, видели и видим в аналитике, — в нас верят 10 млн тех, кто ежемесячно читает Хабр и больше миллиона зарегистрированных. Эти люди дают и поглощают крутой контент, спорят, дискутируют, грубят и хвалят, устраивают баталии и присылают крутые идеи, сообщают о багах и уязвимостях. Ну что же, перед тем, как идти вперёд, осмелимся вместе оглянуться?

+123

110

Amvera_Speech Dec 20 2022 at 20:51

Насколько можно улучшить распознавание речи в записях с АЗС за месяц

3 min

Semantics*Machine learning*Reading roomArtificial IntelligenceAmvera corporate blog

Эта история началась с того, что к нам пришел клиент, которому нужна была система распознавания речи. Да не простая, а качественно распознающая разговоры с микрофонов на АЗС, то есть речь в сильных шумах. Цель заказчика простая – контролировать, упоминают ли кассиры акции, предлагают ли установить мобильное приложение и выпить кофе. Вы наверняка все это сами слышали на заправках.

Но есть проблема. Хорошо распознать простую чистую речь могут почти все известные решения. Но речь, где на фоне играет радио, слышны звуки с других касс, громкость речи говорящих разная и присутствует много отраслевой лексики (бренды сигарет, марки топлива), качественно распознать не смогло ни одно «коробочное» решение.

Вызов принят! Мы решили за ограниченное время справиться с этим кейсом.

Шаг 1 – транскрибируем несколько файлов и замеряем качество распознавания на своем решении и решении конкурентов.

Для измерения качества распознавания используем метрику WER.

3 4