Как стать автором
Обновить

Особенности SRE и Observability в мобильных приложениях

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров4.7K
Всего голосов 21: ↑21 и ↓0+21
Комментарии16

Комментарии 16

А чем сейчас занимается ваша iOS команда?

Часть продолжает пилить фичи, чтобы клиенты получили их, когда мы релизнимся в App Store. Другая часть активно работает над тем, что бы этот самый релиз случился:)

когда мы релизнимся в App Store

А вы оптимисты.

Не без это, конечно.

Но факты говорят сами за себя - некоторым банкам, которые тоже удалили из App Store, удалось опубликоваться с разной степенью камуфляжа. Так что это не что-то невозможное.

Жизнь от удаления до удаления - такое себе. Одна новость в интернете и приложения снесут, и нужно готовить инфраструктуру для публикации заново, снова доносить информацию клиентам о новом названии приложения, не привлекая внимания санитаров модераторов.

В целом, считаю, что это слишком унизительно, пытаться залезть туда где тебе не рады.

В целом, согласен.

А какие альтернативы вы видите? При условии, что клиенты с iOS никуда не ушли и их все равно значимая часть.

Научить банкоматы устанавливать приложение на подключенный айфон разве что. :)

Остальные варианты слишком субъективные, холиварные или провокационные чтобы их озвучивать.

Спасибо, было интересно! В Тинькофф собралась грамотная команда.

Я так понимаю, что vitals для вас больше не актуален, в связи с исключением из стора?

Спасибо за обратную связь!

Да, с Vitals все так. А другим сторам ещё далеко до такой аналитики, которую давал Google.

Доступно и познавательно, большое спасибо. Огромную работу проделывают команды - и ничуть не меньшую проделал автор статьи, составляя её.

Спасибо за добрую обратную связь!

Спасибо за статью. Качественно и полезно.

Ждем "отдельный доклад или статью" о том, как фильтровать и группировать результаты производительности запуска экранов. Без них данная статья выглядит неполной.

А как именно iOS приложение ставят в банках? Технически. Sideloading?

Технически это восстановление приложения с другого аккаунта, на котором нужное приложение есть. Такое умеет делать iMazing и такую логику можно воспроизвести с использованием open source утилит

Спасибо за статью, несколько моментов:

- Хотелось бы побольше узнать именно о способах мониторинга - дашборды, алерты, там много интересного - поиск проблем (умный анализ, сравнение со старыми данными, SLO), предсказания (праздники, какие-то события и т д), банально доставка уведомлений (способы, эскалация), ротация, ownership, и т д.

- Есть ли процесс инцидент-менеджмента, постмортемы, как продвигаете observability-культуру в компании?

- Насколько понял по описанию, тест старта приложения замеряет только запросы, что мешает добавить данные в уже существующий запрос?

Ну и любопытно про проблему с конфигом:

- Почему вы не узнали о ней от бэкенд-разработчиков, наверное, они не только ошибки мониторят, но и количество запросов? Все сервисы, что за главным экраном должны были потерять трафик с Android (самого популярного клиента)

- Как обрабатывалась ошибка парсинга, что ее тоже никто не заметил, try с пустым catch?)

- Хотелось бы побольше узнать именно о способах мониторинга - дашборды, алерты, там много интересного - поиск проблем (умный анализ, сравнение со старыми данными, SLO), предсказания (праздники, какие-то события и т д), банально доставка уведомлений (способы, эскалация), ротация, ownership, и т д.

- Есть ли процесс инцидент-менеджмента, постмортемы, как продвигаете observability-культуру в компании?

Вопросы интересные, но чтобы ответить по существу, надо заряжать отдельную статью:)

- Насколько понял по описанию, тест старта приложения замеряет только запросы, что мешает добавить данные в уже существующий запрос?

Ничего не мешает. Добавление каких-то данных в существующий запрос/ответ в общем случае не так опасны как добавление новых запросов. Поэтому за этим системно не следим, по крайней мере со стороны платформы мобильного банка.

Ну и любопытно про проблему с конфигом:

- Почему вы не узнали о ней от бэкенд-разработчиков, наверное, они не только ошибки мониторят, но и количество запросов? Все сервисы, что за главным экраном должны были потерять трафик с Android (самого популярного клиента)

Тут, как это обычно бывает, случилось сочетание обстоятельств. Во-первых, о проблеме мы действительно узнали от SRE. Во-вторых, прямо перед нашим сбоем случился другой сбой на сервисе историй и SRE занимались его устранением. По ходу работы над ним ребята перепроверяли как в мобильном банке отображаются истории и застали самое начало уже нашего сбоя. Поэтому данные о падении трафика оказались невостребованными в тот момент.

- Как обрабатывалась ошибка парсинга, что ее тоже никто не заметил, try с пустым catch?)

На этапе парсинга конфига выбросили исключение, а выше уровнем криво его обработали. Клиенту в UI ничего не показали и получилось, что данные для Главного экрана просто не прогрузились и он остался пустым.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий