Комментарии / Профиль arturich / Хабр

Артур Геращенко@arturich

Технический менеджер / ex-teamlead

Как построить систему, способную выдерживать нагрузку в 5 млн rps

@arturich 22 июл 2023 в 03:32

А почему вы считаете, что 5000 перебор? А сколько надо по вашему и почему? Вы же не знаете какие там подсистемы, бизнес-логика, компромиссы, на которые когда-то пошли при каких-то обстоятельствах и пр. Да и вроде бы речь не идет про то, что Кафка только про обработку событий на сайте от клиентов. Наверняка там какие-то синхронизации данных между подсистемами, попутные подсчеты счетчиков и пр. и пр.

И даже если представить, что есть какая-то часть неоптимальностей с микросервисами, то вы же не будете сейчас рекомендовать ребятам переписать все микросервисы, перестроить процессы и пр. Это тоже денег стоит, да и статья же конкретная и про другое вообще, а вы уводите в то, что как вам кажется, все это вообще не нужно и вы бы не так там с самого начала делали.

Как и для чего мы два раза переезжали на GraphQL — опыт Яндекс.Афиши

@arturich 8 июл 2021 в 20:33

Спасибо! Будет интересно узнать новости по этому поводу.

Как и для чего мы два раза переезжали на GraphQL — опыт Яндекс.Афиши

@arturich 8 июл 2021 в 14:48

Спасибо. Я немного не про то. Я скорее про гайды (от начала и до конца) как правильно скомпилить с граалем, чтобы оно потом заработало. Можно в ЛС если там будет удобнее, я просто как раз сейчас новый проект начинаю и есть все шансы сделать супер быстро и обкатать что-то, пока проект еще не в проде. Мб Dockerfile есть, например. Он же two step build должен быть поидее

Как и для чего мы два раза переезжали на GraphQL — опыт Яндекс.Афиши

@arturich 8 июл 2021 в 12:47

С граалем

Как и для чего мы два раза переезжали на GraphQL — опыт Яндекс.Афиши

@arturich 8 июл 2021 в 12:46

Извините, это есть в статье, интересно как именно компилили с гравием, какие подводные камни были

Как и для чего мы два раза переезжали на GraphQL — опыт Яндекс.Афиши

@arturich 8 июл 2021 в 11:51

Хочется подробностей как именно компиляли с GraalVM и как именно запускаете приложение в проде с ним.

Как и для чего мы два раза переезжали на GraphQL — опыт Яндекс.Афиши

@arturich 8 июл 2021 в 11:43

В первых версиях новый API работал довольно медленно — пришлось проделать ряд манипуляций, чтобы его ускорить.

Скажите пожалуйста — в чем именно были проблемы с производительностью и как именно вы их решили?

Лучшие практики для деплоя высокодоступных приложений в Kubernetes. Часть 1

@arturich 5 мар 2021 в 07:14

Мы просто купили платный docker hub на год на одного юзера и вопрос исчез

Лучшие практики для деплоя высокодоступных приложений в Kubernetes. Часть 1

@arturich 5 мар 2021 в 07:14

Так надо не latest качать, а что-то более точное. Вроде бы этого хватает, чтобы скачать обновленные версии. У нас сборки тегируются хешем коммита в git. Вы сталкивались с проблемами (кроме проблем с secrets) даже в таком случае?

Лучшие практики для деплоя высокодоступных приложений в Kubernetes. Часть 1

@arturich 5 мар 2021 в 04:37

И pull always ))) вместе с зависимыми проверками в readness probe это просто катастрофа

Забываете передавать аргументы в функцию? Вам поможет contextvars

@arturich 5 ноя 2020 в 08:21

Классика, лет 7 уже юзаем)))) В купе с google cloud logging ваще норм — там поиск всегда крут и удобен

Технология Apphost: альтернативная вселенная микросервисов в Яндексе

@arturich 23 сен 2020 в 15:24

Сори, если пропустил — на чем сервис написан и как примерно в него выкладываются конфиги?

Что такое Google Ads Data Hub

@arturich 24 авг 2020 в 19:54

Выгружайте данные с помощью garpun.com/garpunfeeds и данные будут ретроспективно обновляться в вашем BigQuery.

DCM, DBM, Директ, Фейсбук, ВК и пр пр

Как обойти ошибки при построении отчетности в Power BI и прийти к построению системы выгрузки для больших данных

@arturich 17 мар 2020 в 09:18

Вообще сотни гигабайт каждый день прокачиваем через него.

Контекстные системы -> BigQuery
Google Analytics, Yandex Metrika -> BigQuery
Postgres -> BigQuery
ClickHouse -> BigQuery
Реагрегация по расписанию BigQuery -> BigQuery
Данные из BigQuery -> Yandex Object Storage в виде xml файлов

Сейчас еще подъедут http endpoint-s. т.е. данные например из BigQuery в виде json, csv по url с фильтрами по датам. С авторизацией, конечно.

Как обойти ошибки при построении отчетности в Power BI и прийти к построению системы выгрузки для больших данных

@arturich 14 мар 2020 в 02:44

К сожалению часто без хранения где-то просто не обойтись, поэтому есть например https://garpun.com/garpunfeeds/ там и бесплатные потоки и хранение в вашем bigquery, например и уход от семплирования в Гугле по максимуму и поддержка ga360

Профессиональный Postgres

@arturich 4 июн 2019 в 06:21

Сори, 2 и 3 абзацы надо поменять местами

Профессиональный Postgres

@arturich 4 июн 2019 в 06:20

У нас с pg 9.6 все хорошо кроме проблем с очисткой временных файлов pg в случае, если бд вошла с рекавери мод. Например, если кончилось место на диске с данными из-за большого запроса или если хранимка на питоне вылетела и pg странно это обработал (не с каждой питон ошибкой бывает).

В остальном для почти всех задач подходит, а там, где не подходит юзаем google bigquery и yandex clickhouse

Все приводит к тому, что бд надо регулярно ребутать. (

Оставьте заявку, и мы ответим вам онлайн в течение 1-й минуты. Или как мы уходили от OTRS

@arturich 17 мая 2019 в 08:16

Вот как бы и у меня сложилось впечатление, что по сути в статье почти ничего нет, а подход — внедряй постепенно, если можешь вроде все знают. Ну да, пропиарили, что вы как и все крупные чуваки запилили свой собственный велик (я за, если что, для вас это оправдано).

Ну и как бы все.

Получение статистики по всем клиентам из API Яндекс Директ в разрезе дней с помощью Python

@arturich 25 апр 2019 в 20:57

А мы уже давно для 3000+ клиентов несколько раз в день и из директа, гугла, критео, матаргета, фб, вк и пр. перегружаем в google bigquery и, что главное, обновляем данные за предыдущие периоды, если рекламные системы вычищают из статы кликфрод через какое то время.

Данные в разрезе дней, девайсов, объявлений, ключевиков и пр. Делаем обобщенное VIEW в BQ и выводим к себе в систему или Google DataStudio, Tableu и пр. Ну а маркетологи, контекстники и аналитики уже в bigquery sql запросы пишут если очень надо или если нужна какая-то сильно глубокая аналитика с заковыристыми sql-запросами.

Google Analytics. Синхронизация с пикселями Facebook, VK, Yandex, MyTarget

@arturich 13 ноя 2018 в 21:20

Все круто, но только потом сайты тормозят =(
Просто потому, что все вокруг начинают 100500 вызовов делать на несжатую статику, картинки, пиксели и прочую шамбалу, часто к сожалению впрок, не думая о последствиях

2 3 ...

8 9