Комментарии / Профиль Ivanhoe / Хабр

Иван Юрченко @Ivanhoe

Пользователь

Профиль Публикации 5Комментарии 706Закладки 288

Ivanhoe 15 ноя 2023 в 12:38

Альтернативная реализация от Aiven Open не может успешно вычитать
записанные ей в удаленное хранилище данные. Для попытки починки
необходимо более детально исследовать механизм chunk-ов.

Обязательно посмотрим, в чем проблема!

Посмотреть

Присматриваемся к Kafka tiered storage

Ivanhoe 15 ноя 2023 в 12:23

Привет

Я разработчик remote storage manager плагина https://github.com/Aiven-Open/tiered-storage-for-apache-kafka, использованного в статье. Как говорится, ask me anything

Посмотреть

Можно ли растить мышцы одной тренировкой в неделю?

Ivanhoe 18 мар 2023 в 10:48

Возможно, режим тренировок не оптимальный, организм не успевает восстановиться и возникает перетренированность.

Посмотреть

Профайлер Бедного Человека: первое знакомство и (приятные) последствия

Ivanhoe 12 янв 2023 в 10:45

Это вариант, но не то, что я сделал: в этом случае все равно придется установить gdbserver в контейнере.

Я сделал с помощью namespaces. GDB запускается в PID namespace целевого процесса и в новом mount namespace, аналогично nsenter -t <pid> -p unshare --mount-proc gdb ... -p 1. Нужно еще добавить -iex set sysroot /proc/1/root -iex set auto-load safe-path /proc/1/root/<solib paths> -iex set solib-search-path /proc/1/root/<solib paths>. Еще важно: если в mount namespace GDB есть такой же путь к бинарнику, как в mount namespace целевого процесса (условно /usr/bin/python3), то его нужно скрыть (с помощью bind mount, например), чтобы GDB читал символы из /proc/1/exe.

Посмотреть

Методы обеспечения безопасности контейнеров Docker

Ivanhoe 27 дек 2022 в 21:18

Метод 6: использовать gVisor в качестве рантайма, чтобы существенно сократить возможность побега из контейнера через уязвимости ядра.

Посмотреть

Профайлер Бедного Человека: первое знакомство и (приятные) последствия

Ivanhoe 17 дек 2022 в 18:48

В каждом контейнере нашего кластера запущен демон, который просыпается раз в несколько минут в случайные моменты времени и присоединяется к профилируемому процессу с помощью GDB.

Кстати, я тут экспериментировал для одного своего проекта и мне удалось сделать так, что GDB подключается к процессу в контейнере, считывает символы там же, но при этом сам установлен и запущен на хосте. Т.е. технически в вашем случае можно было бы запускать один экземпляр демона.

Если интересно, могу рассказать подробнее.

Посмотреть

Китай наладил техпроцесс 7 нм без доступа к западным технологиям

Ivanhoe 23 сен 2022 в 20:14

Наполеоновские войны?

Посмотреть

Почему я не хочу продолжать работу в биотехе

Ivanhoe 7 сен 2022 в 04:53

За рубежом ИТ -- это тоже денежно (сильно выше среднего по стране даже в социалистической Европе) и престижно.

Посмотреть

VR-трансформация образования

Ivanhoe 3 сен 2022 в 10:56

А как "технологии" помогут решить эти проблемы?

Посмотреть

Как и почему перешли с Python на Go в основном сервисе рекомендаций Авито

Ivanhoe 1 сен 2022 в 17:37

Go - основной язык в компании.

В общем, других причин и не надо.

Go - основной язык в компании.

Посмотреть

Как и почему перешли с Python на Go в основном сервисе рекомендаций Авито

Ivanhoe 1 сен 2022 в 17:37

java(kotlin), .net - менее эффективны, чем Go.

Citation needed. Я не знаю про .NET, но Java и JVM не "менее эффективны" (чтобы это не значило).

Посмотреть

Дюк, вынеси мусор! — 4. ZGC

Ivanhoe 1 авг 2022 в 07:45

Люди программируют не только веб с микросервисами

Посмотреть

IT-фирмы в отчаянии из-за нехватки сотрудников. Бонусы выходят на новый уровень

Ivanhoe 17 фев 2022 в 07:54

Я вот после многолетнего c++ поучился на java.

Если так, то не позиционируйте себя как джуна. Делайте упор на свой общий инженерный опыт и т.п. Если человек умеет писать осмысленный код, покрывать его тестами, связно коммуницировать со всеми включенными в процесс, то это уже не джун.

Ну а еще есть просто работа на C++.

Посмотреть

Быстрая обработка CSV с помощью ОКМД (SIMD)

Ivanhoe 22 дек 2021 в 10:29

В дейта инжиниринге бывают любые странные сочетания форматов и их преобразований и разные странные кейсы. Например, огромные CSV могут прилетать через какую-то интеграцию извне и конвертировать их в какой-нибудь Parquet, поддерживать преобразованные файлы в актуальном состоянии и т.п. -- лишний геморой, усложнение пайплайна и занятие времени инженеров. Нужны веские причины это делать. А этот SIMD-код нужно написать и поддерживать тольо внутри условного Spark, дальше его все просто используют (даже не зная об этом).

Посмотреть

Быстрая обработка CSV с помощью ОКМД (SIMD)

Ivanhoe 22 дек 2021 в 09:47

честно говоря не понял, чего и ради чего ускоряется

CSV -- популярный формат для самых разных данных. Если 50 гигабайт CSV приходится перелопачивать много раз за день, то хорошо чтобы бы это происходило быстро.

Посмотреть

Особенности работы с POSIX-сигналами

Ivanhoe 14 окт 2021 в 19:57