Comments / Profile of aalexand / Habr

User

Профайлер Бедного Человека: первое знакомство и (приятные) последствия

aalexand Dec 4 2022 at 17:44

Но через BPF можно сделать доступ к контексту приложения, по крайней мере. Т.е. разбивку по экспериментам - я так понял, это очень важно для автора и его команды.

Профайлер Бедного Человека: первое знакомство и (приятные) последствия

aalexand Dec 4 2022 at 17:42

Если уж через perf собирать, то имеет смысл чаще, кмк. Возможно, получится выбрать sampling rate пониже, чтобы самортизировать нагрузку, да. Но в целом мысль такая, что режим открутки dwarf в perf очень расточителен с точки зрения количества памяти, к которой он прикасается и копирует. Было бы здорово, если бы perf умел прямо в обработчике прерывания откручивать через dwarf, но Линус уже сказал как-то в своей манере, что dwarf раскрутки в ядре не будет - слишком сложный код (turing-complete, вроде как). Ждем, когда Intel CET shadow stack станет более доступной и поддерживаемой.

Профайлер Бедного Человека: первое знакомство и (приятные) последствия

aalexand Dec 4 2022 at 08:32

Можно попробовать -fnoomit-frame-pointer -momit-leaf-frame-pointer. Может помочь компилятору таки использовать %rbp в самых горячих листовых функциях. И раскрутка в большинстве случаев работать будет - когда %rbp не используется.

Профайлер Бедного Человека: первое знакомство и (приятные) последствия

aalexand Dec 4 2022 at 08:29

Я бы тут был осторожным. Допустим, сэмплируем 64 ядра, 100 раз в секунду. Если сохранять 256 КБ стековой памяти, то это 64*100*256*1024/2**30 = ~1.5 ГБ/сек. Нетривиальное количество памяти для копирования - несколько процентов общей memory bandwidth, и last level cache выметет...

Профайлер Бедного Человека: первое знакомство и (приятные) последствия

aalexand Dec 4 2022 at 08:19

У такого дифференциального flame graph есть неудобство - поскольку форма строится по первому флеймграфу, то если функция / путь вызова есть только во втором, ее не увидишь. Приходится менять местами первый и второй, чтобы убедиться, что ничего не пропустил. Есть еще рабочий вариант использовать в качестве ширины среднее между профилями, то тоже не идеально.

По поводу проблемы, что если одна и та же функция есть во флеймграфе много раз, то ее сложно увидеть - посмотрите на pprof, и в частности на фичу из этого пулл реквеста. С ней жить должно стать повеселее.

Профайлер Бедного Человека: первое знакомство и (приятные) последствия

aalexand Dec 4 2022 at 08:11

bpf как и perf откручивает стеки через frame pointers. Так что, по крайней мере в этой части достоинств не будет.

Профайлер Бедного Человека: первое знакомство и (приятные) последствия

aalexand Dec 4 2022 at 08:10

Еще один недостаток такого профайлера, это что стеков ядра увидеть не получится - я так понимаю, GDB обязательно дождется выхода из системного вызова.

Отказоустойчивая архитектура контентной платформы на 4 Тбит/с — опыт VK Видео

aalexand Aug 27 2022 at 20:24

Скажите, MSG_ZEROCOPY используете?

Национальный роуминг в разных странах мира

aalexand Sep 30 2017 at 17:20

T-Mobile либерально относится к неродственникам на семейном плане. На пятерых связь обходится долларов в 25 на человека. И да, ни разу не видел этого межсетевого роуминга.

Как программист машину покупал

aalexand Jun 7 2016 at 14:16

Это да. На auto.ru она раньше (когда я машину искал) была на фото, там ее обычно народ не обновляет, можно оттуда доставать. Более хлопотно, правда.

Как программист машину покупал

aalexand Jun 7 2016 at 14:12

Важная вещь — как давно товар на рынке. Было бы неплохо иметь возраст объявления в модели или как фильтр.

Работа и жизнь гика с проблемами концентрации внимания

aalexand Jan 3 2013 at 07:48

Надо же, оказывается у этого есть научное название. Я в студенческие времена такое сам изобрел — правда, немного в другом виде. Если, уже лежа в кровати, вспоминал, что надо с утра что-то взять, то (поскольку вставать было лень) брал стоящий рядом будильник и ставил его под кровать. С утра сразу вспоминалось :) Правда, есть важный момент — как только якорь сработал, надо действие СРАЗУ выполнить. Иначе забывается мгновенно.

Опережающие и ретроспективные проверки в регулярных выражениях

aalexand Dec 27 2012 at 12:25

Классическое использование термина «регулярное выражение» означает «выражение, описывающее некоторый регулярный язык». Это, как мы видим, не всегда так, но мою чуткую душу это коробит, так что вот и напоминаю.

Опережающие и ретроспективные проверки в регулярных выражениях

aalexand Dec 27 2012 at 10:10

Рекурсивное регулярное выражение — это уже не регулярное выражение, а стековая машина. Это не делает их менее полезными, но важно понимать, что это уже не конечный автомат.

Google Drive теперь поддерживает публикацию веб-сайтов

aalexand Dec 2 2012 at 12:31

Прикольно. А нету ли автоматического способа преобразования линка для конкретного элемента?

Переезд проекта с SVN на Git

aalexand Oct 6 2012 at 13:54

Использую «svnmerge.py merge -bs» для мержа в SVN между транком и веткой. Работает замечательно в обе стороны. Что я делаю не так?

www.orcaware.com/svn/wiki/Svnmerge.py

При Медведеве отменили зимнее время, а при Путине отменят летнее

aalexand Sep 22 2012 at 14:15

Предложение Путина поддерживаю полностью. Медведевское летнее время увеличило разницу московского времени с калифорнийским до 12 часов зимой. Работать невозможно. Как можно говорить о каких-то инновациях и инвестициях, если сами отгораживаемся часовыми поясами от западного мира. Я бы вообще подумал на тему сделать время западной части России ближе к Западному, а восточной — ближе к Восточной. Чтобы в одном конце было удобнее работать с Западом, а в другой — с азиатами.

Раз дощечка, два дощечка — будет лесенка…

aalexand Aug 14 2012 at 06:13

Я бы ожидал, что используется shift-and-add1, тот, что Вы указали первым. Интересное наблюдение: если при реализации такого алгоритма умножения доступна O(1) проверка «является ли текущий обрабатываемый бит самым крайним слева/справа», то сдвиги-сложения можно остановить в нужный момент, и алгоритм в некотором смысле становится O(ln N).

Еще интересная тема — деление. Вот оно уж точно в той или иной степени итеративное, и количество итераций зависит от входных данных. Другое дело, что современное железо старается эти итерации всячески амортизировать и дать гарантированную оценку сверху сложности операции деления для любых входных данных.

Раз дощечка, два дощечка — будет лесенка…

aalexand Aug 14 2012 at 04:52

Это неважно как раз. Даже если умножение машинных слов реализовать руками, с точки зрения алгоритма это все равно будет константа. Весь сыр-бор начинается именно если размер промежуточного и конечного результата не фиксирован, а пропорционален N.

Раз дощечка, два дощечка — будет лесенка…

aalexand Aug 13 2012 at 20:45

Это верное замечание. Действительно, факт того, что числа длинные меняет сложность алгоритма. Константы могуть быть разными, но сложность действительно будет линейной, если только в задаче не достаточно нахождения модуля.

-1