Comments / Profile of Notevil / Habr

Китаев Антон@Notevil

Инженер программист

Асинхронное логирование в C++ — не серебряная пуля: что на самом деле ограничивает производительность

Ужасно. Пишите дальше.

Я, если честно, так и не понял что на самом деле ограничивает производительность. Думал на конкретных примерах расскажут.

Ну вот посчитали мы, что bottleneck это вывод в консоль. Перенесли в отдельный поток. Теперь bottleneck это синхронизация с этим потоком, а там еще и очередь копится. Делать то что, просто меньше логировать?

От MNIST к Transformer. Часть 4. Gradient Descent. Обучаем нашу модель

Notevil Apr 6 at 06:20

Все тут я перестал понимать.
Хотя может просто нужно несколько раз перечитать.
Я математику сдал еще в универе, совсем сдал.
Нужен цикл статей для "пацанчиков".

GDB для тех, кто думает, что отладка — это фантастика

Notevil Apr 3 at 04:56

Объясните дураку. Почему
1. Начало processUser
выводится в консоль
но падает в setUser, которая выполняется до этого
и все это при -O0
?

Вышла Google Gemma 4 — открытая модель с 31 млрд параметров обходит ИИ вдвое крупнее

Notevil Apr 3 at 04:40

Попросите 5 программистов сделать одно и тоже. Одинаково получится?

О радости программирования и невесомости достижений

Notevil Mar 6 at 05:42

Мне этот переходный момент в программировании ощущается некомфортно и тревожно именно потому, что я нахожусь в самой середине переходной эпохи между двумя парадигмами работы.

Я сформулировал для себя по другому.
Мне страшно, что за то что мне нравилось в профессии больше не будут платить деньги, и теперь приходится переучиваться.
Кто там говорил: "Найдите работу, которая вам нравится и вам не приведется работать ни дня"?
Это мне получается теперь работать придется?
Я еще не влез как следует в вайб-кодинг, так изредка прошу, чтобы оно сгенерировало мне или unit тесты или реально скучный бойлерплейт. Но этот процесс мне не нравится.

О радости программирования и невесомости достижений

Notevil Mar 6 at 05:28

Переживал подобное, очень близки размышления

Пережили уже, или еще переживаете?
К чему пришли?

Принципы DOD в C++: Часть 1. Оптимизация структур

Notevil Feb 24 at 07:03

не сказано, что это погрешность. По графику не видно, а в таблице видно, что BadStruct стабильно выигрывает до 1000000.

Принципы DOD в C++: Часть 1. Оптимизация структур

Notevil Feb 24 at 06:38

До 262144 итераций разница во времени минимальна, но на 1000000 итераций она уже составляет 38%!

А то что в таблице результатов все что меньше 1000000 выигрывает BadStruct как-то объясняется или мы просто считаем, что это равный результат, отличающийся не более чем на погрешность измерений?

Охота за красным fps

Notevil Feb 23 at 10:39

Спасибо. Вот этот ответ, на самом деле, для меня много прояснил.
В целом получается если я знаю, где у меня hot path, который над оптимизировать, я уже сразу могу расставлять точки и смотреть трассировки.

Охота за красным fps

Notevil Feb 23 at 09:49

Я просто не понимаю как интерпретировать результаты семлпирования. По сути просто посмотреть на те функции, которые дольше всех выполняются, и прикинуть, должны ли они выполняться быстрее?
А дальше уже инструментированием разбираться конкретнее, на что и в каких пропорциях тратится время?

https://github.com/VerySleepy/verysleepy - что-то для windows. Для linux есть perf, который делает то же самое?

Охота за красным fps

Notevil Feb 22 at 11:01

А есть какой-то гайд по профилированию приложений (или это он и был)?
Опишу кейс. У меня приложение - пример использования библиотеки, которую я делаю. Оно запускается, делает бизнес логику, завершается. На все около 1 секунды на моем железе. Там внутри установка подключения к серверу, формирование пакетов, шифрование, отправка, получение, дешифрование, парсинг пакетов, пакеты разные, отправляются и принимаются параллельно, основная логика в одном потоке, но есть еще парочка дополнительных. Как выбирать чем, что и как профилировать?
Раньше, на прошлой работе, использовал tracy для гуи приложения. Мне в целом хватало просто пройтись по записанным функциям и посмотреть, что сколько занимает, потом добавить детализации и посмотреть где именно тратится время. Тут часто ошибался, с тем, что менял одновременно и код, и добавлял точки для сбора трейсов, получалось, что время увеличивалось, хотя ожидал, что оно уменьшится.
Для меня это все еще самый очевидный подход, но он кажется трудоемким и сложно повторяемым.

От MNIST к Transformer. Hello CUDA. Основы, Setup и наше первое ядро

Notevil Feb 18 at 07:25

ну а вообще со встройкой есть смысл пробовать, Может дальше пойдут такие вычисления, что нет смысла даже пытаться?

От MNIST к Transformer. Hello CUDA. Основы, Setup и наше первое ядро

Notevil Feb 18 at 06:44

А если у меня встройка AMD на ноутбуке, есть смысл пробовать что-то по этому циклу?

Удалёнка как норма, а не привилегия

Notevil Feb 12 at 05:30

Ну в таких условиях удаленка изначально не применима, а значит нечего и отменять.

+12

Так как же всё-таки быстро конкатенировать строки в C++?

Notevil Feb 7 at 08:05

а я правильно понял, что генератор тут это i / 0x8a010_fmt ? А свои генераторы можно/легко писать? Если мне надо сконкатенировать со строкой например вектор моих типов каких-то?

Новый VPN-протокол TrustTunnel спасет нас

Notevil Jan 26 at 04:39

А какие проблемы если для них всех оно выглядит как TCP?
Просто не шлет повторы и не ждет ACK. Сами ACK кстати можно отправлять, чтобы еще меньше палиться.

Новый VPN-протокол TrustTunnel спасет нас

Notevil Jan 24 at 15:11

У меня вопрос.

Главная проблема тормозов в классическом подходе «устойчивых» протоколов - они обертывают VPN-данные в TCP-соединение и мимикрируют под HTTPS. Выглядит это в итоге как обычный веб-трафик, но TCP добавляет проблем со своим обязательным подтверждением доставки пакетов. При таком подходе, при потере одного пакета встаёт вся очередь пакетов, что приводит к классическому head-of-line blocking, жутко замедляя соединение.

А если уж VPN под что-то мимикрирует. То можно и под TCP мимикрировать? То есть сделать протокол, который в заголовках выглядит как TCP, но ведет себя как UDP?

«Лучшие» практики Rust, которые вас подведут

Notevil Jan 22 at 05:00

Да, будет косвенный вызов через vtable. Да, это наносекунды.

Но в приведенном примере еще и аллокация ведь, а это точно больше чем вызов через vtable.
Но вообще мысль то правильная.
Избегать мономорфизации если оно прям сильно не нужно.

Гайд по обходу «белых списков» и настройке цепочки рабочие варианты, почему ваш VPN может не работать

Notevil Jan 20 at 04:16

Хотя серваки (2 разных провайдера) в России

Но они же не в белых списках.

И более того - дома резервнй канал через LTE они тоже доступны, даже в режимах ограничений! А вот на даче в соседнем регионе такой же микротик с LTE (есть версия, что провайдеры дают поблажки стационарным точккам которые относятся к модемам по IMEI и не мигрируют между БС) и там уже все печально.

Как сейчас принято говорить, то что у вас что-то работает, это не ваши заслуги, а их недоработки.

Гайд по обходу «белых списков» и настройке цепочки рабочие варианты, почему ваш VPN может не работать

Notevil Jan 16 at 11:15

Так понятно, что забугор будут блочить. А по РФ то они должны работать, их ведь и компании всякие используют. Или когда белые списки включают, то и все остальные протоколы блочат?

2 3 4 5