Comments / Profile of Bozaro / Habr

Артем Навроцкий@Bozaro

Программист

Subscribers

ProfileArticles11PostsNewsComments159

Python (FastAPI) vs Go: нагрузочный тест и анализ производительности

Bozaro Dec 27 2025 at 20:39

Очень странное сравнение:

Почему-то в качестве тестируемой OS выбран Windows. Я очень давно не видел Windows на серверах, а от операционной системы зависит очень много;
Тестирующий софт запущен на той же машине. При этом он может требовать ресурсов больше, чем тестируемое приложение;
Go-приложение по-умолчанию будет пытаться утилизировать все ядра, про Python я такого сказать не могу.

+13

Генерируем commit message на базе шаблона при помощи локальной (и не только) LLM в консоле и без IDE

Bozaro Jun 25 2025 at 05:24

В комментариях к коду и описании коммитов самая ценная информация - ответы на вопросы "зачем это было сделано?" и "почему было сделало именно так?"

В лучшем случае эту информацию можно достать из тикета, в худшем - только из головы разработчика.

Всегда используйте target_session_attrs=read-write (или primary) при подключении к кластеру PostgreSQL по FQDN в YC

Bozaro May 19 2025 at 19:48

К сожалению такой вариант для YC не приемлем, тк в случае пересоздания какого-то хоста у кластера его ID (то есть адрес хоста) будет изменен, что потребует изменения настроек в строке подключения.

Я указываю все хосты. Приходится менять строку подключения. Страдаю.

К счастью хосты сами свои имена не меняют.

Всегда используйте target_session_attrs=read-write (или primary) при подключении к кластеру PostgreSQL по FQDN в YC

Bozaro May 19 2025 at 07:38

Я не утверждаю, что опция target_session_attrs=read-write не даёт никакого эффекта: эффект есть, но природа у него другая.

В данном случае у поставщика (Яндекс облака), есть три варианта подключения к PostgreSQL-кластеру:

указать все хосты в строке подключения и target_session_attrs - рекомендуемый способ;
использовать FQDN для PRIMARY - зависит от времени обновления DNS, не рекомендуется из-за отсутсвия гарантий на время из-за DNS-кэшей;
использовать FQDN для наименее отстаюущей реплики - так же зависит от времени обновления DNS.

Комбинация FQDN для PRIMARY и target_session_attrs=read-write работать будет, но есть нюансы:

время переключения увеличивается за счет DNS-кэшей (они зависят от TTL DNS записи, настроек операционной системы приложения, реализации самого приложения);
клиент в случае failover на некоторое время вообще не видит никакого хоста кластера (адрес резолвится в мёртый хост);
поведение может сильно отличаться в зависимости от используемого в разработке стэка;
вы игнорируете явное предупреждение поставщика и делаете на свой страх и риск (используйте подключение с помощью особого FQDN хоста-мастера только для процессов, которые допускают недоступность базы данных на запись продолжительностью до 10 минут);
вы используете FQDN для PRIMARY не по назначению на свой страх и риск.

С моей колокольни - 20-30 секунд в данном эксперименте это довольно много (речь же идёт не про failover, а про switchover - прибить лопатой хост в облаке довольно трудно и, скорее всего, вы просто переключаете PRIMARY в кластере).

То что вы видете ожидаемый результат в рамках своего эксперимента не значит, что эксперимент проведён корректно.

Всегда используйте target_session_attrs=read-write (или primary) при подключении к кластеру PostgreSQL по FQDN в YC

Bozaro May 19 2025 at 05:22

Нет. С target_session_attrs=any никто не мешает использовать из пула уже имеющиеся подключение по старому адресу.

Но до переключения FQDN клиент PRIMARY не увидит. При этом никто не гарантирует, что изменение DNS записи быстро доедет до приложения.

Всегда используйте target_session_attrs=read-write (или primary) при подключении к кластеру PostgreSQL по FQDN в YC

Bozaro May 19 2025 at 05:00

У вас наслаивается два эффекта:

необходимость создать новое подключение, так как старое не удовлетворяет запрошенному target_session_attrs=read-write;
изменение адреса, в который резолвится FQDN имя.

И это создаёт иллюзию, что оно работает правильно. Но время переключения сильно зависит от кэша DNS, на который в таких вещах лучше не полагаться.

По хорошему, в строке подключения вместо этого FQDN должны быть указаны адреса всех хостов PostgreSQL-кластера.

Всегда используйте target_session_attrs=read-write (или primary) при подключении к кластеру PostgreSQL по FQDN в YC

Bozaro May 19 2025 at 04:41

target_session_attrs имеет смысл указывать, если у вас более одного хоста. В статье используется алиас, который ~~всегда~~ указывает на PRIMARY:

https://yandex.cloud/ru/docs/managed-postgresql/operations/connect#fqdn-master

FQDN вида c-<идентификатор_кластера>.rw.mdb.yandexcloud.net всегда указывает на текущий хост-мастер в кластере. Идентификатор кластера можно запросить со списком кластеров в каталоге.
При подключении к этому FQDN разрешено выполнять операции чтения и записи.
Примечание
Используйте подключение с помощью особого FQDN хоста-мастера только для процессов, которые допускают недоступность базы данных на запись продолжительностью до 10 минут.

Будни проджект-менеджера

Bozaro Apr 8 2024 at 10:05

Тут не задан самый главный вопрос: "Зачем нужна эта картина? Какая задача решается?"

Вы точно хотите пойти программистом в gamedev?

Bozaro Nov 20 2023 at 08:30

C git'ом кстати тоже есть проблема, он хорошо подходит для сорцов, а вот что делать с гигабайтными текстурами или файлами модели по 100мб, или луашником/json'ом уровня размером под 20-30 мб текста? Тут либо держишь 2 cvs - одну для сорцов, вторую для контента, либо пишешь своё решение.

Большие файлы стало можно использовать после появления Git LFS.

А проблему взаимодействия Git с не-программистами мы решали реализацией Subversion API поверх Git-репозитория: https://habr.com/ru/companies/vk/articles/241095/

Jenkinsfile – это не Groovy

Bozaro Nov 16 2023 at 09:03

Для совсем мелких проектов подходит почти всё, что угодно.

Проблемы начинаются когда увеличивается количество хотелок:

Хочется, чтобы в выводе сборки можно было узнать, какие тесты попадали и как?
Хочется иметь хоть какую-то статистику по тестам (тут с ностальгией вспоминаю TeamCity);
Хочется иметь разбивку по этам сборки, чтобы не нужно было искать ошибку в одном гигантском логе;
Хочется иметь нотификации авторам о падении тестов;
Хочется иметь интеграцию с системой контроля версий;
Хочется иметь возможность как-то управлять секретами;
Хочется иметь возможность делать цепочки сборок;
И т.д. и т.п.

При этом основные проблемы визуализации возникают в негативном сценарии: пока всё работает, оно никому не интересно. А вот возможность по выводу понять, что и где пошло не так, очень полезна.

Jenkinsfile – это не Groovy

Bozaro Nov 16 2023 at 08:48

Проблему безопасности можно частично решить через вынос общих запчастей в отдельную "доверенную" Jenkins Shared Library. Тогда на её код в src не будут распространяться ограничения песочницы, хотя на vars - всё ещё будут.

На счет плагинов я с Вами согланен: в Jenkins безумное количество legacy и очень разное качество кода от плагина к плагину.

Ну и отдельная проблема в том, что там модульность доведена до абсурда: обычно функционал затрагивает сразу несколько плагинов и не всегда очевидно, какой именно за какую часть фичи отвечает.

Jenkinsfile – это не Groovy

Bozaro Nov 15 2023 at 12:43

Если сборка совсем типовая, то всю эту сложность можно попытаться спрятать, но что-то мне подсказывает, что под капотом standardDeclarativePipelineTemplate творится жесть.

Ну и декларативный pipeline в Jenkins то еще поделие: это де-факто инструкция императивного pipeline, то есть всё равно нельзя сказать, что сделает pipeline не выполнив его.

Из-за этого, в частности:

вечно поломанная визуализация сборки;
объявления параметров и опций в pipeline влияет на следующую, а не на текущую сборку.

Jenkinsfile – это не Groovy

Bozaro Nov 15 2023 at 12:38

Когда речь заходит про CI, я всё время вспоминаю цитату из Симпсонов:

> Check out The Willie World News! I reviewed the new tractors! They're all shite!

Выбор CI выглядит как поиск наименее плохого варианта :(

Сравнение MySQL и PostgreSQL в 2023 году

Bozaro Mar 15 2023 at 15:06

Я не знаю СУБД, которые полностью поддерживающая весь ansi.

Но UPDATE входит в Core SQL Features под номером E101-03. Всё-таки весь стандарт и его Core SQL часть несколько разные вещи :)

Сравнение MySQL и PostgreSQL в 2023 году

Bozaro Mar 15 2023 at 11:51

С моей точки зрения, SQL СУБД должна соответствовать хоть одному SQL-стандарту.
Должен быть не только похожий синтаксис, но и поведение.

К примеру, запрос:

UPDATE foo SET a = b, b = a WHERE  id = 42

должен внутри выражений брать значения исходного кортежа, то есть поменять значения полей a и bместами. В MySQL же в обе колонки попадёт исходное значение b.

Про особенное виденье уровней изоляции транзакций уже было выше.

Все эти особенности в MySQL документированы и переведены в категорию фичей, но от этого как-то не легче.

Сравнение MySQL и PostgreSQL в 2023 году

Bozaro Mar 15 2023 at 11:10

MySQL - это минное поле. У неё куча очень странных особенностей, которые могут вставить нож в спину в самый неожиданный момент.
Из особо прекрасного: https://www.percona.com/blog/what-if-mysqls-repeatable-reads-cause-you-to-lose-money/
Ну и, строго говоря, MySQL не является SQL СУБД.

Путь миграции с go build на Bazel

Bozaro Feb 28 2023 at 11:41

Вы не представляете масштаб проблемы: распил проекта на маленькие модули требует годы.

Даже если предположить, что проект волшебным образом распадётся на сотни маленьких слабо связанных модулей, то их всё равно нужно будет чем-то собирать.

К тому же сокращение времени на итерацию в CI делает рефакторинг заметно комфортнее.

Путь миграции с go build на Bazel

Bozaro Feb 28 2023 at 09:52

Распилить проект и уменьшить связанность кода это благая цель.
Но в данном случае:

уменьшение связанности никак не конфликтует с оптимизацией инструментария сборки;
уменьшение связанности кода никак нельзя назвать "простым" процессом.

Путь миграции с go build на Bazel

Bozaro Feb 28 2023 at 09:17

"Монолит" это что?

Путь миграции с go build на Bazel

Bozaro Feb 27 2023 at 21:22

Я так и не смог понять, как подружить IDE и Bazel...

Собственно из-за этого и пошли по пути, когда BUILD-файлы генерируются на базе исходного кода и go.mod-файлов, максимально повторяя go build-сборку.

На машинках разработчиков Bazel используется только для создания генерируемых .go-файлов, которые потом раскладываются в рабочей копии. В результате для большинства, кроме этого вызова генератора, Bazel никак не используется.

Эта схема оказалась на удивление удачной:

разработчикам не нужно воевать с Bazel;
IDE работает как работало;
генераторы получают возможность генерировать зависящие от компиляции данные (в нашем случае mock-и);
если нужно, разработчик может использовать Bazel как для сборки, так и для запроса зависимостей через bazel query.

А вот тезис с поддельным GOROOT я не понял...

2 3 ...

7 8