Comments / Profile of batyrmastyr / Habr

batyrmastyr @batyrmastyr

User

ProfileArticlesPostsNewsComments666

Почему многие пользуются древними версиями Postgres?

batyrmastyr Oct 22 2024 at 12:58

Похоже это чисто убунтовая обёртка над pg_upgrade / pg_ctl

Look

lnav — супернедооценённый инструмент для работы с логами

batyrmastyr Sep 1 2024 at 07:09

Как насчёт (1) кеширования файла в ОЗУ силами ОС (2) mmap?

Look

Топ модулей для распознавания рекапчи на Python, Node js и PHP

batyrmastyr Sep 1 2024 at 05:09

Вы делаете выводы на основе абсолютно ложных данных.

Решение капчи требует 40 - 90 секунд, так что, независимо от async, все вменяемые люди выносят ожидание в крон/очереди/вебхуки: один фиг ни пользователь, ни браузер ответа столько ждать не станут.
Если зайти на packagist, то «модулей» для одной только 2captcha найдется 17 штук. Хз нафига они сдались - с нуля там строчек 15 - 30 кода, а подключение и настройка обёртки порядка 10.

Look

Топ модулей для распознавания рекапчи на Python, Node js и PHP

batyrmastyr Aug 31 2024 at 22:42

Авторы статьи поленились искать, в реальности их десятки или сотни, как и для питона с js.

Look

«Яндекс» поменял стоимость базовой подписки «Яндекс Плюс», добавив туда новые опции: «Букмейт» и «Больше кино»

batyrmastyr Aug 30 2024 at 17:39

Он и в районе 2005 года только на компе запускался.

Look

Чиним замедление YouTube на уровне роутера

batyrmastyr Aug 12 2024 at 13:26

Окей, возражений по существу не жду, благо ущербность вашего заявления много раз разобрали.

Look

Чиним замедление YouTube на уровне роутера

batyrmastyr Aug 11 2024 at 18:39

и никому ничего не жало

ORLY?!

он был первым, кто пошёл на третий срок
её побежали принимать сразу как только он сыграл в ящик, а жать немного начало ещё в середине его второго срока.

https://books.google.ru/books?id=_nYZHG2P-9QC&pg=PP8&source=gbs_selected_pages&cad=1#v=onepage&q&f=false

сменяемость власти

У неё две задачи: (1) ограничить скорость развития звёздной болезни у правителя и (2) уменьшить ущерб если правитель начнёт творить что-то не то.

Look

Разработчики на PHP умеют писать код, но не всегда знают как устроен web-server

batyrmastyr Aug 5 2024 at 18:32

Да, в других языках нет прямой зависимости 1 worker = 1 запрос

В php, благодаря растущей популярности RoadRunner, тоже уже нет такой зависимости.

зная особенности работы web-сервера на PHP можно ускорить обработку запросов, например, вынеся часть операций в фоновую обработку.

Фоновая обработка с веб-сервером не связана почти никак.

Или вы что-то меняли в коде очередей при переезде с апача на nginx?

А если вы про fastcgi_finish_request, то это не совсем "фоновая обработка", сервер в целом от этого не ускорится.

Look

СМИ: причиной продолжающегося сбоя в работе сервисов СДЭК может быть вирус-шифровальщик и хакерская атака

batyrmastyr May 29 2024 at 06:54

связался с хакерами, которые до этого:

Неплохой послужной список, если не наврали в резюме.

Вы все еще думаете, что это обычные хакеры вне политики

Вы утверждаете, что они исключительно идейные, а не просто «наёмники»? А основания для таких утверждений есть?

Look

Неожиданные последствия запуска PostgreSQL в Docker: замедление запросов в 100 раз

batyrmastyr May 1 2024 at 12:00

грубо yum install postgresql15-server - проблемы нет
В Redhat/Centos JIT не устанавливается, т.е. выключен.

Но ведь yum - команда из Redhat, где JIT выключен, о результатах проверки в Debian без докера - ни слова.

Look

Бэкдор в xz нашли из-за замедления работы sshd в полсекунды

batyrmastyr Apr 6 2024 at 20:53

К закрытому коду имеет доступ куча джунов и субподрядчиков, их код далеко не всегда хоть кто-то ревьюит, а уж чтобы ревью делали спецы по безопасности... не будем о грустном.

Look

Мифы и реалии «Мультимастера» в архитектуре СУБД PostgreSQL. Часть. 2

batyrmastyr Apr 5 2024 at 09:14

MySQL вот блокировочник и живёт себе, не особо тужит. Хоть я и «голосую ногами» за переход постгрес.

Look

Roku заблокировала доступ к интерфейсу своих умных ТВ (на Roku OS), пока пользователи не согласятся с новыми условиями

batyrmastyr Mar 8 2024 at 13:00

Глянул как-то на младшие ресторанные посудомойки и удивился, что они дешевле на уровне средних-дорогих домашних, то есть ценник не особо конский. И моют за несколько минут, а не пару-тройку часов.

Look

ML-кодек VideoMost для суперсжатия видео получил патенты в РФ и в США

batyrmastyr Mar 8 2024 at 08:09

Новость чётко говорит, что нейросетка - в декодере. Они, условно, хотят 4k превратить в 480p, а потом через DLSS растянуть обратно в 4k.

Маломощный комп не требуется, по проверенной схеме с AVC и HEVC хотят заставить купить новую видюху с аппаратным декодером.

Look

Apple представила чипы M3, M3 Pro и M3 Max

batyrmastyr Dec 2 2023 at 12:34

А смысл? Быстрые vs экономичные ядра, возможность ненадолго задрать частоту одного или пары ядер, отличия в архитектуре изрядно портят прикидки по частоте.

Look

Представляем nxs-data-anonymizer — удобный инструмент для анонимизации баз данных

batyrmastyr Nov 12 2023 at 19:40

получилось гибким, быстрым и удобным в использовании

По части «быстрым» есть вопросы — 1.3.0 на гиговом дампе на MacBook M2 перемалывает всего лишь ~10 Мб/с сырого SQL.

Я правильно понимаю, что шаблоны компилируются заново для каждого значения?

Look

Подойдет ли PostgreSQL вообще всем проектам или нужны альтернативы

batyrmastyr Aug 24 2023 at 16:40

Хотя мускуль 8.0 тоже индексы использует, но толку с них мало:

name = 'дубай' — actual time=0.061..0.072
по префиксу name like 'дубай%' — actual time=0.199..0.232
name like '%дубай%' — actual time=205.801..228.952, в плане есть Covering index scan
name like '%дубай%' без индексов - actual time=19.382..277.397

Look

MariaDB, фрагментация, varchar и печалька

batyrmastyr Aug 22 2023 at 21:19

В постгресе всё воспроизводится на 146%.

В нём любое изменение создаёт новую версию (читай - копию) строки. Даже UPDATE test_data_varchar_with_update SET height = height + 1 (изменение значения в int колонке) удвоит размер занимаемого места, а потом придёт дефрагментатор (автовакуум) и почистит мусор.

Погонял немного запросы, получил такое:

CREATE TABLE test_data_varchar_with_update (
     id bigint GENERATED ALWAYS AS IDENTITY PRIMARY KEY ,
     id_pointer varchar(100) DEFAULT NULL,
     name text NOT NULL,
     width int NOT NULL DEFAULT 0,
     height int NOT NULL DEFAULT 0
)WITH (autovacuum_enabled=off);

insert into test_data_varchar_with_update (id_pointer, name, width, height)
select random()::text, round(random() * 100000)::text, (random() * 20000)::int, generate_series(1, 1000000);

create table t2 as select * from test_data_varchar_with_update;
alter table t2 add primary key (id);

UPDATE test_data_varchar_with_update SET height = (random() * 1000000)::int;
UPDATE test_data_varchar_with_update SET name = substr(repeat(md5(random()::text), 8), 0, 10 + (random() * 240)::int);
UPDATE test_data_varchar_with_update SET name = substr(repeat(md5(random()::text), 8), 0, 10 + (random() * 240)::int);

select pg_size_pretty(pg_relation_size('t2')); // 72 MB
select pg_size_pretty(pg_relation_size('test_data_varchar_with_update')); //526 MB

explain analyze select * from test_data_varchar_with_update where id in (select (random()*100000)::int as id from generate_series(1, 1000));
explain analyze select * from t2 where id in (select (random()*100000)::int as id from generate_series(1, 1000));

Последние два стартуют с 70 мс vs 20 мс, но после 5 - 10 запросов устаканивается на 15 - 30 мс vs 10 - 15 мс.

Look

Подойдет ли PostgreSQL вообще всем проектам или нужны альтернативы

batyrmastyr Aug 21 2023 at 09:50

Да, в постгресе есть стандартное расширение pg_trgm (триграммы)

select * from place_europe_spain where name like '%Sil%';
create index test2 on place_europe_spain USING GIN (name gin_trgm_ops);

+----------------------------------------------------------------------------------------------------------------------+
|QUERY PLAN                                                                                                            |
+----------------------------------------------------------------------------------------------------------------------+
|Seq Scan on place_europe_spain  (cost=0.00..11652.56 rows=746 width=1535) (actual time=4.303..46.607 rows=152 loops=1)|
|  Filter: (name ~~ '%Sil%'::text)                                                                                     |
|  Rows Removed by Filter: 81253                                                                                       |
|Planning Time: 0.224 ms                                                                                               |
|Execution Time: 46.679 ms                                                                                             |
+----------------------------------------------------------------------------------------------------------------------+

+-----------------------------------------------------------------------------------------------------------------------------+
|QUERY PLAN                                                                                                                   |
+-----------------------------------------------------------------------------------------------------------------------------+
|Bitmap Heap Scan on place_europe_spain  (cost=17.78..2347.91 rows=746 width=1535) (actual time=0.288..1.882 rows=152 loops=1)|
|  Recheck Cond: (name ~~ '%Sil%'::text)                                                                                      |
|  Rows Removed by Index Recheck: 175                                                                                         |
|  Heap Blocks: exact=294                                                                                                     |
|  ->  Bitmap Index Scan on test2  (cost=0.00..17.59 rows=746 width=0) (actual time=0.223..0.224 rows=327 loops=1)            |
|        Index Cond: (name ~~ '%Sil%'::text)                                                                                  |
|Planning Time: 0.333 ms                                                                                                      |
|Execution Time: 1.993 ms                                                                                                     |
+-----------------------------------------------------------------------------------------------------------------------------+

На строках в пару символов скорее всего не будет использоваться.

Именно для like '%%' коробочную поддержку завезли в 12 или 13 версии, но в форме регулярного выражения name ~ 'Si' в 9.6 из 2016 года уже работало, а в форме name ~~ '%Si%' вероятно работало аж в 8.3 из 2008 года.

Если устроит поиск по префиксу слов, независимо от места самого слова в строке, то есть полнотекстовый поиск to_tsquery('russian', 'Sa:*'). Тут магия в :*., сам индекс намного компактнее триграммного, можно ещё ускорить (1) сохраняя результирующий to_tsvector (2) добавив расширение на индекс RUM.

create index test3 on place_europe_spain USING GIN (to_tsvector('simple', name));
explain analyze select * from place_europe_spain where to_tsvector('simple', name) @@ to_tsquery('simple', 'S:*');

+------------------------------------------------------------------------------------------------------------------------------+
|QUERY PLAN                                                                                                                    |
+------------------------------------------------------------------------------------------------------------------------------+
|Bitmap Heap Scan on place_europe_spain  (cost=32.62..4799.94 rows=1628 width=1535) (actual time=0.164..0.668 rows=152 loops=1)|
|  Recheck Cond: (to_tsvector('simple'::regconfig, name) @@ '''sil'':*'::tsquery)                                              |
|  Heap Blocks: exact=132                                                                                                      |
|  ->  Bitmap Index Scan on test3  (cost=0.00..32.21 rows=1628 width=0) (actual time=0.110..0.111 rows=152 loops=1)            |
|        Index Cond: (to_tsvector('simple'::regconfig, name) @@ '''sil'':*'::tsquery)                                          |
|Planning Time: 0.291 ms                                                                                                       |
|Execution Time: 0.802 ms                                                                                                      |
+------------------------------------------------------------------------------------------------------------------------------+

Нормально переваривает двухбуквенные префиксы (3-5 мс) и хоть немного, но ускоряет поиск по одной букве (10-30 мс).

Look

Подойдет ли PostgreSQL вообще всем проектам или нужны альтернативы

batyrmastyr Aug 19 2023 at 21:12

условный mysql быстрее

Когда-то был быстрее.

На практике видел только один запрос на котором мускуль был сильно быстрее: UPSERT одной строки во времена Postgres 9.6 или 10. В среднем же постгрес позволяет ускориться в 1,5 - 2 раза без особых усилий, а если активно использовать массивы/полнотекстовый поиск/частичные и функциональные индексы, то местами и в 10-100 раз ускориться можно.

В мускуле даже любимый всеми like '%text%' индексы не использует и чёрт знает когда сможет.

и не создает отдельных процессов для каждого подключения

Какая разница сколько процессов, если мускуль жрёт намного больше оперативки?

Look

2 3 ...

33 34