Тензор, Ярославль - Разработчик системы Saby / Статьи / Хабр

ПрофильСтатьи236Посты6Подписчики34KСотрудники204

Kilor 4 окт 2022 в 12:50

Приручаем многопоточность в Node.js (часть 4/5: координатор против синхронного кода)

11 мин

4.9K

Блог компании ТензорВысоконагруженные системы * JavaScript * Программирование * Node.JS *

Туториал

В предыдущей части мы научились эффективно передавать данные вспомогательным потокам из основного через разделяемую память, используя Atomics-операции и блокировки.

Но мы рассматривали все-таки идеальную ситуацию, когда основной поток больше ничем не занимался, кроме обмена с "подчиненными" уже заранее готовыми данными. В реальных же приложениях такое встречается достаточно редко - обычно эти самые данные приходится готовить непосредственно перед передачей. И, бывает, в этом участвует существенная доля синхронного кода, что для JavaScript крайне неприятно, но иногда неизбежно - например, при вычислении регулярных выражений.

Давайте оценим, насколько синхронные операции "роняют" производительность нашего тестового приложения. И узнаем, как можно в разы улучшить ее, "скрестив ужа с ежом", используя выделенный поток-координатор из позапрошлой части статьи совместно с разделяемой памятью.

+13

Kilor 31 янв 2022 в 15:00

PostgreSQL Antipatterns: делаем группировку быстрее от 0.1 до 5 раз

2 мин

13K

Блог компании ТензорPostgreSQL * Программирование * SQL * Базы данных *

Примитивный запрос - простой джойн и группировка. Традиционные методы оптимизации - казалось бы, что могло пойти не так?..

Небольшой эксперимент, на тему необходимости проверки любых гипотез в конкретных условиях.

+13

Kilor 28 янв 2021 в 11:30

Агрегаты в БД — эффективная обработка потока «фактов»

5 мин

5.2K

Блог компании ТензорБазы данных * SQL * PostgreSQL * Высоконагруженные системы *

Предположим, вам надо обработать на PostgreSQL большое (не, не так... БОЛЬШОЕ) количество записей, чтобы посчитать какие-нибудь агрегаты. В предыдущей статье были разобраны различные варианты, как это можно организовать, а в этой посмотрим, как при этом особо никого не заблокировать, включая "набегающий поток" данных.

Например, это может быть пересчет остатков и ведение сводных продаж по товарам при их постоянных отгрузках, или агрегация сальдо и оборотов по бухгалтерским счетам, при массовых изменениях проводок, или что-то еще... В любой управленческой системе подобных задач наберется горка, и СБИС тоже не является исключением.

Но у всех этих ситуаций есть общий момент - количество изменений сильно больше количества целевых агрегатов. Например: тысячи товаров, по каждому десятки тысяч отгрузок в день.

+13

Kilor 25 янв 2021 в 13:45

Агрегаты в БД — зачем, как, а стоит ли?

5 мин

15K

Блог компании ТензорPostgreSQL * SQL * Базы данных * ERP-системы *

С течением жизни приложения в его БД накапливается все больше данных. Десктопное оно, SaaS или даже мобильное - неважно, в современном мире почти каждый что-то хранит "у себя".

Если это какая-то локальная утилита - не страшно, само ее существование у пользователя достаточно ограничено. Но если это что-то вроде нашего СБИС, который накапливает и помогает анализировать операции за все время существования бизнеса, то, по мере его роста, не только операций становится больше, но и понимания, какие именно сводные отчеты помогают в оперативном управлении.

Вот про то, как сделать такие отчеты быстрыми, какие бывают способы их реализации и встречаются "грабли" на этом пути, сегодня и поговорим.

+13

Kilor 11 янв 2021 в 12:15

SQL HowTo: рейтинг-за-интервал

3 мин

8.1K

Блог компании ТензорERP-системы * Базы данных * SQL * PostgreSQL *

Одним из наиболее частых требований-"хотелок" бизнеса является построение всяких разных рейтингов - "самые оборотистые клиенты", "самые продаваемые позиции", "самые активные сотрудники", … - любимая тема разных дашбордов.

Традиционно, есть два подхода к этой задаче: запрос по требованию по "сырым" данным или предварительная агрегация. И если "просто посчитать" такой отчет по первичке - упражнение для SQL-новичка, но очень "тяжелое" для производительности СУБД, то вариант сделать так, чтобы он строился практически мгновенно при большом количестве активных аккаунтов независимых бизнесов, как у нас в СБИС, без необходимости пересчитывать агрегированную статистику каждый день судорожно по всем клиентам - интересная задача.

+13

Kilor 3 сен 2020 в 16:45

PostgreSQL Query Profiler: как сопоставить план и запрос

6 мин

14K

Блог компании ТензорPostgreSQL * SQL * Базы данных * Визуализация данных *

Многие, кто уже пользуется explain.tensor.ru — нашим сервисом визуализации планов PostgreSQL, возможно, не в курсе одной из его суперсособностей — превращать сложно читаемый кусок лога сервера…

… в красиво оформленный запрос с контекстными подсказками по соответствующим узлам плана:

В этой расшифровке второй части своего доклада на PGConf.Russia 2020 я расскажу, как нам удалось это сделать.

С транскриптом первой части, посвященной типовым проблемам производительности запросов и их решениям, можно ознакомиться в статье «Рецепты для хворающих SQL-запросов».

+13

Kilor 20 дек 2019 в 14:57

DBA: вычищаем клон-записи из таблицы без PK

3 мин

6.3K

Блог компании ТензорPostgreSQL * SQL * Базы данных *

Случаются ситуации, когда в таблицу без первичного ключа или какого-то другого уникального индекса по недосмотру попадают полные клоны уже существующих записей.

Например, пишутся в PostgreSQL COPY-потоком значения хронологической метрики, а потом внезапный сбой, и часть полностью идентичных данных приходит повторно.

Как избавить базу от ненужных клонов?

Читать дальше →

+13

Kilor 3 мар в 06:53

SQL HowTo: динамическое программирование (Advent of Code 2024, Day 19: Linen Layout)

Простой

9 мин

1.2K

Блог компании ТензорАлгоритмы * SQL * PostgreSQL * Занимательные задачки

Кейс

В этой челлендж-серии статей попробуем использовать PostgreSQL как среду для решения задач Advent of Code 2024.

Возможно, SQL не самый подходящий для этого язык, зато мы рассмотрим его различные возможности, о которых вы могли и не подозревать.

Используем динамическое программирование для подсчета количества вариантов размещений.

+12

MGorkov 21 фев в 06:03

IPC в Node.js: решение проблемы с передачей данных

Средний

6 мин

1.9K

Блог компании ТензорNode.JS * Высоконагруженные системы *

Кейс

В Node.js IPC (Inter-Process Communication) - это механизм, используемый для обмена данными между процессами. Начиная с версии 12.16.0 в модуле child_processes появилась поддержка режима advanced serialization для IPC. Однако иногда он может привести к проблемам с зависанием сообщений, что приводит к ошибкам и проблемам с функциональностью. В этой статье мы расскажем как решили эту проблему.

+12

Kilor 25 дек 2024 в 10:10

SQL HowTo: поиск в словаре и массивах, сортировка «пузырьком» (Advent of Code 2024, Day 5: Print Queue)

Средний

8 мин

1.6K

Блог компании ТензорPostgreSQL * SQL * Алгоритмы * Занимательные задачки

Кейс

В этой челлендж-серии статей попробуем использовать PostgreSQL как среду для решения задач Advent of Code 2024.

В этой части воспользуемся обширными возможностями поиска в массивах и реализуем рекурсивную сортировку «пузырьком».

+12

deskarion 14 ноя 2023 в 08:08

Импортозамещение сканеров WEB уязвимостей: обзор актуальных DAST решений

Простой

10 мин

8.5K

Блог компании ТензорИнформационная безопасность * Bug hunters *

Обзор

✏️ Технотекст 2023

Привет, Хабр!

Поговорим о проблеме выбора DAST, который бы смог удовлетворить потребности регулярного поиска уязвимостей в web-инфраструктуре компании. Опытные пентестеры, специализирующиеся на web-приложениях, наверняка возразят: какой тут может быть выбор? Burp Suite PRO наше все! И будут правы, но на прошлом PHD мне в руки попала Позитивная карта импортозамещения (https://www.ptsecurity.com/upload/corporate/ru-ru/analytics/positive-research-2023-poster.pdf), где Positive Technologies предложили заместить иностранные DAST: Burp Suite Pro, Acunetix, Inviciti — своим решением PT BlackBox. Но чтобы коммерческим продуктам не быть едиными, заодно добавим в сравнение продукты open source.

Разберемся, импортозамещаться или приобретать через серые схемы иностранный Burp Suite Pro. Или вообще оставаться на бесплатном open source.

+12

Papkin 7 июн 2023 в 07:47

Тензор: PRO своих

2 мин

2.2K

Блог компании ТензорИнтервьюSQL * PostgreSQL *

Интервью

В нашем блоге так много статей о технологиях, научных решениях, новых приложениях и так мало про тех, кто стоит за всеми этими строчками кода, про обычных людей. Хотим рассказать о тех, кто ежедневно делает наш продукт лучше.

Дальше - больше :)

+12

MGorkov 17 мар 2023 в 07:01

Node.JS: заменили модуль SSH2 на OpenSSH и снизили задержки eventloop в 15 раз

Средний

5 мин

5.8K

Блог компании ТензорNode.JS * Программирование * JavaScript * Высоконагруженные системы *

Кейс

В нашем сервисе мониторинга и анализа PostgreSQL доступ к серверам осуществляется по протоколу SSH. В качестве ssh-клиента мы используем популярный модуль SSH2 , однако при передаче данных большого объема этот модуль вносит существенные задержки в event loop. Как их можно снизить - расскажем в этой статье.

+12

Kilor 19 янв 2023 в 12:31

Node.js: Клонирование ключей. Is eval() evil?

5 мин

3.3K

Блог компании ТензорNode.JS * Программирование * JavaScript * Высоконагруженные системы *

Туториал

На примере простой задачи клонирования ключей объекта посмотрим, есть ли реальные альтернативы по производительности столь презираемой JavaScript-разработчиками функции eval().

Подобная задача возникает, если оригинальное значение ключа надо оставить у объекта, а как-то обработанное - положить рядом в новый соответствующий ключ. То есть, для начала, из {"a" : 1, "b" : 2} надо получить {"a" : 1, "a-copy" : 1, "b" : 2, "b-copy" : 2}.

Пару лет назад я уже рассказывал, почему максимальная производительность подобных операций на JavaScript важна для нашего сервиса потокового анализа логов PostgreSQL, как можно поускорять парсинг с помощью WebAssembly, и вот сегодня - продолжение.

+12

Kilor 8 фев 2021 в 16:05

Агрегаты в БД — прокси-таблицы

4 мин

Блог компании ТензорБазы данных * SQL * PostgreSQL * Высоконагруженные системы *

Мы заканчиваем мини-серию статей о работе с агрегатами в PostgreSQL:

- зачем, как, а стоит ли?

- эффективная обработка потока «фактов»

- многомерные суперагрегаты

И сегодня поговорим о том, как можно снизить суммарные задержки на вставку множества изменений в таблицы агрегатов за счет использования промежуточных таблиц и внешней обработки.

+12

Kilor 1 сен 2020 в 19:05

Динамическая балансировка нагрузки в pull-схеме

7 мин

2.6K

Блог компании ТензорАлгоритмы * Высоконагруженные системы * Математика * Программирование *

В прошлой новости про принципы работы коллекторов логов PostgreSQL я упомянул, что одним из недостатков pull-модели является необходимость динамической балансировки нагрузки. Но если делать ее аккуратно, то недостаток превращается в достоинство, а система в целом становится гораздо более устойчивой к изменениям потока данных.

Давайте посмотрим, какие решения есть у этой задачи.

Читать дальше →

+12

Kilor 19 июн 2020 в 08:30

SQL HowTo: 1000 и один способ агрегации

5 мин

16K

Блог компании ТензорПрограммирование * Высоконагруженные системы * SQL * PostgreSQL *

Наш СБИС, как и другие системы управления бизнесом, не обходится без формирования отчетов — каждый руководитель любит сводные цифры, особенно всякие суммы по разделам и красивые "Итого".

А чтобы эти итоги собрать, необходимо по исходным данным вычислить значение некоторой агрегатной функции: количество, сумма, среднее, минимум, максимум,… — и, как правило, не одной.

Сегодня мы рассмотрим некоторые способы, с помощью которых можно вычислить агрегаты в PostgreSQL или ускорить выполнение SQL-запроса.

Читать дальше →

+12

tensor_sbis 4 мая 2017 в 13:25

Как мы учились обновлять 5 000 серверов компании Тензор

9 мин

11K

Блог компании ТензорСерверное администрирование * Базы данных * Хранение данных *

Нынче в каждой приличной организации, разрабатывающей серьезное программное обеспечение, принято делиться, какими путями создавались и развивались ее проекты. Мы считаем это отличной тенденцией и готовы поведать свой вариант развития одного из внутренних проектов компании «СБИС». Он влияет самым серьезнейшим образом на все ее остальные продукты, и его ласково называют — «Хоттабыч», ибо делает волшебство!

Каждые 100 секунд он обновляет какое-нибудь приложение в боевом или в тестовом окружении. Приложений у нас только в «продакшн» около 200, а на тестовых стендах — больше 1000. Количество виртуальных серверов, на которых развернуто каждое приложение – от двух до нескольких сотен. Итак, по порядку…

Читать дальше →

+12

MGorkov 20 мар 2024 в 05:56

Плагин для анализа планов PostgreSQL в VS Code, и его разработка

Средний

7 мин

8.4K

Блог компании ТензорPostgreSQL * Visual Studio *

Туториал

Анализ планов и форматирование запросов PostgreSQL удобно выполнять в VS Code, используя explain.tensor.ru и плагин, о котором пойдет речь ниже.

+11

Kilor 28 ноя 2023 в 07:20

SQL HowTo: TOP-N на субинтервалах

Простой

3 мин

5.2K

Блог компании ТензорВысоконагруженные системы * PostgreSQL * SQL * Базы данных *

Кейс

Периодически сталкиваюсь с однотипными задачами вида "показать TOP-N позиций на каждом из вложенных интервалов некоторого периода".

Это может быть "5 лучших по успеваемости студентов в каждом семестре за последний учебный год", или "помесячная динамика позиции 10 наиболее продающихся товаров", или, как у нас в сервисе визуализации PostgreSQL-планов explain.tensor.ru, "3 наиболее активных страны за каждый день":

+11

1 2 ...

6 7

9 10 11 12

Приручаем многопоточность в Node.js (часть 4/5: координатор против синхронного кода)

PostgreSQL Antipatterns: делаем группировку быстрее от 0.1 до 5 раз

Агрегаты в БД — эффективная обработка потока «фактов»

Агрегаты в БД — зачем, как, а стоит ли?

SQL HowTo: рейтинг-за-интервал

PostgreSQL Query Profiler: как сопоставить план и запрос

DBA: вычищаем клон-записи из таблицы без PK

SQL HowTo: динамическое программирование (Advent of Code 2024, Day 19: Linen Layout)

IPC в Node.js: решение проблемы с передачей данных

SQL HowTo: поиск в словаре и массивах, сортировка «пузырьком» (Advent of Code 2024, Day 5: Print Queue)

Импортозамещение сканеров WEB уязвимостей: обзор актуальных DAST решений

Тензор: PRO своих

Node.JS: заменили модуль SSH2 на OpenSSH и снизили задержки eventloop в 15 раз

Node.js: Клонирование ключей. Is eval() evil?

Ближайшие события

Агрегаты в БД — прокси-таблицы

Динамическая балансировка нагрузки в pull-схеме

SQL HowTo: 1000 и один способ агрегации

Как мы учились обновлять 5 000 серверов компании Тензор

Плагин для анализа планов PostgreSQL в VS Code, и его разработка

SQL HowTo: TOP-N на субинтервалах

Информация