Тензор, Ярославль - Разработчик системы Saby / Статьи / Хабр

ПрофильСтатьи236Посты6Подписчики34KСотрудники204

anchishkin 21 ноя 2023 в 10:34

Как мы созвонились компанией в 10 тысяч человек

12 мин

3.8K

Блог компании ТензорОблачные сервисы*Видеоконференцсвязь

В Тензоре около 7 тысяч сотрудников и более 100 филиалов по всей стране - такой компании категорически необходима видеокоммуникация. Существует 2 соизмеримых по издержкам решения: использовать существующий продукт или реализовать свой.

В этой статье я, разработчик отдела вебинаров, расскажу, каким образом наша компания, выбрав когда-то второй путь, пришла к собственному сервису вебинаров. Пройдя несколько итераций развития, на сегодняшний день мы научились проводить видеоконференции буквально на всех наших сотрудников.

+11

beatlejute 31 окт 2023 в 07:41

ABR для живых трансляций

9 мин

1.6K

Блог компании ТензорРабота с видео*ВидеоконференцсвязьОблачные сервисы*

Все мы смотрим видеоролики в интернете, и каждому наверняка приходилось сталкиваться с проблемами во время просмотра. Как разработчик сервиса вебинаров, попробую разобрать эту проблематику и рассмотреть возможные решения.

Давайте представим себе ситуацию, в которой у нас есть человек, желающий посмотреть видео через интернет, и мы, как разработчики, стремимся предоставить ему эту возможность.

+11

LightKitten 26 окт 2023 в 10:34

Как и зачем мы парсим XML

Простой

15 мин

13K

Блог компании ТензорXML*C++*

Кейс

Большинство разработчиков рано или поздно сталкиваются с XML. Этот язык разметки настолько глубоко вошел в нашу жизнь, что сложно представить систему, в которой не используется он сам или его подмножества. Разбор XML - достаточно типовая задача, но даже в ней можно выделить несколько основных подходов. В этой статье мы хотим рассказать, зачем нам потребовалось парсить XML, какие подходы мы опробовали, а заодно продемонстрировать замеры производительности для самых популярных реализаций на C++.

+11

Kilor 13 июл 2022 в 15:30

SQL HowTo: наперегонки со временем

2 мин

10K

Блог компании ТензорPostgreSQL*Программирование*SQL*Базы данных*

В PostgreSQL несложно написать запрос, который уйдет в глубокую рекурсию или просто будет выполняться гораздо дольше, чем нам хотелось бы. Как от этого защититься?

А чтобы еще и полезную работу сделать? Например, набрать следующий сегмент данных при постраничной навигации со сложным условием фильтрации.

+11

Kilor 25 авг 2020 в 11:45

Телепортация тонн данных в PostgreSQL

11 мин

6.4K

Блог компании ТензорВысоконагруженные системы*Алгоритмы*PostgreSQL*Node.JS*

Сегодня я поделюсь некоторыми полезными архитектурными решениями, которые возникли в процессе развития нашего инструмента массового анализа производительности серверов PostgeSQL, и которые помогают нам сейчас «умещать» полноценный мониторинг и анализ более тысячи хостов в то же «железо», которого сначала едва хватало для одной сотни.

Intro

Напомню некоторые вводные:

мы строим сервис, который получает информацию из логов серверов PostgreSQL
собирая логи, мы хотим что-то с ними делать (парсить, анализировать, запрашивать дополнительную информацию) в режиме онлайн
все собранное и «наанализированное» надо куда-то сохранить

Именно про последний пункт — как все это можно доставить в PostgreSQL-хранилище, и поговорим. В нашем случае таких данных кратно больше, чем исходных — статистика нагрузки в разрезе конкретного приложения и шаблона плана, потребление ресурсов и вычисление производных проблем с точностью до отдельного узла плана, мониторинг блокировок и многое другое.

Более полно о принципах работы сервиса можно посмотреть в видео доклада и прочитать в статье «Массовая оптимизация запросов PostgreSQL».

Читать дальше →

+11

Kilor 15 июн 2020 в 17:00

DBA: кто скрывается за блокировкой

7 мин

7.7K

Блог компании ТензорСистемное администрирование*Базы данных*SQL*PostgreSQL*

В предыдущей статье мы научились снимать состояние блокировок на сервере PostgreSQL ровно в тот момент, когда они происходят. В этой — научимся трактовать собранное и узнавать, кто именно может скрываться за конкретной матрицей конфликтов, и почему результат выглядит именно так.

Читать дальше →

+11

Kilor 22 апр 2020 в 09:10

Экономим копеечку на больших объемах в PostgreSQL

6 мин

14K

Блог компании ТензорВысоконагруженные системы*Анализ и проектирование систем*Базы данных*PostgreSQL*

Продолжая тему записи больших потоков данных, поднятую предыдущей статьей про секционирование, в этой рассмотрим способы, которыми можно уменьшить «физический» размер хранимого в PostgreSQL, и их влияние на производительность сервера.

Речь пойдет про настройки TOAST и выравнивание данных. «В среднем» эти способы позволят сэкономить не слишком много ресурсов, зато — вообще без модификации кода приложения.

Однако, наш опыт оказался весьма продуктивным в этом плане, поскольку хранилище почти любого мониторинга по своей природе является большей частью append-only с точки зрения записываемых данных. И если вам интересно, как можно научить базу писать на диск вместо 200MB/s вдвое меньше — прошу под кат.

Читать дальше →

+11

Kilor 19 мар 2020 в 15:30

DBA: грамотно организовываем синхронизации и импорты

9 мин

12K

Блог компании ТензорПрограммирование*Базы данных*SQL*PostgreSQL*

При сложной обработке больших наборов данных (разные ETL-процессы: импорты, конвертации и синхронизации с внешним источником) часто возникает необходимость временно «запомнить», и сразу быстро обработать что-то объемное.

Типовая задача подобного рода звучит обычно примерно так: «Вот тут бухгалтерия выгрузила из клиент-банка последние поступившие оплаты, надо их быстренько вкачать на сайт и привязать к счетам»

Но когда объем этого «чего-то» начинает измеряться сотнями мегабайт, а сервис при этом должен продолжать работать с базой в режиме 24x7, возникает множество side-эффектов, которые будут портить вам жизнь.

Чтобы справиться с ними в PostgreSQL (да и не только в нем), можно использовать некоторые возможности для оптимизаций, которые позволят обработать все быстрее и с меньшим расходом ресурсов.

Читать дальше →

+11

Kilor 13 фев 2020 в 11:20

Фантастические advisory locks, и где они обитают

6 мин

50K

Блог компании ТензорАлгоритмы*Базы данных*SQL*PostgreSQL*

В PostgreSQL существует очень удобный механизм рекомендательных блокировок, они же — advisory locks. Мы в «Тензоре» используем их во многих местах системы, но мало кто детально понимает, как конкретно они работают, и какие проблемы можно получить при неправильном обращении.

Читать дальше →

+11

Kilor 15 янв 2020 в 09:05

DBA: перенос значений SEQUENCE между базами PostgreSQL

3 мин

8.4K

Блог компании ТензорPostgreSQL*Базы данных*

Как можно перенести в другую PostgreSQL-базу последнее назначавшееся значение «автоинкремент»-поля типа serial, если в таблице могли быть какие-то удаления, и «просто подставить max(pk)» уже не подходит?

Мало кто знает, что хоть PG и не предоставляет до версии 10 функций, чтобы узнать последнее значение последовательности для такого поля из другого сеанса, это все-таки можно сделать.

Читать дальше →

+11

Kilor 13 янв 2020 в 06:07

SQL HowTo: собираем «цепочки» с помощью window functions

6 мин

7.3K

Блог компании ТензорPostgreSQL*SQL*Алгоритмы*

Иногда при анализе данных возникает задача выделения «цепочек» в выборке — то есть упорядоченных последовательностей записей, для каждой из которых выполняется некоторое условие.

Это может быть как условие от данных самой записи, так и сложное выражение относительно одной или нескольких предыдущих записей — например, длина интервала между близкими временными отсчетами.

Традиционные решения предусматривают разные варианты «self join», когда выборка соединяется с собой же, либо использование некоторых фактов «за пределами данных» — например, что записи должны иметь строго определенный шаг (N+1, «за каждый день», ...).

Первый вариант зачастую приводит к квадратичной сложности алгоритма от количества записей, что недопустимо на больших выборках, а второй может легко «развалиться», если каких-то отсчетов в исходных данных вдруг не окажется.

Но эту задачу нам помогут эффективно решить оконные функции в PostgreSQL.

Читать дальше →

+11

tensor_sbis 18 мая 2017 в 10:50

Meine Überwachung, или сказ о красивом мониторинге — начало

10 мин

14K

Блог компании ТензорIT-инфраструктура*Серверное администрирование*Системное администрирование*

Сейчас о мониторинге не пишет только ~~мёртвый~~ тот, у кого его нет. У нас в Тензоре мониторинг есть – это наша собственная система сбора метрик (хотя это далеко не единственное её назначение), тесно интегрированная с Zabbix.

Если вам интересно, как устроен мониторинг 5K серверов в нашей компании, с какими проблемами нам приходилось сталкиваться на пути к 1.5M метрик, 65K значений в секунду и текущему решению и как мы вообще докатились до жизни такой, добро пожаловать под кат.

Читать дальше →

+11

Kilor 31 мар в 07:40

SQL HowTo: работаем с массивами (Advent of Code 2024, Day 23: LAN Party)

Простой

7 мин

1.4K

Блог компании ТензорPostgreSQL*SQL*Алгоритмы*Занимательные задачки

Кейс

В этой челлендж-серии статей попробуем использовать PostgreSQL как среду для решения задач Advent of Code 2024.

Возможно, SQL не самый подходящий для этого язык, зато мы рассмотрим его различные возможности, о которых вы могли и не подозревать.

Применяем простые операции над массивами, чтобы определить связность графов.

+10

Kilor 24 мар в 06:30

SQL HowTo: оконные функции (Advent of Code 2024, Day 22: Monkey Market)

Простой

10 мин

2.7K

Блог компании ТензорЗанимательные задачкиАлгоритмы*SQL*PostgreSQL*

Кейс

В этой челлендж-серии статей попробуем использовать PostgreSQL как среду для решения задач Advent of Code 2024.

Используем оконные функции, чтобы вычислить "третью производную".

+10

Kilor 15 янв в 10:38

SQL HowTo: оптимизируем рекурсию (Advent of Code 2024, Day 9: Disk Fragmenter)

Сложный

15 мин

1.6K

Блог компании ТензорPostgreSQL*SQL*Алгоритмы*Занимательные задачки

Кейс

В этой челлендж-серии статей попробуем использовать PostgreSQL как среду для решения задач Advent of Code 2024.

В этой части рассмотрим некоторые "грабли", на которые можно наступить, реализуя рекурсивные алгоритмы на SQL... Которые иногда можно сделать вовсе нерекурсивными, ускоряя запрос в десятки раз!

+10

Kilor 13 янв в 09:00

SQL HowTo: генерация и подсчет уникальных комбинаций (Advent of Code 2024, Day 8: Resonant Collinearity)

Простой

6 мин

1.2K

Блог компании ТензорЗанимательные задачкиАлгоритмы*SQL*PostgreSQL*

Кейс

В этой челлендж-серии статей попробуем использовать PostgreSQL как среду для решения задач Advent of Code 2024.

В этой части воспользуемся возможностями линейной генерации и подсчета уникальных значений.

+10

MGorkov 6 фев 2024 в 06:53

Плагин для анализа планов PostgreSQL в Eclipse и DBeaver, и его разработка

Средний

8 мин

6.9K

Блог компании ТензорPostgreSQL*Java*Eclipse*

Туториал

Для пользователей explain.tensor.ru - нашего сервиса визуализации PostgreSQL-планов, в дополнение к плагину Jetbrains мы создали еще один - с возможностью форматировать запросы и анализировать планы в Eclipse IDE и DBeaver.

+10

arkhipovds 30 авг 2023 в 06:51

Kubernetes в Тензоре

Простой

8 мин

Блог компании ТензорKubernetes*

Из песочницы

Привет! Меня зовут Денис, и я отвечаю за контейнерную инфраструктуру в Тензоре. Начну с начала. Когда-то Kubernetes-кластеров у нас не было. Зато были 2 дата-центра и 20 тыс. виртуальных машин на тысяче железных серверов. На этом великолепии и «крутились» продукты компании Тензор.

И появилась задача — перенести весь софт в контейнеры и в кубер.

На старте были определены базовые потребности, вроде сетевой связности, внутреннего DNS и хранения данных. Естественно, мы осознавали не весь функционал, который, в итоге, потребовался. Если ваша задача схожа с нашей или вам интересно из каких кубиков собирают кубер, коллеги — добро пожаловать и приятного чтения)

Ах, да, на данный момент у нас 30 K8s-кластеров на 4 площадках, 350+ нод. И мы активно мигрируем приложения с ВМ в K8s.

+10

Kilor 29 июл 2022 в 12:17

PostgreSQL Antipatterns: где скаляру в GiST место?

3 мин

3.4K

Блог компании ТензорPostgreSQL*SQL*Высоконагруженные системы*Базы данных*

В PostgreSQL есть "волшебный" тип индекса GiST, который позволяет быстро искать разные сложные вещи - от интервалов до массивов и даже реализовывать полнотекстовый поиск.

Про его внутреннее устройство и возможности подробно рассказывал Егор Рогов, а я в статье "PostgreSQL Antipatterns: работаем с отрезками в «кровавом энтерпрайзе»" показал, как с помощью расширения btree_gist он позволяет решать типовые бизнес-задачи.

Одной из таких задач является поиск отрезков внутри сегмента со скалярным идентификатором. И если для btree очевидно, что поле с меньшей кардинальностью должно стоять в индексе раньше - индекс от этого и меньше и быстрее (см. "DBA: находим бесполезные индексы"), то так ли это однозначно для btree_gist?

+10

Kilor 5 мая 2022 в 14:00

PostgreSQL Antipatterns: в этом плане кто-то лишний

3 мин

7.8K

Блог компании ТензорБазы данных*SQL*PostgreSQL*Высоконагруженные системы*

Сегодня будет рассказ про избыточные группировки и сортировки в SQL-запросах - как они возникают, по каким признакам их можно потом вычислить и как избавиться от них.

+10

1 2 ...

7 8

10 11 12

Как мы созвонились компанией в 10 тысяч человек

ABR для живых трансляций

Как и зачем мы парсим XML

SQL HowTo: наперегонки со временем

Телепортация тонн данных в PostgreSQL

Intro

DBA: кто скрывается за блокировкой

Экономим копеечку на больших объемах в PostgreSQL

DBA: грамотно организовываем синхронизации и импорты

Фантастические advisory locks, и где они обитают

DBA: перенос значений SEQUENCE между базами PostgreSQL

SQL HowTo: собираем «цепочки» с помощью window functions

Meine Überwachung, или сказ о красивом мониторинге — начало

SQL HowTo: работаем с массивами (Advent of Code 2024, Day 23: LAN Party)

SQL HowTo: оконные функции (Advent of Code 2024, Day 22: Monkey Market)

Ближайшие события

SQL HowTo: оптимизируем рекурсию (Advent of Code 2024, Day 9: Disk Fragmenter)

SQL HowTo: генерация и подсчет уникальных комбинаций (Advent of Code 2024, Day 8: Resonant Collinearity)

Плагин для анализа планов PostgreSQL в Eclipse и DBeaver, и его разработка

Kubernetes в Тензоре

PostgreSQL Antipatterns: где скаляру в GiST место?

PostgreSQL Antipatterns: в этом плане кто-то лишний

Информация