Тензор, Ярославль - Разработчик системы Saby / Статьи / Хабр

ПрофильСтатьи236Посты6Подписчики34KСотрудники204

Kilor 19 авг 2021 в 08:35

КЛАДРируем адреса произвольной формы (ч.1 — импорт)

25 мин

8.4K

Блог компании ТензорСистемное администрирование*PostgreSQL*SQL*ERP-системы*

Туториал

Достаточно часто при работе с вводимыми пользователем адресными данными возникает необходимость сначала подсказать ему, как правильно свой адрес указать, а потом - полученную строку адреса привести в некоторый машинно-читаемый вид.

Таким видом у нас в стране можно считать код по справочникам КЛАДР или ФИАС.

Первый из них уже несколько лет считается устаревающим, но отличается более простой структурой и исторически продолжает использоваться во множестве систем, поскольку вполне подходит для большинства задач.

Давайте научимся разбирать строку адреса "туда и обратно", а заодно познакомимся с некоторыми алгоритмическими подходами и их реализацией на SQL.

tensor_sbis 27 окт 2020 в 11:27

Плюшки с изюминкой: как мы используем митапы, преподавание и творчество для мотивации разработчиков

3 мин

4.4K

Блог компании ТензорУправление персоналом*Карьера в IT-индустрии

Программисты привыкли, что у айтишников крутые офисы, хорошие зарплаты и полный соцпакет. Это стало стандартом. Мы в Тензоре не останавливаемся на этом, и чтобы разрабы не заскучали, а новые к нам хотели, применяем и необычные методы мотивации. Какие — расскажут сами программисты.

imschur 14 июл 2020 в 09:09

Unreal Features of Real Types, или Будьте осторожны с REAL

4 мин

2.3K

Блог компании ТензорPostgreSQL*SQL*Базы данных*

После публикации статьи об особенностях типизации в PostgreSQL, первый же комментарий был про сложности работы с вещественными числами. Я решил бегло пробежаться по коду доступных мне SQL-запросов, чтобы посмотреть, насколько часто в них используется тип REAL. Достаточно часто используется, как оказалось, и не всегда разработчики понимают опасности, стоящие за ним. И это несмотря на то, что в Интернете и на Хабре достаточно много хороших статей про особенности хранения вещественных чисел в машинной памяти и о работе с ними. Поэтому в этой статье я постараюсь применить такие особенности к PostgreSQL, и попробую «на пальцах» рассмотреть связанные с ними неприятности, чтобы разработчикам SQL-запросов было легче избежать их.

Документация PostgreSQL содержит лаконичную фразу: «Управление подобными ошибками и их распространение в процессе вычислений является предметом изучения целого раздела математики и компьютерной науки, и здесь не рассматривается» (при этом благоразумно отсылая читателя к стандарту IEEE 754). Что за ошибки здесь имеются в виду? Давайте обсудим их по-порядку, и скоро станет понятно, почему я снова взялся за перо.

Читать дальше →

Kilor 10 июн 2020 в 10:10

Классифицируем ошибки из PostgreSQL-логов

9 мин

5.4K

Блог компании ТензорPostgreSQL*SQL*Базы данных*Регулярные выражения*

Посвящается всем любителям анализировать логи.

В логах работающих систем рано или поздно появляются тексты каких-то ошибок. Чем таких систем больше в обозримом пространстве, тем больше вероятность ошибку увидеть. Серверы PostgreSQL, которые находятся под нашим мониторингом ежедневно генерируют от 300K до, в неудачный день, 12M записей об ошибках.

И такие ошибки — это не какой-то там «о, ужас!», а вполне нормальное поведение сложных алгоритмов с высокой степенью конкурентности вроде тех, о которых я рассказывал в статье про расчет себестоимости в СБИС — все эти deadlock, could not obtain lock on row in relation …, canceling statement due to lock timeout как следствие выставленных разработчиком statement/lock timeout.

Но есть ведь и другие виды ошибок — например, you don't own a lock of type ..., которая возникает при неправильном использовании рекомендательных блокировок и может очень быстро «закопать» ваш сервер, или, мало ли, кто-то периодически пытается «подобрать ключик» к нему, вызывая возникновение password authentication failed for user …

^{[источник КДПВ]}

Собственно, это все нас подводит к мысли, что если мы не хотим потом хвататься за голову, то возникающие в логах PostgreSQL ошибки недостаточно просто «считать поштучно» — их надо аккуратно классифицировать. Но для этого нам придется решить нетривиальную задачу индексированного поиска регулярного выражения, наиболее подходящего для строки.

Читать дальше →

GrimRanger 20 апр 2020 в 16:18

Программисты-сантехники, или история об одной утечке и сложностях борьбы с ней

5 мин

3.5K

Блог компании ТензорPython*Облачные сервисы*

Шел вторник, 25 февраля. Непростой выпуск версии в субботу, 22 февраля, был уже в прошлом. Казалось, что все худшее позади, и ничто не предвещало беды. Но все изменилось в один момент, когда от мониторинга пришла ошибка об утечке памяти на процессе-координаторе сервиса контроля доступа.

Вот откуда? Последние серьезные изменения в кодовой базе координатора были в предыдущей версии более двух месяцев назад, и после этого с памятью не происходило ничего примечательного. Но, к сожалению, графики мониторинга были непреклонны – память координатора явно стала куда-то утекать, на полу сервиса красовалась большая лужа, а значит, сантехнической бригаде предстояла серьезная работа.

Читать дальше →

tensor_sbis 25 янв 2018 в 15:41

Вся боль p2p разработки

9 мин

23K

Блог компании ТензорАлгоритмы*Информационная безопасность*Программирование*Сетевые технологии*

Добрый день, хабрасообщество! Сегодня я хотел бы рассказать о волшебном и чудесном проекте компании Тензор — удаленном помощнике. Это система удаленного доступа, связывающая миллионы клиентов и операторов в рамках общей клиентской базы СБИС. Удаленный помощник уже сейчас тесно интегрирован с online.sbis.ru. Каждый день мы регистрируем более десяти тысяч подключений и десятки часов сессионного времени в сутки.В этой статье мы расскажем о том, как мы устанавливаем p2p соединения, и что делать, если этого сделать не удается.

Читать дальше →

tensor_sbis 24 апр 2017 в 10:45

Приглашаем на VeloCPPed Meetup в Тензор

1 мин

Блог компании ТензорC++*Графические оболочки*Разработка мобильных приложений*

27 апреля 2017 года в 19.00 приглашаем разработчиков C++ на VeloCPPed Meetup в главный офис компании «Тензор» в Ярославле на ул. Угличской 36/44

Поговорим о промышленной разработке крупных приложений на С++ — поделимся опытом управления огромной кодовой базой (2 млн. SLOC) и процессом ее создания. Разберемся, как ускорить и удешевить разработку продукта.

Программа Meetup

Читать дальше →

Beluxur 11 апр в 14:46

Как мы сделали сервис знакомств для сотрудников

Простой

3 мин

2.4K

Блог компании ТензорПрограммирование*Управление персоналом*Python*IT-компании

Кейс

Привет! Меня зовут Сергей. Я ведущий backend-разработчик Тензора.

В статье расскажу, как мы с hr-командой ~~забрали хлеб у~~ «~~Давай поженимся~~» активизировали неформальное общение в компании и реализовали сервис для знакомств.

Kilor 23 дек 2024 в 15:25

SQL HowTo: «чистые» регулярки (Advent of Code 2024, Day 3: Mull It Over)

Простой

4 мин

1.2K

Блог компании ТензорPostgreSQL*SQL*Алгоритмы*Занимательные задачки

Кейс

В этой челлендж-серии статей попробуем использовать PostgreSQL как среду для решения задач Advent of Code 2024.

Возможно, SQL не самый подходящий для этого язык, зато мы рассмотрим его различные возможности, о которых вы могли и не подозревать.

В этой части будет очень простой код, с чуть-чуть сложным регулярным выражением.

Kilor 23 дек 2024 в 14:45

SQL HowTo: логические агрегаты (Advent of Code 2024, Day 2: Red-Nosed Reports)

Простой

5 мин

1.8K

Блог компании ТензорЗанимательные задачкиАлгоритмы*SQL*PostgreSQL*

Кейс

В этой челлендж-серии статей попробуем использовать PostgreSQL как среду для решения задач Advent of Code 2024.

В этой части с решением нам помогут логические агрегаты bool_and/bool_or.

veirdas 17 июл 2024 в 12:50

Feature management в Тензоре

Средний

5 мин

914

Блог компании Тензор

Привет, Хабр!

Меня зовут Данил Садриев, и я работаю руководителем одного из платформенных направлений в Тензоре. Наш продукт — Управление Облаком, аналог административных консолей AWS или Azure, предназначен для сотрудников компании. Управление Облаком предоставляет большое число сервисов: от запуска контейнера до паркинга доменов. А также: хранит логи и статистику, управляет резервным копированием, в общем, все, что нужно для полноценной разработки продукта. В этой статье я расскажу о сервисе управления функционалами. Возможно, это пригодится тем, кто готовится к секции интервью по system design, а также будет интересно начинающим product owner»ам, и архитекторам в части метода организации работы с данными.

noblemanum 26 сен 2023 в 15:47

Универсальные датасорсы в iOS-разработке

Средний

8 мин

4.3K

Блог компании ТензорiOS*Swift*Разработка мобильных приложений*

Из песочницы

В мире iOS-разработки, коллекции – это основной инструмент для представления данных в упорядоченной форме, таких как списки, таблицы, галереи фотографий или медиа-файлов. Они широко используются в различных сервисах, от социальных сетей до медицинских приложений. Однако, для создания эффективных и высокопроизводительных систем, необходимо иметь гибкое и масштабируемое решение для управления данными в коллекциях. Именно здесь на сцену выходят универсальные датасорсы.

Универсальные датасорсы предоставляют разработчикам API для доступа к данным в коллекциях без привязки к конкретному источнику и типу данных. Они обеспечивают абстракцию, которая дает разработчикам возможность работать с данными в коллекциях независимо от их происхождения или формата хранения. Это позволяет легко изменять источник данных, добавлять новые функции и поддерживать разные типы данных в приложении.

В данной статье рассмотрим различные подходы к регистрации и конфигурации ячеек в коллекции, пример реализации универсального датасорса, преимущества, особенности и недостатки данного подхода в разработке.

Gmaedarina 18 июл 2023 в 19:06

Share extension как общий компонент

Средний

7 мин

2.8K

Блог компании ТензорiOS*Разработка мобильных приложений*

Кейс

Из песочницы

Всем привет от мобильной платформы компании "Тензор"! Меня зовут Галина и в этой статье я хочу поделиться историей развития нашего Share Extension и рассказать о том, как он превратился в отдельный модуль, конфигурируемый за счёт подключенных внешних зависимостей.

Не смотря на то, что на просторах интернета легко можно найти сотни гайдов по созданию Share Extension, вам нужно понимать, что большинство из этих инструкций актуальны только для самых простых и тривиальных задач. Создание чего-либо более сложного, наполненного нелинейной бизнес логикой, принесет вам массу интересных часов дебаггинга и поиска ответов в интернете. Надеюсь, что данная статья станет одним из таких ответов или вдохновит кого-нибудь на переработку существующей реализации :)

leak_hunter 23 ноя 2022 в 16:43

Как найти утекшие объекты в дампах памяти Chrome DevTools

5 мин

Блог компании ТензорТестирование IT-систем*JavaScript*Клиентская оптимизация*

Утечки памяти в WEB приложениях могут сильно подпортить представление пользователей о ваших продуктах. О том, как тестировать на утечки памяти есть много туториалов. Однако, мало диагностировать наличие утечки - надо ее суметь отладить и исправить. В своей статье мы поделимся алгоритмом, как в нашей компании мы автоматизированно проводим первоначальную отладку утечек памяти и находим ключевые объекты, которые помогают нам в дальнейшем упростить отладку и исправление ошибки.

Kilor 25 ноя 2021 в 08:30

PostgreSQL в «Тензоре» — публикации за год (#2)

4 мин

3.1K

Блог компании ТензорБазы данных*SQL*PostgreSQL*Высоконагруженные системы*

Добро пожаловать под кат, если вдруг вы пропустили какие-то из наших статей за прошедший год об интересных и полезных возможностях PostgreSQL, которые мы узнаем при разработке нашей системы полного цикла управления бизнесом СБИС — от кадрового учета, бухгалтерии, делопроизводства и налоговой отчетности, до таск-менеджмента, корпоративного портала и видеокоммуникаций.

Если не видели дайджест за первый год — время наверстать упущенное!

Kilor 8 сен 2021 в 17:00

SQL HowTo: три WHERE в одном запросе

3 мин

10K

Блог компании ТензорБазы данных*SQL*PostgreSQL*Ненормальное программирование*

При реализации некоторых прикладных задач в рамках экосистемы СБИС случается сталкиваться с неочевидными возможностями PostgreSQL, которые позволяют вместо сложной логики создать решение "в один ход".

Сегодня на примере вполне реальной задачи рассмотрим такие возможности оператора INSERT ... ON CONFLICT.

Kilor 17 дек 2020 в 23:50

SQL HowTo: префиксный FTS-поиск с релевантностью по дате

4 мин

3.8K

Блог компании ТензорАлгоритмы*SQL*PostgreSQL*ERP-системы*

В нашем СБИС, как и в любой другой системе работы с документами, по мере накопления данных у пользователей возникает желание их "поискать".

Но, поскольку люди — не компьютеры, то и ищут они примерно как "что-то там такое было от Иванова или от Ивановского… нет, не то, раньше, еще раньше… вот оно!"

То есть технически верное решение — это префиксный полнотекстовый поиск с ранжированием результатов по дате.

Но разработчику это грозит жуткими проблемами — ведь для FTS-поиска в PostgreSQL используются «пространственные» типы индексов GIN и GiST, которые не предусматривают «подсовывания» дополнительных данных, кроме текстового вектора.

Остается только грустно вычитывать все записи по совпадению префикса (тысячи их!) и сортировать или, наоборот, идти по индексу даты и фильтровать все встречающиеся записи на совпадение префикса, пока не найдем подходящие (как скоро найдется «абракадабра»?..).

И то, и другое не особо приятно для производительности запроса. Или что-то все же можно придумать для быстрого поиска?

Читать дальше →

Kilor 28 июл 2020 в 08:50

SQL HowTo: красивые отчеты по «дырявым» данным — GROUPING SETS

8 мин

3.4K

Блог компании ТензорСистемное администрирование*Базы данных*SQL*PostgreSQL*

Для пользователя наш СБИС представляется единой системой управления бизнесом, но внутри состоит из множества взаимодействующих сервисов. И чем их становится больше — тем выше вероятность возникновения каких-то неприятностей, которые необходимо вовремя отлавливать, исследовать и пресекать.

Поэтому, когда на каком-то из тысяч подконтрольных серверов случается аномальное потребление ресурсов (CPU, памяти, диска, сети, ...), возникает потребность разобраться «кто виноват, и что делать».

Для оперативного мониторинга использования ресурсов Linux-сервера «в моменте» существует утилита pidstat. То есть если пики нагрузки периодичны — их можно «высидеть» прямо в консоли. Но мы-то хотим эти данные анализировать постфактум, пытаясь найти процесс, создавший максимальную нагрузку на ресурсы.

То есть хочется иметь возможность смотреть по ранее собранным данным разные красивые отчеты с группировкой и детализацией на интервале типа таких:

В этой статье рассмотрим, как все это можно экономично расположить в БД, и как максимально эффективно собрать по этим данным отчет с помощью оконных функций и GROUPING SETS.

Читать дальше →

Kilor 31 янв 2020 в 12:56

SQL HowTo: пишем while-цикл прямо в запросе, или «Элементарная трехходовка»

5 мин

39K

Блог компании ТензорPostgreSQL*SQL*Базы данных*Алгоритмы*

Периодически возникает задача поиска связанных данных по набору ключей, пока не наберем нужное суммарное количество записей.

Наиболее «жизненный» пример — вывести 20 самых старых задач, числящихся на списке сотрудников (например, в рамках одного подразделения). Для различных управленческих «дашбордов» с краткими выжимками по участкам работы похожая тема требуется достаточно часто.

В статье рассмотрим реализацию на PostgreSQL «наивного» варианта решения такой задачи, «поумнее» и совсем сложный алгоритм «цикла» на SQL с условием выхода от найденных данных, который может быть полезен как для общего развития, так и для применения в других похожих случаях.

Читать дальше →

Kilor 27 янв 2020 в 17:33

PostgreSQL Antipatterns: ударим словарем по тяжелому JOIN

6 мин

23K

Блог компании ТензорАлгоритмы*Базы данных*SQL*PostgreSQL*

Продолжаем серию статей, посвященных исследованию малоизвестных способов улучшения производительности «вроде бы простых» запросов на PostgreSQL:

Не подумайте, что я так сильно не люблю JOIN… :)

Но зачастую без него запрос получается ощутимо производительнее, чем с ним. Поэтому сегодня попробуем вообще избавиться от ресурсоемкого JOIN — с помощью словаря.

Читать дальше →

1 2 ...

9 10

КЛАДРируем адреса произвольной формы (ч.1 — импорт)

Плюшки с изюминкой: как мы используем митапы, преподавание и творчество для мотивации разработчиков

Unreal Features of Real Types, или Будьте осторожны с REAL

Классифицируем ошибки из PostgreSQL-логов

Программисты-сантехники, или история об одной утечке и сложностях борьбы с ней

Вся боль p2p разработки

Приглашаем на VeloCPPed Meetup в Тензор

Программа Meetup

Как мы сделали сервис знакомств для сотрудников

SQL HowTo: «чистые» регулярки (Advent of Code 2024, Day 3: Mull It Over)

SQL HowTo: логические агрегаты (Advent of Code 2024, Day 2: Red-Nosed Reports)

Feature management в Тензоре

Универсальные датасорсы в iOS-разработке

Share extension как общий компонент

Как найти утекшие объекты в дампах памяти Chrome DevTools

Ближайшие события

PostgreSQL в «Тензоре» — публикации за год (#2)

SQL HowTo: три WHERE в одном запросе

SQL HowTo: префиксный FTS-поиск с релевантностью по дате

SQL HowTo: красивые отчеты по «дырявым» данным — GROUPING SETS

SQL HowTo: пишем while-цикл прямо в запросе, или «Элементарная трехходовка»

PostgreSQL Antipatterns: ударим словарем по тяжелому JOIN

Информация