Articles / Profile of Sber / Habr

SberTeam @Sber

Пользователь

ProfileArticles240PostsNews64Comments65

Sber Jan 25 2023 at 09:59

Proxyless Service Mesh в gRPC Java-сервисах за 4 шага

9 min

4.9K

Сбер corporate blogJava * IT Infrastructure *

Привет, Хабр! На связи Максим Чудновский @chudnovskiyи Александр Козлов @ZDragonиз СберТеха. Мы занимаемся развитием Platform V Synapse — облачной платформы, которая объединяет множество интеграционных шаблонов, в том числе классический стиль интеграции request-response через Service Mesh.

В этой статье хотим поговорить о Service Mesh в gRPC Java-сервисах: чем полезен подход, как реализовать его c помощью протокола xDS и с какими сложностями можно столкнуться.

Читать далее

+7

Sber Dec 19 2022 at 11:47

Генератор эмбеддингов: как провести качественный анализ метрик сотрудников без прямого доступа к персональным данным

7 min

2.6K

Сбер corporate blogInformation Security * IT Infrastructure * Big Data *

Привет, Хабр! Меня зовут Роман, я работаю в Сбере в блоке HR исследователем данных. Мне и моим коллегам часто приходится иметь дело с персональными данными сотрудников (далее ПДн). А получить допуск к использованию этих данных в различных контурах банка очень непросто: в Сбере серьёзно относятся к безопасности ПДн. Ситуация усложняется тем, что для решения разных задач требуются разные наборы данных. Каждый раз запрашивать допуск — можно, но это долго. Поэтому для упрощения и ускорения работы с использованием ПДн мы решили разработать пайплайн, который анонимизирует данные сотрудников, позволяя проверять их влияние на разные метрики без доступа к чувствительной информации. Результатом работы этого механизма является эмбеддинг.

В статье я показываю особенности работы одной из частей утилиты «Генератор эмбеддингов» в конкретной задаче — поиск похожего сотрудника внутри компании. Подобная задача имеет массу прикладных направлений в бизнесе: поиск преемника, оперативный поиск сотрудника на место уволившегося, профилирование должностей и др. Без использования ПДн здесь, к сожалению, не обойтись. Так, например, для многих сотрудников важную роль играет удалённость офиса банка. И для того чтобы предложить оптимальный вариант работы, нужно учитывать место проживания человека, что уже является ПДн. «Генератор эмбеддингов» помогает оптимизировать этот процесс.

Узнать больше о нашем решении

+4

Sber Dec 16 2022 at 11:53

Особенность CI/CD-конвейеров для корпораций и новое решение от Сбера

7 min

4.6K

Сбер corporate blogDevOps * Programming *

Какие инструменты первыми приходят вам на ум при упоминании CI/CD pipeline? Вероятнее всего, это Gitlab CI/CD, Jenkins CI, Azure DevOps. На самом деле инструментов десятки, но так было не всегда. Ещё недавно в крупных компаниях главенствовал Windows Server, Power Shell был лучшим другом системного администратора, новые релизы доставлялись на прод в среднем раз в квартал. Сегодня поговорим о том, что изменилось.

Меня зовут Виталий Астраханцев, я занимаюсь развитием Platform V OrchestraR — программного продукта для автоматизации DevOps-конвейера. В этой статье расскажу о нашем решении и об особенностях конвейеров для крупных компаний в целом.

Читать далее

+7

Sber Dec 12 2022 at 14:29

Как Сбер стал игровые хакатоны проводить: удовольствие, нетворкинг и поиск новых специалистов

5 min

2.2K

Сбер corporate blogStudying in ITIT careerIT-companies

Привет, Хабр! Меня зовут Алия Мусаева, в Сбере я лид чаптера Production, ДИТ блока «Сервисы и безопасность». Сегодня расскажу о том, как инициатива, которая началась как пет-проект, переросла в официальный проект Сбера и вышла на общекорпоративный уровень. Думаю, что статья будет полезной для многих читателей — как тех, кто регулярно проводит мероприятия в своей компании, так и для тех, кто принимает участие в корпоративных хакатонах. Подробности — под катом.

Узнать, как мы проводим игровые хакатоны

+10

Sber Dec 9 2022 at 09:12

TDE в Platform V DataGrid: учим систему шифрования менять ключи на лету

8 min

1.5K

Сбер corporate blogDatabase Administration * Cryptography * Information Security *

Привет, Хабр! Это Никита Амельчев и Павел Переслегин. Мы создаём Platform V DataGrid — распределённую базу данных, которая используется в сервисах Сбера и внешних клиентов. В статье расскажем, как мы усилили базовые функции шифрования TDE в нашем продукте и как решали вопрос совмещения полного шифрования и высокой производительности базы данных.

Читать далее

+7

Sber Dec 5 2022 at 13:40

Как найти «слона» в песочнице на Hadoop: решаем проблему с ограничением объёма выделенной памяти

6 min

1.8K

Сбер corporate blogDatabase Administration * Hadoop * Big Data *

И снова здравствуй, Хабр! Сегодня поговорим об актуальной для многих из нас проблеме при работе с базами данных. В ходе работы над разными проектами часто приходится создавать базу данных (командное пространство, песочница и т.п.), которую использует как сам автор, так и/или коллеги для временного хранения данных. Как у любого «помещения», в нашей «песочнице» есть своё ограничение по объёму выделенного места для хранения данных. Периодически бывает так, что вы или ваши коллеги забываете об этом маленьком ограничении, из-за чего, к сожалению, заканчивается объём выделенной памяти.

В этом случае можно применить маленький лайфхак, который позволит оперативно просмотреть, какая таблица больше всего занимает место, кто её владелец, как долго она находится в общей песочнице и т.д. Используя его, вы оперативно сможете почистить место в песочнице, предварительно согласовав действия с владельцем данных без нанесения вреда данным остальных коллег. Кроме того, этот инструмент позволит периодически проводить мониторинг наполняемости вашей общей песочницы.

Читать далее

+7

Sber Dec 2 2022 at 11:03

Нейронная сеть для распознавания образов с TensorFlow: как с ней работать

7 min

22K

Сбер corporate blogMachine learning * Artificial IntelligencePython * Big Data *

Привет, Хабр! В сегодняшней статье хотим поделиться опытом, как можно начать использовать TensorFlow в целях распознавания образов. Напомним, что TensorFlow — открытая программная библиотека для машинного обучения, разработанная компанией Google для решения задач построения и тренировки нейронной сети с целью автоматического нахождения и классификации образов, достигающая качества человеческого восприятия.

Цель статьи — привлечь этот инструмент для распознавания боковых зубов (маляров) на рентгеновских снимках с использованием нейронной сети. Для того чтобы этого достичь, нужно выполнить несколько важных этапов, о чём и поговорим под катом.

Читать далее

+8

Sber Nov 29 2022 at 15:06

Platform V Works: как мы за год создали свой продукт для управления разработкой

6 min

7.2K

Сбер corporate blogProduct Management * Development Management * Programming * Open source *

Привет, Хабр! Меня зовут Ирина Львова, я ведущий эксперт по технологиям в СберТехе — компании, которая создаёт Platform V, цифровую платформу Сбера для разработки бизнес-приложений.

В первой части материала поговорим о подходах к разработке, сложностях и используемых технологиях. Во второй — о том, к чему мы пришли и какой функциональностью сегодня обладают наши инструменты.

Эта статья — продолжение цикла материалов о Platform V Works, семействе инструментов для agile-разработки. В предыдущей статье мой коллега Сергей Петровский рассказывал о другом компоненте бандла — инструменте генерации связанных синтетических тестовых данных для сквозных интеграционных тестов, вот его статья.

Узнать больше о Platform V Works

+11

Sber Nov 25 2022 at 13:37

Проецирование вершин графа в векторное пространство. Часть 1. Разложение матрицы смежности

6 min

6.7K

Сбер corporate blogProgramming * Mathematics * Algorithms *

Привет, Хабр! Меня зовут Илья Котов, я Data Scientist в Сбере, участник профессионального сообщества NTA. Эта статья — первая часть небольшого цикла, посвящённого алгоритмам вложения вершин графа в векторное пространство. Сегодня расскажу об алгоритмах, основанных на матричных факторизациях. В качестве примера в статье используется занимательная задача поиска сообществ в графе. Что же, приступим!

Читать далее

+12

Sber Oct 19 2022 at 08:55

AI Journey Contest 2022: вперёд — к мультимодальности

8 min

1.8K

Сбер corporate blogMachine learning *

Recovery Mode

Сфера AI не стоит на месте: продолжают появляться как новые задачи для применения алгоритмов, способных решать узкоспециализированные проблемы, так и новые архитектуры и подходы, призванные приблизить нас к созданию сильного искусственного интеллекта. Люди, интересующиеся AI и ML, тоже меняются: прокачивают свои навыки, изучают свежие фреймворки и методы, прорабатывают новые идеи — и ждут новых интересных вызовов и больших возможностей. По всем этим причинам мы тоже не можем остановиться — и вновь проводим AI Journey Contest! А это значит, что лучшие специалисты по искусственному интеллекту снова внесут свой вклад в развитие AI-технологий и поборются за призовой фонд, который в этом году составит более 5 млн рублей. Победители будут объявлены в ноябре, так что самое время зарегистрироваться на сайте AI Journey Contest и начать решать задачи.

Читать далее

+6

Sber Oct 5 2022 at 09:13

Переезжаем с Oracle и Microsoft SQL Server на Platform V Pangolin: опыт Сбера

8 min

21K

Сбер corporate blogDatabase Administration * PostgreSQL * Information Security * High performance *

Привет, Хабр! На связи Михаил Семенов, лидер дивизиона баз данных в СберТехе, Артем Лаптев, руководитель эксплуатации продукта Platform V Pangolin в SberInfra, и Вячеслав Гавришин, руководитель команды развития Platform V Pangolin в SberInfra.

В этом посте мы поделимся историей импортозамещения систем управления базами данных в Сбере и опытом миграции с MSSQL и Oracle на собственную СУБД Platform V Pangolin. Расскажем, как разрабатываем и кастомизируем отечественную СУБД уровня enterprise и какие решения помогли нам упростить процесс миграции и использовать продукт в микросервисной архитектуре банка.

Читать далее

+12

Sber Sep 30 2022 at 11:11

Platform V Incident Manager и обработка связанных инцидентов: упрощаем жизнь командам сопровождения

5 min

2.2K

Сбер corporate blogIT Standards * Service Desk * Product Management *

Recovery Mode

Привет, Хабр! Меня зовут Евгений Янес, я ведущий руководитель IT-направления в СберТехе — компании, которая строит Platform V, цифровую платформу Сбера для разработки бизнес-приложений.

В статье расскажу, как мы создали Platform V Incident Manager — продукт для автоматизации процесса обработки ошибок, а за счёт функции обработки связанных инцидентов оптимизировали работу сразу нескольких бизнес-процессов.

Читать далее

+4

Sber Sep 13 2022 at 12:08

Не так страшно собеседование, как его себе представляют: технические собесы и необычные кейсы в Сбере

8 min

37K

Сбер corporate blogInterviewIT careerPersonnel Management *

Привет, Хабр!

Поздравляем всех программистов с 256-м днём года! Под катом рассказываем, как проходят технические интервью в Сбере: реальные истории от наших IT-руководителей и ссылки на актуальные вакансии.

Встречаемся ниже!

Читать далее

+4

Sber Sep 9 2022 at 10:03

Краткая история тестирования ПО и реалии работы тестировщика в Сбере

7 min

9.8K

Сбер corporate blogHistory of ITMobile applications testing * Web services testing *

И снова здравствуйте! Сегодня у тестировщиков профессиональный праздник, с чем мы всех причастных и поздравляем! Ну и заодно предлагаем поговорить о тестировании программного обеспечения - о чем же еще? Для начала вспомним историю тестирования, её эволюцию и продвижение к современным концепциям. Если историю вы знаете, то первую часть можно пропустить. Во второй Никита Прокопенко, лидер команды автоматизации тестирования UI на устройствах SD, рассказывает о том, как проходят собеседования кандидатов на тестировщика ПО в Сбере. В любом случае, велкам под кат!

Читать далее

+6

Sber Aug 19 2022 at 13:22

Экспериментальные сложности в бизнесе: проверяем гипотезу без разбиения клиентов на группы

5 min

2.1K

Сбер corporate blogMachine learning * Product Management *

Привет, Хабр! Сегодня поговорим о проверке гипотез и сложностях, которые могут возникнуть в процессе работы. В Сбере постоянно проводятся эксперименты по улучшению пользовательского опыта и ключевых метрик бизнеса. Это может быть улучшение приложений или оптимизация работы сети отделений. И конечно, мы должны видеть, где был реальный эффект, а где нет. Так как экспериментов много, нужно оперативно понимать, что улучшает результат, а что нет. Также нельзя руководствоваться экспертным мнением, решения нужно принимать исключительно на основе исходных данных. Под разные задачи могут требоваться разные подходы. Например, когда речь идёт о приложении, можно использовать стандартный А/Б-подход: сформировать группы; эффект, который хотим получить; сформулировать гипотезу; рассчитать длительность эксперимента. А после подсчитать результаты правильным статистическим тестом или ускорить проведение эксперимента с помощью разных техник, например CUPED.

Но что, если мы хотим изменить дизайн отделений Сбера или создать новый формат, или даже закрыть какую-то часть отделений и понять, как это влияет на поведение клиента и ключевые метрики? В таком случае мы имеем дело с офлайн-точками и не можем просто взять и разбить пользователей на две группы. Придётся изменить методологию оценки эффекта и пользоваться другими методами, которые позволяют получить p-value и оценить итоговый эффект. Давайте посмотрим, как всё это реализовать.

Читать далее

+7

Sber Jul 26 2022 at 10:00

CDC и логическая репликация для баз данных, реализованных на стеке open source-решений

7 min

13K

Сбер corporate blogBig Data * Database Administration * Open source * High performance *

Привет, Хабр! На связи СберТех — мы создаём Platform V, цифровую платформу Сбера для разработки бизнес-приложений.

В платформу входит более 60 продуктов на базе собственных сборок open source, доработанных до уровня enterprise по функциональности, безопасности, производительности и отказоустойчивости.

В этой статье расскажем про реализацию паттерна Change Data Capture и межкластерной репликации данных в продукте Platform V DataGrid, распределённой in-memory базе данных для высокопроизводительных вычислений. А также об особенностях внедрения функции и вариантах репликации. Написать материал помог наш коллега Николай Ижиков из команды по развитию баз данных на стеке open source.

Читать далее

+9

Sber Jul 22 2022 at 12:17

Опыт доработки PostgreSQL: как мы добавили TDE в Platform V Pangolin

12 min

16K

Сбер corporate blogDatabase Administration * High performance * Information Security * PostgreSQL *

Привет, Хабр! Меня зовут Владимир Харчиков, я развиваю и сопровождаю Platform V Pangolin в СберТехе. Pangolin ― реляционная СУБД, созданная нами для хранения и обработки данных в высоконагруженных приложениях.

В статье я расскажу, как объединить высокую скорость обработки транзакций и безопасность хранения данных, а именно о реализации функции прозрачного шифрования данных внутри нашей СУБД. Кому эта тема интересна ― прошу под кат.

Читать далее

+22

Sber Jul 20 2022 at 09:51

Linux, Unix, безопасность: open source-проект FreeIPA как Enterprise-решение

9 min

31K

Сбер corporate blogDevelopment for Linux * Open source * Information Security * High performance *

Привет, Хабр! Меня зовут Александр Копылов. Я руководитель направления, участник профсообщества Сбера DWH/BigData.

Сегодня предлагаю обсудить интересное решение из сферы инфобеза для высоконагруженных проектов. Огромное их количество, помимо технических возможностей и разнообразных фич, требует правильного подхода к безопасности. Одно из оптимальных решений ― FreeIPA, о нём и поговорим под катом.

Читать далее

+8

Sber Jul 6 2022 at 10:24

Как руководить IT-специалистами, даже если они лучше вас разбираются в своей работе

7 min

21K

Сбер corporate blogPersonnel Management * Development Management *

Привет, Хабр!

Из заголовка вы уже поняли, о чём сегодня пойдёт речь. Поэтому сразу к делу.

Возьмём для примера ситуацию. Есть команда data-аналитики: инженеры, аналитики, разработчики, каждый из которых уже собаку съел в своём деле и связал свитер из собственной бороды. Есть вновь назначенный руководитель этой команды. Он знает азы в каждой зоне (сбор данных, аналитика, разработка), но не глубоко погружён в детали и нюансы, особенно если пришёл из смежной сферы.

Как в такой ситуации не сломать уже построенную систему? И одновременно принести дополнительную ценность для компании и подчинённых? Разбираемся под катом.

Читать далее

+12

Sber Jul 4 2022 at 10:03

Управляем параметрами в процессной аналитике при помощи фреймворка Hydra

7 min

3.6K

Сбер corporate blogPython * System Analysis and Design * Data Mining * Project management *

Привет, Хабр! Меня зовут Александр Дунаевский, я Data Scientist в Сбере. Сегодня хочу рассказать про управление параметрами в Process mining (процессная аналитика) и нюансах этой задачи.

Для работы используется фреймворк Hydra, который здорово облегчает жизнь. В чём вообще проблема? В задачах процессной аналитики требуется постоянно менять входные параметры и сохранять результаты работы. Но при большом количестве запусков возникает потребность в отдельной системе для управления как передаваемыми параметрами, так и логированием. В статье рассмотрим, как фреймворк Hydra может помочь нам с этим. Кому интересно ― просим под кат!

Читать далее

+9

1 2 ...

10