All streams
Search
Write a publication
Pull to refresh
38
118.5
SberTeam @Sber

Пользователь

Send message

Proxyless Service Mesh в gRPC Java-сервисах за 4 шага

Reading time9 min
Views4.9K

Привет, Хабр! На связи Максим Чудновский @chudnovskiyи Александр Козлов @ZDragonиз СберТеха. Мы занимаемся развитием Platform V Synapse — облачной платформы, которая объединяет множество интеграционных шаблонов, в том числе классический стиль интеграции request-response через Service Mesh.

В этой статье хотим поговорить о Service Mesh в gRPC Java-сервисах: чем полезен подход, как реализовать его c помощью протокола xDS и с какими сложностями можно столкнуться.

Читать далее

Генератор эмбеддингов: как провести качественный анализ метрик сотрудников без прямого доступа к персональным данным

Reading time7 min
Views2.6K

Привет, Хабр! Меня зовут Роман, я работаю в Сбере в блоке HR исследователем данных. Мне и моим коллегам часто приходится иметь дело с персональными данными сотрудников (далее ПДн). А получить допуск к использованию этих данных в различных контурах банка очень непросто: в Сбере серьёзно относятся к безопасности ПДн. Ситуация усложняется тем, что для решения разных задач требуются разные наборы данных. Каждый раз запрашивать допуск — можно, но это долго. Поэтому для упрощения и ускорения работы с использованием ПДн мы решили разработать пайплайн, который анонимизирует данные сотрудников, позволяя проверять их влияние на разные метрики без доступа к чувствительной информации. Результатом работы этого механизма является эмбеддинг.

В статье я показываю особенности работы одной из частей утилиты «Генератор эмбеддингов» в конкретной задаче — поиск похожего сотрудника внутри компании. Подобная задача имеет массу прикладных направлений в бизнесе: поиск преемника, оперативный поиск сотрудника на место уволившегося, профилирование должностей и др. Без использования ПДн здесь, к сожалению, не обойтись. Так, например, для многих сотрудников важную роль играет удалённость офиса банка. И для того чтобы предложить оптимальный вариант работы, нужно учитывать место проживания человека, что уже является ПДн. «Генератор эмбеддингов» помогает оптимизировать этот процесс.

Узнать больше о нашем решении

Особенность CI/CD-конвейеров для корпораций и новое решение от Сбера

Reading time7 min
Views4.6K

Какие инструменты первыми приходят вам на ум при упоминании CI/CD pipeline? Вероятнее всего, это Gitlab CI/CD, Jenkins CI, Azure DevOps. На самом деле инструментов десятки, но так было не всегда. Ещё недавно в крупных компаниях главенствовал Windows Server, Power Shell был лучшим другом системного администратора, новые релизы доставлялись на прод в среднем раз в квартал. Сегодня поговорим о том, что изменилось.

Меня зовут Виталий Астраханцев, я занимаюсь развитием Platform V OrchestraR — программного продукта для автоматизации DevOps-конвейера. В этой статье расскажу о нашем решении и об особенностях конвейеров для крупных компаний в целом.

Читать далее

Как Сбер стал игровые хакатоны проводить: удовольствие, нетворкинг и поиск новых специалистов

Reading time5 min
Views2.2K

Привет, Хабр! Меня зовут Алия Мусаева, в Сбере я лид чаптера Production, ДИТ блока «Сервисы и безопасность». Сегодня расскажу о том, как инициатива, которая началась как пет-проект, переросла в официальный проект Сбера и вышла на общекорпоративный уровень. Думаю, что статья будет полезной для многих читателей — как тех, кто регулярно проводит мероприятия в своей компании, так и для тех, кто принимает участие в корпоративных хакатонах. Подробности — под катом.

Узнать, как мы проводим игровые хакатоны

TDE в Platform V DataGrid: учим систему шифрования менять ключи на лету

Reading time8 min
Views1.5K

Привет, Хабр! Это Никита Амельчев и Павел Переслегин. Мы создаём Platform V DataGrid — распределённую базу данных, которая используется в сервисах Сбера и внешних клиентов. В статье расскажем, как мы усилили базовые функции шифрования TDE в нашем продукте и как решали вопрос совмещения полного шифрования и высокой производительности базы данных.

Читать далее

Как найти «слона» в песочнице на Hadoop: решаем проблему с ограничением объёма выделенной памяти

Reading time6 min
Views1.8K

И снова здравствуй, Хабр! Сегодня поговорим об актуальной для многих из нас проблеме при работе с базами данных. В ходе работы над разными проектами часто приходится создавать базу данных  (командное пространство, песочница и т.п.), которую использует как сам автор, так и/или коллеги для временного хранения данных. Как у любого «помещения», в нашей «песочнице» есть своё ограничение по объёму выделенного места для хранения данных.  Периодически бывает так, что вы или ваши коллеги забываете об этом маленьком ограничении, из-за чего, к сожалению, заканчивается объём выделенной памяти.

В этом случае можно применить маленький лайфхак, который позволит оперативно просмотреть, какая таблица больше всего занимает место, кто её владелец, как долго она находится в общей песочнице и т.д. Используя его, вы оперативно сможете почистить место в песочнице, предварительно согласовав действия с владельцем данных без нанесения вреда данным остальных коллег. Кроме того, этот инструмент позволит периодически проводить мониторинг наполняемости вашей общей песочницы.

Читать далее

Нейронная сеть для распознавания образов с TensorFlow: как с ней работать

Reading time7 min
Views22K

Привет, Хабр! В сегодняшней статье хотим поделиться опытом, как можно начать использовать TensorFlow в целях распознавания образов. Напомним, что TensorFlow — открытая программная библиотека для машинного обучения, разработанная компанией Google для решения задач построения и тренировки нейронной сети с целью автоматического нахождения и классификации образов, достигающая качества человеческого восприятия.

Цель статьи — привлечь этот инструмент для распознавания боковых зубов (маляров) на рентгеновских снимках с использованием нейронной сети. Для того чтобы этого достичь, нужно выполнить несколько важных этапов, о чём и поговорим под катом.

Читать далее

Platform V Works: как мы за год создали свой продукт для управления разработкой

Reading time6 min
Views7.2K

Привет, Хабр! Меня зовут Ирина Львова, я ведущий эксперт по технологиям в СберТехе — компании, которая создаёт Platform V, цифровую платформу Сбера для разработки бизнес-приложений.

В первой части материала поговорим о подходах к разработке, сложностях и используемых технологиях. Во второй — о том, к чему мы пришли и какой функциональностью сегодня обладают наши инструменты. 

Эта статья — продолжение цикла материалов о Platform V Works, семействе инструментов для agile-разработки. В предыдущей статье мой коллега Сергей Петровский рассказывал о другом компоненте бандла — инструменте генерации связанных синтетических тестовых данных для сквозных интеграционных тестов, вот его статья.

Узнать больше о Platform V Works

Проецирование вершин графа в векторное пространство. Часть 1. Разложение матрицы смежности

Reading time6 min
Views6.7K

Привет, Хабр! Меня зовут Илья Котов, я Data Scientist в Сбере, участник профессионального сообщества NTA. Эта статья — первая часть небольшого цикла, посвящённого алгоритмам вложения вершин графа в векторное пространство. Сегодня расскажу об алгоритмах, основанных на матричных факторизациях. В качестве примера в статье используется занимательная задача поиска сообществ в графе. Что же, приступим!

Читать далее

AI Journey Contest 2022: вперёд — к мультимодальности

Reading time8 min
Views1.8K

Сфера AI не стоит на месте: продолжают появляться как новые задачи для применения алгоритмов, способных решать узкоспециализированные проблемы, так и новые архитектуры и подходы, призванные приблизить нас к созданию сильного искусственного интеллекта. Люди, интересующиеся AI и ML, тоже меняются: прокачивают свои навыки, изучают свежие фреймворки и методы, прорабатывают новые идеи — и ждут новых интересных вызовов и больших возможностей. По всем этим причинам мы тоже не можем остановиться — и вновь проводим AI Journey Contest! А это значит, что лучшие специалисты по искусственному интеллекту снова внесут свой вклад в развитие AI-технологий и поборются за призовой фонд, который в этом году составит более 5 млн рублей. Победители будут объявлены в ноябре, так что самое время зарегистрироваться на сайте AI Journey Contest и начать решать задачи.

Читать далее

Переезжаем с Oracle и Microsoft SQL Server на Platform V Pangolin: опыт Сбера

Reading time8 min
Views21K

Привет, Хабр! На связи Михаил Семенов, лидер дивизиона баз данных в СберТехе, Артем Лаптев, руководитель эксплуатации продукта Platform V Pangolin в SberInfra, и Вячеслав Гавришин, руководитель команды развития Platform V Pangolin в SberInfra. 

В этом посте мы поделимся историей импортозамещения систем управления базами данных в Сбере и опытом миграции с MSSQL и Oracle на собственную СУБД Platform V Pangolin. Расскажем, как разрабатываем и кастомизируем отечественную СУБД уровня enterprise и какие решения помогли нам упростить процесс миграции и использовать продукт в микросервисной архитектуре банка.

Читать далее

Platform V Incident Manager и обработка связанных инцидентов: упрощаем жизнь командам сопровождения

Reading time5 min
Views2.2K

Привет, Хабр! Меня зовут Евгений Янес, я ведущий руководитель IT-направления в СберТехе — компании, которая строит Platform V, цифровую платформу Сбера для разработки бизнес-приложений.

В статье расскажу, как мы создали Platform V Incident Manager — продукт для автоматизации процесса обработки ошибок, а за счёт функции обработки связанных инцидентов оптимизировали работу сразу нескольких бизнес-процессов.

Читать далее

Не так страшно собеседование, как его себе представляют: технические собесы и необычные кейсы в Сбере

Reading time8 min
Views37K

Привет, Хабр!

Поздравляем всех программистов с 256-м днём года! Под катом рассказываем, как проходят технические интервью в Сбере: реальные истории от наших IT-руководителей и ссылки на актуальные вакансии.

Встречаемся ниже!

Читать далее

Краткая история тестирования ПО и реалии работы тестировщика в Сбере

Reading time7 min
Views9.8K

И снова здравствуйте! Сегодня у тестировщиков профессиональный праздник, с чем мы всех причастных и поздравляем! Ну и заодно предлагаем поговорить о тестировании программного обеспечения - о чем же еще? Для начала вспомним историю тестирования, её эволюцию и продвижение к современным концепциям. Если историю вы знаете, то первую часть можно пропустить. Во второй Никита Прокопенко, лидер команды автоматизации тестирования UI на устройствах SD, рассказывает о том, как проходят собеседования кандидатов на тестировщика ПО в Сбере. В любом случае, велкам под кат!

Читать далее

Экспериментальные сложности в бизнесе: проверяем гипотезу без разбиения клиентов на группы

Reading time5 min
Views2.1K

Привет, Хабр! Сегодня поговорим о проверке гипотез и сложностях, которые могут возникнуть в процессе работы. В Сбере постоянно проводятся эксперименты по улучшению пользовательского опыта и ключевых метрик бизнеса. Это может быть улучшение приложений или оптимизация работы сети отделений. И конечно, мы должны видеть, где был реальный эффект, а где нет. Так как экспериментов много, нужно оперативно понимать, что улучшает результат, а что нет. Также нельзя руководствоваться экспертным мнением, решения нужно принимать исключительно на основе исходных данных. Под разные задачи могут требоваться разные подходы. Например, когда речь идёт о приложении, можно использовать стандартный А/Б-подход: сформировать группы; эффект, который хотим получить; сформулировать гипотезу; рассчитать длительность эксперимента. А после подсчитать результаты правильным статистическим тестом или ускорить проведение эксперимента с помощью разных техник, например CUPED.

Но что, если мы хотим изменить дизайн отделений Сбера или создать новый формат, или даже закрыть какую-то часть отделений и понять, как это влияет на поведение клиента и ключевые метрики? В таком случае мы имеем дело с офлайн-точками и не можем просто взять и разбить пользователей на две группы. Придётся изменить методологию оценки эффекта и пользоваться другими методами, которые позволяют получить p-value и оценить итоговый эффект. Давайте посмотрим, как всё это реализовать.

Читать далее

CDC и логическая репликация для баз данных, реализованных на стеке open source-решений

Reading time7 min
Views13K

Привет, Хабр! На связи СберТех — мы создаём Platform V, цифровую платформу Сбера для разработки бизнес-приложений.

В платформу входит более 60 продуктов на базе собственных сборок open source, доработанных до уровня enterprise по функциональности, безопасности, производительности и отказоустойчивости.

В этой статье расскажем про реализацию паттерна Change Data Capture и межкластерной репликации данных в продукте Platform V DataGrid, распределённой in-memory базе данных для высокопроизводительных вычислений. А также об особенностях внедрения функции и вариантах репликации. Написать материал помог наш коллега Николай Ижиков из команды по развитию баз данных на стеке open source.

Читать далее

Опыт доработки PostgreSQL: как мы добавили TDE в Platform V Pangolin

Reading time12 min
Views16K

Привет, Хабр! Меня зовут Владимир Харчиков, я развиваю и сопровождаю Platform V Pangolin в СберТехе. Pangolin ― реляционная СУБД, созданная нами для хранения и обработки данных в высоконагруженных приложениях.

В статье я расскажу, как объединить высокую скорость обработки транзакций и безопасность хранения данных, а именно о реализации функции прозрачного шифрования данных внутри нашей СУБД. Кому эта тема интересна ― прошу под кат.

Читать далее

Linux, Unix, безопасность: open source-проект FreeIPA как Enterprise-решение

Reading time9 min
Views31K

Привет, Хабр! Меня зовут Александр Копылов. Я руководитель направления, участник профсообщества Сбера DWH/BigData.

Сегодня предлагаю обсудить интересное решение из сферы инфобеза для высоконагруженных проектов. Огромное их количество, помимо технических возможностей и разнообразных фич, требует правильного подхода к безопасности. Одно из оптимальных решений ― FreeIPA, о нём и поговорим под катом.

Читать далее

Как руководить IT-специалистами, даже если они лучше вас разбираются в своей работе

Reading time7 min
Views21K

Привет, Хабр!

Из заголовка вы уже поняли, о чём сегодня пойдёт речь. Поэтому сразу к делу. 

Возьмём для примера ситуацию. Есть команда data-аналитики: инженеры, аналитики, разработчики, каждый из которых уже собаку съел в своём деле и связал свитер из собственной бороды. Есть вновь назначенный руководитель этой команды. Он знает азы в каждой зоне (сбор данных, аналитика, разработка), но не глубоко погружён в детали и нюансы, особенно если пришёл из смежной сферы. 

Как в такой ситуации не сломать уже построенную систему? И одновременно принести дополнительную ценность для компании и подчинённых? Разбираемся под катом.

Читать далее

Управляем параметрами в процессной аналитике при помощи фреймворка Hydra

Reading time7 min
Views3.6K

Привет, Хабр! Меня зовут Александр Дунаевский, я Data Scientist в Сбере. Сегодня хочу рассказать про управление параметрами в Process mining (процессная аналитика) и нюансах этой задачи.

Для работы используется фреймворк Hydra, который здорово облегчает жизнь. В чём вообще проблема? В задачах процессной аналитики требуется постоянно менять входные параметры и сохранять результаты работы. Но при большом количестве запусков возникает потребность в отдельной системе для управления как передаваемыми параметрами, так и логированием. В статье рассмотрим, как фреймворк Hydra может помочь нам с этим. Кому интересно ― просим под кат!

Читать далее

Information

Rating
59-th
Works in
Registered
Activity