Сбер, Москва - Технологии, меняющие мир / Статьи / Хабр

Как стать автором

Профиль Статьи 610Новости 58Вакансии 71Подписчики 117K

truthcome 15 часов назад

Как сделать инструмент для запуска нагрузки одной кнопкой: показываем наш Pangoloader

8 мин

660

Блог компании СберТестирование IT-систем*Python*PostgreSQL*

Кейс

Привет, Хабр! Меня зовут Дмитрий Королёв, я инженер по нагрузочному тестированию Platform V Pangolin — целевой СУБД в Сбере и не только. Эту статью я написал вместе с моим коллегой Алексеем Хорохориным @AlexeyHorohorin. Наш продукт — специальная сборка PostgreSQL с доработками (крупных больше 30, а всего уже больше 70) в области безопасности, производительности, отказоустойчивости.

Условия для нас таковы: мы тестируем продукт целиком, в разных версиях, на разных ядрах. У нас работает три версии в параллель для восьми разных ОС, и тестировать нам нужно при использовании и неиспользовании разных фич. А теперь представьте, сколько тут интеграций…

Автоматизировать нагрузку помогают разные инструменты. Но в них нам не хватало автоматизации прогона нагрузочных сценариев и составления итогового отчёта по завершении тестов. Поэтому мы сделали и развиваем свой нагрузчик — Pangoloader. В этой статье расскажем, как он устроен, что умеет и как мы собираемся доработать его в будущем.

Читать далее

+11

Sber 27 сен в 12:05

Оптимизируем системные ресурсы при развёртывании за счёт перехода на динамику

Средний

10 мин

900

Блог компании СберСистемное администрирование*DevOps*Виртуализация*

Туториал

Всем привет! Если в компании растёт количество продуктов, а для их развёртывания используются виртуальные машины, то рано или поздно возникает задача оптимизации ресурсов. Скажем, вы используете для оркестрации Jenkins. Количество агентов на ВМ при этом статично, а количество развёртываний в разное время разное. В этом случае при массовых установках агенты периодически упираются в установленный лимит исполнителей (executor), а в свободные часы ВМ простаивают, занимая ресурсы.

Мы, команда Run4Change в СберТехе, сопровождаем тестовые среды. В наши задачи входит в том числе развёртывание продуктов облачной платформы Platform V на стендах для последующего тестирования. Расскажем, как мы решили проблему использования системных ресурсов и отказались от виртуальных машин в пользу cloud‑native‑решения. Статья может быть полезна тем, кто планирует начать использование динамических агентов Jenkins, и может использоваться как первоначальное руководство.

Читать далее

+12

AmigoRRR 26 сен в 10:06

Научно-исследовательский кружок по ИИ в робототехнике для студентов и взрослых

Простой

5 мин

2.2K

Блог компании СберПрограммирование*Машинное обучение*РобототехникаИскусственный интеллект

Обзор

Мы открываем кружок, в котором вы можете заниматься современной робототехникой и искусственным интеллектом на самом передовом уровне и задачах. В статье поговорим о том, как это будет и о текущих результатах в обучении роботов хождению.

Посмотреть на то как роботы учаться ходить

+27

Pelmen421 25 сен в 14:00

Как мы доработали postgres_exporter для мониторинга событий в БД

Средний

12 мин

3.1K

Блог компании СберOpen source*PostgreSQL*Администрирование баз данных*

Кейс

Привет, Хабр! Меня зовут Станислав Епишин, я DBA в дивизионе поддержки решений в тестовых средах в СберТехе. Эту статью я написал вместе с Дмитрием Корневым, тимлидом и DBA. У Сбера есть целевая СУБД, которую разработали в СберТехе на основе open source версии PostgreSQL, — Platform V Pangolin. Наша команда перешла на Pangolin в числе первых, когда у продукта еще не было инструментов для мониторинга БД. Забегая вперед, позже появились такие решения — графическая консоль Platform V Kintsugi, расширение для сбора статистики — Performance Insights и система мониторинга IT‑инфраструктуры Platform V Monitor. А поначалу мы решили мониторить базы данных связкой Grafana, Prometheus и postgres_exporter. Но, во‑первых, столкнулись, с тем, что нам не хватает гибкости в использовании queries.yaml в postgres exporter. А, во‑вторых, так мы не могли регистрировать события с таймаутом меньше 15 секунд. Поэтому мы тогда сделали свой инструмент для мониторинга — pangolin_exporter.

Надеюсь, что эта статья будет полезна тем, кто мониторит инфраструктуру с помощью postgres_exporter и хочет кастомизировать все под свои нужды. Покажу детали и код решения.

Читать далее

+21

Sber 24 сен в 10:12

Шифруй то, шифруй это, или LLM под замком

Средний

8 мин

3.1K

Блог компании СберИнформационная безопасность*Машинное обучение*

Обзор

Здравствуйте, уважаемые читатели Хабра. Чем больше я погружаюсь в LLM, тем больше укрепляюсь во мнении, что сейчас они (LLM) заняли если не самое важное, то уж точно одно из очень значимых мест во всём пантеоне моделей машинного обучения. При этом всё чаще встаёт вопрос шифрования моделей в самом широком смысле. Речь не столько о механизмах, алгоритмах, подходах и методиках шифрования того, что запрашивает пользователь, сколько о работе с данными в целом, в том числе и для обучения моделей. То есть о шифровании как на входе, так и на выходе — данных от пользователя, от модели и обучающих данных.

Мы поговорим о безопасном обращении с коммерческим контентом, шифровании данных, моделях и подходах к безопасному обращению и встраиванию коммерческих данных в модель. Будет интересно ;)

Почему это важно? Сегодня работает четвёртое поколение GPT‑систем, ждём пятое. Есть много аналогов «четвёрки» (Megatron‑LLM, LLaMA, Claude, PaLM, Mistral, BLOOM, Grok, Megatron‑Turing NLG, Chinchilla, OPT, GODEL, Jurrassic-2), которые по ряду параметров намного превосходят GPT-4. Однако для качественной «эволюции» систем необходимо «скармливать» им «правильный» эксплуатационный код, апробированный и полностью покрытый тестами, который создаётся крупными корпорациями, средним и малым бизнесом. Но есть нюанс: такой код просто так никто не отдаст. Более того, он защищён авторскими правами и имеет ряд наложенных юридических условий использования.

Читать далее

+14

Sber 23 сен в 15:12

Цифровые двойники: от истока к будущему

Простой

9 мин

2K

Блог компании СберАнализ и проектирование систем*Искусственный интеллектМашинное обучение*

Мнение

Не так давно термин «цифровой двойник» был передовой, меняющей парадигму, но лишь концепцией, которая обещала произвести революцию в отраслях, предоставив динамическое цифровое зеркало физических систем. Сегодня эта инновация вышла далеко за рамки своей первоначальной предпосылки. Она созрела и превратилась в тонкую экосистему.

Читать далее

+12

Sber 18 сен в 15:23

Демократизация DevOps

Средний

7 мин

5K

Блог компании СберСистемное администрирование*DevOps*Искусственный интеллект

Мнение

На нашей недавней конференции GigaConf мы много рефлексировали о том, как будет развиваться направление DevOps. Оно немыслимо без инструментов. Поэтому я расскажу о том, как мы внедряем в Сбере практики GitAIOps, какие совершили ошибки и извлекли уроки, какие сделали выводы по поводу внедрения ИИ. Сегодня на всех углах рассказывают, как ИИ поможет разработчикам, но мало кто говорит о его помощи DevOps-инженерам. Надо это исправить.

Меня зовут Юрий Спорынин, в ИТ я более 20 лет. Начинал с разработки, своими руками создавал процессинговую систему для интернет-эквайринга. В 2016 году я перешёл в Сбер, где мы в 2018 году внедрили платформу в «Сбербанк Онлайн». Сейчас среди моих задач — кластер DevOps-инструментов, о которых мы отчасти сегодня поговорим.

Читать далее

+13

Sber 16 сен в 14:55

Jenkins — от монолита к распределению

Средний

8 мин

5.6K

Блог компании СберСистемное администрирование*DevOps*

Кейс

Привет, я Дмитрий Коляндра, разработчик в подразделении SberWorks, занимающемся автоматизацией и сопровождением инструментов производственного процесса. Эта история о том, что происходит в крупных компаниях, где развёрнуто много десятков экземпляров Jenkins.

Читать далее

+21

Sber 12 сен в 10:47

IT с человеческим лицом: портрет типичного программиста-2024

Простой

7 мин

7.4K

Блог компании СберИсследования и прогнозы в IT*Программирование*

Интервью

Всем привет! Не так давно мы с GitVerse, платформой для работы с исходным кодом от СберТеха, проводили опрос, чтобы выяснить, как сегодня выглядит типичный программист. Не в смысле внешности, а в плане своих личных и профессиональных качеств. Опрос прошли почти 2,5 тысячи человек. Мы очень рады, что наша затея оказалась такой популярной. Теперь настало время поделиться результатами. Кто он такой — Типичный Программист-2024? Заходите под кат, чтобы узнать о нём всё.

Читать далее

+21

12 сен в 10:01

IT с человеческим лицом: портрет типичного программиста — 2024

7 мин

17K

Блог компании СберПрограммирование*Научно-популярноеЛайфхаки для гиков

Всем привет! Не так давно Хабр и GitVerse, платформа для работы с исходным кодом от СберТеха, проводили опрос, чтобы выяснить, как сегодня выглядит типичный программист. Не в смысле внешности, а в плане своих личных и профессиональных качеств. Опрос прошли почти 2,5 тысячи человек. Мы очень рады, что наша затея оказалась такой популярной. Теперь настало время поделиться результатами. Кто он такой — типичный программист 2024 года? Заходите под кат, чтобы узнать о нём всё.

Узнать всё

+32

Sber 11 сен в 15:30

Будущее DevOps-инженера

Простой

7 мин

14K

Блог компании СберМашинное обучение*Карьера в IT-индустрииDevOps*

Мнение

В последние годы произошло много разных событий, и мы, как большая организация, прочувствовали всё на себе. Пришлось очень быстро решать всевозможные проблемы. Хочу поделиться нашим опытом и сделанными выводами, которые кому-то покажутся спорными, кому-то — неуместными, а кому-то — очень важными.

Читать далее

+15

Sber 6 сен в 13:16

Удивительная история развития сортировки в JDK

Средний

11 мин

5.8K

Блог компании СберJava*Алгоритмы*

Ретроспектива

Как вы считаете, если выполнить java.util.Arrays.sort(), то какая сортировка будет вызвана? Quicksort? Timsort? И та, и другая, потому что для объектов вызывается Timsort, а для примитивов (чисел int, long, float и так далее) — Dual-Pivot Quicksort. В JDK 6 для объектов использовался стандартный Merge sort, а для чисел классическая реализация Quicksort с одним опорным элементом, предложенная Джоном Бентли и Дугласом МакИлрой. В JDK 7 оба алгоритма поменялись: теперь объекты сортируются с помощью Timsort, автор Тим Петерс, а для простых типов данных используется Dual-Pivot Quicksort, предложенный мною вместе с Джоном Бентли и Джошем Блоком в 2009 году. Эта сортировка используется более 15 лет не только в JDK, но и в Android (хотя и немного устаревшая версия).

А зачем нам вообще второй алгоритм сортировки, если есть Timsort? Почему не использовать один и для объектов, и для примитивов? Сегодня я, как автор, расскажу историю Dual-Pivot Quicksort: как он начинался, как развивался и как продолжает развиваться сейчас.

Читать далее

+35

Hanamime 5 сен в 14:40

Как наука о данных трансформирует здравоохранение

Простой

6 мин

1.4K

Блог компании СберМашинное обучение*Data Mining*Здоровье

Мнение

Наука о данных трансформирует медицинский сектор, подвергая фундаментальным изменениям основы мониторинга и профилактики заболеваний, диагностики и лечения. В этой статье рассматривается роль Data Science в медицинской сфере, её основные применения, преимущества, проблемы, а также будущие тенденции.

Читать далее

+16

Hanamime 4 сен в 13:23

Искусственный интеллект = машинное обучение?

Простой

8 мин

2.8K

Блог компании СберМашинное обучение*Искусственный интеллект

Мнение

Когда речь заходит о машинном обучении и искусственном интеллекте, возникает некоторая путаница относительно того, что означают эти два понятия и каковы различия между ними. Одно ли это и то же или есть разница?

Читать далее

+17

Sber 3 сен в 14:35

Обучение с учителем и без — в чём разница?

Простой

7 мин

3.3K

Блог компании СберМашинное обучение*

Туториал

Обучение с учителем и без являются двумя основными подходами к построению моделей машинного обучения (МО). В них заложен существенно разный подход к обучению, а также разные сценарии использования. В этой статье объясняются эти оба метода и различия между ними.

Читать далее

+17

Sber 2 сен в 15:52

Топ 10 ИИ-фреймворков, или Сказ о том, как AMD проиграла рынок NVIDIA

Простой

8 мин

3.7K

Блог компании СберОбработка изображений*Машинное обучение*Искусственный интеллект

В индустрии машинного обучения происходит небывалый беспрецедентный бум, и главный двигатель этого праздника технологий, генерирующего сверхприбыли для больших компаний, — графические процессоры (GPU). В битве за долю рынка ИИ-ускорителей можно выделить двух титанов индустрии GPU — NVIDIA и AMD. Несмотря на то, что во всех остальных сферах, кроме ИИ, AMD периодически подаёт надежду на превосходство над NVIDIA, во всём, что касается машинного обучения, NVIDIA обладает почти что абсолютной властью над рынком. Эта компания, благодаря своей дальновидной стратегии, сумела не только завоевать доверие разработчиков, но и фактически создать экосистему, ставшую стандартом де-факто в области глубокого обучения. AMD же, несмотря на свой богатый опыт в производстве высокопроизводительных процессоров, оказалась на периферии этого стремительно растущего рынка.

Читать далее

+21

Hanamime 31 авг в 12:04

Что нас ждёт в будущем: от компьютеров размером с атом до создания аватаров

Простой

8 мин

1.7K

Блог компании СберБудущее здесьЧитальный зал

Мнение

В своей книге «Файлы будущего: краткая история следующих 50 лет» футуролог Ричард Уотсон рассуждает, как происходящее прямо сейчас влияет на то, что ждёт нас в ближайшие полвека. Почему важно долгосрочное планирование, если мы собираемся жить в «хорошем» мире. В этой статье предлагаем обсудить возможности «предпочтительного» будущего — оно обещает быть интересным!

Читать далее

+9

nkozlova 30 авг в 14:36

Отличается ли внимание человека и модели-трансформера?

Средний

11 мин

2.4K

Блог компании СберБлог компании SberDevicesМашинное обучение*Искусственный интеллект

Кейс

Для того, чтобы понимать язык и делать различные выводы, человек рассуждает, опираясь на знания о мире и здравый смысл. Несмотря на то, что большие языковые модели достигли значительных успехов в обработке естественного языка, рассуждение на основе здравого смысла остаëтся одним из самых сложных навыков.

Наиболее распространëнным способом оценки способностей моделей рассуждать, опираясь на здравый смысл, является тест на основе схемы Винограда (The Winograd Schema Challenge, или WSC), названный в честь Терри Винограда, профессора компьютерных наук в Стэнфордском университете. Тест основан на разрешении синтаксической неоднозначности.

Давайте рассмотрим пример из схемы Винограда:

"Кубок не помещается в коричневый чемодан, потому что он слишком большой."

Что в этом случае является слишком большим: чемодан или кубок? Для человека ответ является очевидным, а для модели?..

Мы расскажем про наше исследование, в котором сравнили внимание человека и модели, а также проанализировали, на какие слова при решении схемы Винограда обращают внимание человек и модель. Хотя внимание человека и внимание трансформера кажутся совершенно разными, отдельные результаты говорят о взаимосвязи между ними.

Читать далее

+20

Sber 29 авг в 19:11

Непрерывность бизнеса и аварийное восстановление: в чём разница

Простой

8 мин

2.2K

Блог компании СберИнформационная безопасность*Системное администрирование*DevOps*

Туториал

В этой статье мы разберёмся, в чём разница между непрерывностью бизнеса и аварийным восстановлением (восстановлением после сбоя) — двумя обязательными стратегиями для любой компании, желающей избежать длительного простоя. Как объединение обеих практик повышает устойчивость к потенциально опасным для бизнеса угрозам?

Читать далее

+15

fifthh0rseman 28 авг в 18:47

Ваши git и там и тут передают: как синхронизировать репозитории на мастере и репликах

Простой

5 мин

1.6K

Блог компании СберПрограммирование*Git*

Одна из важных задач при разработке отказоустойчивой распределенной системы — синхронизация данных на мастер‑узле со слейв‑узлом. В дальнейшем будем звать слейв‑узлы репликами. Методов синхронизации множество, и иногда более эффективным оказывается тот, который учитывает специфику хранимых данных.

Я Роман Соловьев, ведущий ИТ‑инженер в отделе RnD и готовых решений Управления развития продукта в СберТехе. Сегодня расскажу о том, как мы синхронизируем Git‑репозитории на двух узлах, какие существуют альтернативы и зачем это вообще нужно.

Читать далее

+11

1

2 3 ...