Статьи / Профиль Sber / Хабр

Как стать автором

SberTeam @Sber

Пользователь

ПрофильСтатьи205ПостыНовости55Комментарии59

Sber 3 июл 2024 в 09:24

Почему «утекают» данные в больших языковых моделях. Часть 2

Сложный

5 мин

1.8K

Блог компании СберИнформационная безопасность*Машинное обучение*

Обзор

Добрый день, уважаемые читатели Хабра. Продолжаем разбираться в теме «утечки» конфиденциальных данных на примере больших языковых моделей и совершаемых для этого атак. В первой статье мы затронули такие механизмы атаки как Special Characters Attack (SCA), Leakage of Test Data in Training Data (LTDAT), Leakage in Prompt Atack (PLeak). Они несут угрозу для генеративных моделей. И мы показали, как можно маскировать данные для минимизации ущерба.

В этот раз мы затронем такую обширную проблему, как «отравление» обучающих данных (Data Poisoning) и возможность реализации «утечек». Уже известны многочисленные статьи, в которых разбирают атаки, когда входными данными являются изображения. Базовое объяснение существующим подходам даётся здесь и здесь, и говорится что они, как правило, служат бэкдорами и предназначены для повышения привилегий в системе.

Читать далее

+13

Sber 2 июл 2024 в 12:07

GigaConf: всё про искусственный интеллект

Простой

14 мин

2.2K

Блог компании СберБудущее здесьИскусственный интеллектКонференцииМашинное обучение*

Репортаж

На днях прошла наша конференция GigaConf, посвящённая ИИ в бизнесе. Мы подготовили сборник ознакомительных выступлений с трека открытия.

Читать далее

+17

Sber 28 июн 2024 в 16:06

Переезд на Spring Boot 3.0 c версии 2.0: какие сложности могут возникнуть

Средний

6 мин

11K

Блог компании СберСистемное администрирование*Веб-разработка*

Туториал

Привет, Хабр! Я Артем Киреев, ИТ‑инженер в СберТехе. Мы с командой занимаемся развитием продукта из состава Platform V Synapse — децентрализованной платформы для задач интеграции. Мы стремимся поддерживать актуальность стека, на котором разрабатываем наши продукты, и регулярно отслеживаем все изменения. Обратившись к таблице поддерживаемых версий на официальном сайте Spring, мы обнаружили, что версии Spring Boot ниже 3.0 больше не поддерживаются. Поэтому мы решили, что нужно перевести проект на последнюю из существующих версий. На момент написания статьи это Spring Boot 3.2.

В ходе миграции я столкнулся с рядом проблем, решение которых не всегда было очевидным. Цель этой статьи — помочь читателям быстрее и проще решить ошибки, с которыми столкнулся я сам.

Читать далее

+23

Sber 26 июн 2024 в 13:14

Тренируем клиентских менеджеров с помощью ИИ

Простой

6 мин

1.1K

Блог компании СберМашинное обучение*Учебный процесс в ITИскусственный интеллект

Кейс

Изображение сгенерировано Kandinsky по запросу: «Нейросеть гигачат учит клиентского менеджера сбербанка общаться по телефону. Зеленые цвета»

Развитие LLM вызывает все больше споров о том, увидим ли мы AGI в ближайшем будущем. Но пока одни рассуждают, мы применяем технологии. Мы в Сбере разработали тренажёр для клиентских менеджеров на основе GigaChat. Принцип его работы прост: когда менеджер общается с клиентом, разговор записывается и расшифровывается. Затем наш GigaChat анализирует этот диалог и предоставляет конкретные рекомендации для улучшения качества обслуживания.

Читать далее

+3

Sber 17 июн 2024 в 10:32

Почему «утекают» данные в больших языковых моделях. Часть 1

9 мин

3.1K

Блог компании СберМашинное обучение*Информационная безопасность*

Обзор

При разработке чат-ботов на основе больших языковых моделей (Large Language Model, LLM) всё чаще становится актуальной проблема «утечки» конфиденциальных данных. Причём она сопряжена со множеством значимых негативных последствий, как для клиентов, так и для бизнеса.

Читать далее

+20

Sber 11 июн 2024 в 12:35

Когда проснулся и узнал, что существуют PWA

Простой

8 мин

15K

Блог компании СберВеб-разработка*Разработка мобильных приложений*

Туториал

Всем привет. Меня зовут Антон, я фронтендер в Сбере. Если вы ещё не осваивали технологию PWA, но хотели бы — или вдруг срочно понадобилось, — то я вам помогу и объясню, что это и как начать с ней работать.

Читать далее

+32

Sber 6 июн 2024 в 10:10

Машинное обучение с Python и TensorFlow на Windows. Быстрый старт

Простой

6 мин

14K

Блог компании СберTensorFlow*Машинное обучение*Python*

Туториал

Словосочетание «машинное обучение» становится всё более значимым с каждым годом и проникает во все возможные сферы жизни, а с появлением в открытом доступе таких нейронных сетей как Chat GPT [1] интерес к машинному обучению стал высок как никогда. Но при этом многих отпугивает сложность создания своих систем на основе машинного обучения, потому что нужно одновременного использовать и настраивать много разных инструментов разработки.

Поэтому я хочу представить вашему вниманию максимально простую инструкцию для быстрого погружения в мир машинного обучения. Инструкция ориентирована в первую очередь на начинающих программистов, мы будем применять Python 3 [2] с библиотекой TensorFlow [3]. Это лучший выбор для начинающих из-за простоты языка и большого сообщества разработчиков, использующих TensorFlow.

Читать далее

+22

Sber 4 июн 2024 в 13:13

Как и зачем активно проверять работоспособность узлов при проксировании запросов с помощью Nginx

Средний

7 мин

4.8K

Блог компании СберDevOps*Серверное администрирование*Сетевые технологии*

Кейс

Привет, Хабр! В этом материале рассмотрим, как мы в SynGX реализовали активную проверку работоспособности узлов в группах балансировки, и как этот опыт может быть полезен при использовании прокси-серверов c аналогичной функциональностью.

Меня зовут Ринат Фатхуллин, я владелец продукта Platform V SynGX. В СберТехе мы с 2017 года развиваем собственную сборку Nginx для внутренних заказчиков, а в 2022 вышли на рынок под брендом Platform V SynGX.

Читать далее

+15

Sber 29 мая 2024 в 10:56

Белый стенд и никакого мерча: почему вместо раздатки для участников CodeFest мы купили компьютеры в Новосибирский лицей

Простой

2 мин

905

Блог компании СберКонференции

Репортаж

IT-конференции — один из самых эффективных инструментов для знакомства с комьюнити и поиска новых сотрудников в технологические команды Сбера. В подобных мероприятиях мы участвуем несколько десятков раз в год — и для каждого мероприятия стараемся продумать уникальный тематический стенд, мерч и темы выступлений — чтобы выделиться среди других компаний и удивить тех, кто заглядывает на конференции ежегодно.

Читать далее

+12

Sber 27 мая 2024 в 15:47

Практичные и не очень проекты на базе Raspberry Pi и не только: DIY-проекты весны 2024 года

4 мин

24K

Блог компании СберDIY или Сделай самРобототехникаRaspberry Pi*

«Малинка» — один из наиболее популярных одноплатников, который, собственно, и положил начало экспансии одноплатных ПК на рынок. На основе Raspberry Pi различных версий созданы десятки тысяч проектов, от just for fun до промышленных систем. Под катом расскажем про новые идеи, которые, возможно, кто‑то из читателей Хабра захочет повторить.

Читать далее

+22

Sber 23 мая 2024 в 15:11

Угрозы информационной безопасности производственного конвейера разработки ПО: выбираем меры нейтрализации

Средний

3 мин

1.2K

Блог компании СберИнформационная безопасность*

Кейс

Привет, Хабр! На связи Сергей Кубан, руководитель направления отдела защиты инфраструктуры производства ПО в СберТехе. Наша команда отвечает за то, чтобы поставляемое клиентам ПО и сервисы соответствовали требованиям кибербезопасности.

В предыдущей статье мы говорили о том, как моделировать угрозы информационной безопасности и как это помогает противодействовать угрозам атак на цепочки поставок ПО. Сегодня расскажу, как выбирать меры, которые помогут эти угрозы нейтрализовать.

Читать далее

+8

Sber 22 мая 2024 в 10:30

GigaCode и все-все-все. Сравниваем различные ИИ-ассистенты между собой

Сложный

19 мин

15K

Блог компании СберМашинное обучение*Алгоритмы*Программирование*

Кейс

Привет, Хабр! Мы представляем команду GigaCode. В декабре 2023 года наш продукт стал доступен широкой аудитории. До этого GigaCode использовался только внутри компании, и нас часто спрашивали о том, как GigaCode выглядит на фоне других ИИ-ассистентов, как вы сравниваете себя с остальными? Отвечая на эти вопросы, мы начали с простой задачи, которая оказалась не такой уж и простой и вылилась в увлекательное исследование со всем тем, что мы так любим: множеством измерений, математической статистикой и, конечно же, новыми горизонтами. Интересно? Добро пожаловать под кат.

Читать далее

+18

Sber 15 мая 2024 в 09:49

Как замерять и повышать производительность Java-кода: личный пример с JMH

Средний

7 мин

6.7K

Блог компании СберТестирование IT-систем*Java*

Туториал

Привет, Хабр! Большинство команд разработки так или иначе вовлечены в гонку за производительностью. Если понимать этот показатель как скорость работы системы, то вся деятельность по прокачке производительности — это, по сути, анализ метрик и поиск инструментов, которые эту скорость могут повысить.

Меня зовут Александр Певненко, я работаю в СберТехе, компании, которая разрабатывает ПО. Для большинства наших продуктов производительность — критичный фактор, поэтому анализ метрик и оптимизация кода — важная часть цикла разработки. Хочу поделиться личным опытом и мнением обо всём, что касается оптимизации и повышения скорости работы кода, а также нагрузочного тестирования как части этой работы. Тут представлены моя собственная практика использования набора библиотек JMH для нагрузочного тестирования и замеров производительности Java-кода. Всем, кому интересно, добро пожаловать под кат!

Читать далее

+18

Sber 14 мая 2024 в 09:22

5 библиотек и фреймворков Java, крайне полезных для разработчика

Простой

8 мин

13K

Блог компании СберПрограммирование*Java*

Мнение

Java-библиотеки и фреймворки незаменимы для разработчиков разного уровня. Они предоставляют готовые решения для таких часто встречающихся задач, как работа с коллекциями данных, обработка сетевых запросов, работа с базами данных, с графическим интерфейсом пользователя и многое другое. В сегодняшней подборке расскажем о тех из них, которые могут оказаться весьма полезными для вас. Сама статья рассчитана на разработчиков начинающего уровня. Если вы — профессионал, посоветуйте в комментариях тот инструмент, который используете сами.

Читать далее

+8

Sber 7 мая 2024 в 10:51

Проблема «галлюцинирования» в больших языковых моделях на примере чат-ботов

Средний

14 мин

2.9K

Блог компании СберИскусственный интеллектМашинное обучение*

Мнение

Добрый день, уважаемые читатели Хабр. По роду деятельности, я уже некоторое время занимаюсь вопросами NLP, в частности, генеративными большими языковыми моделями и, реализованными, на них чат-ботами. При этом, очень часто в их разработке возникает ряд проблем, с которыми приходится постоянно бороться. Одна из них — «галлюцинирование» моделей, то есть выдача неточной информации на поступающие запросы от пользователя, и, в целом, некорректное поведение модели при длительном ведении диалогов различной степени направленности, специфики, глубины рассуждений, оценки фактов и правдивости выдаваемых ответов.

Исходя из этого, я решил систематизировать все имеющиеся по этой теме сведения. Сразу оговорюсь, статья носит обзорный характер и я ставлю своей целью обобщение фактов, причин и признаков такого поведения. Поиск возможных вариантов, методик и подходов для решения данной проблемы будут рассмотрены в следующей статье. Здесь, не будет кода и строгих выкладок, лишь, наблюдения, аналитика, способы оценки, выявленные закономерности и оценка работы в общем.

В качестве результата исследования, предлагается описание общей ситуации с обнаруженными возможными проявлениями феномена «галлюцинирования». На целостность и завершенность обзора, при описании полученных вариаций и проявлений данного факта, не претендую. Это результаты моего поиска и анализа. Информация собиралась, буквально по крупицам, так как все сведения сильно разрознены, проявления их в «дикой природе» не всегда можно заметить и четко классифицировать, либо они начинают проявляться спустя большое количество тестов, диалогов, рассуждений, запросов, вариантов подачи подсказок и уточнений на поставленные запросы и исходных текстов. Кроме всего прочего, градация распределения этих аномалий по степени отслеживания, так же, сильно разнится. Есть те, которые проявляются весьма быстро, а есть крайне редкие, для которых нужен специфических, очень тонкий подход. Ниже я представлю данный перечень с подробными пояснениями, так что всех прошу под кат.

Читать далее

+22

Sber 6 мая 2024 в 13:09

Использование маппера UNROM при разработке игр для Dendy на языке Си

Средний

11 мин

4.8K

Блог компании СберСтарое железоИгры и игровые консоли

Туториал

Приветствую всех любителей программирования всяческих ретро-железок. Могу предположить, что у большинства из читателей этой статьи была в детстве Dendy (а может и сейчас есть) или другой клон Famicom (клонов NES в СНГ я не встречал). Сегодня предлагаю обсудить особенности разработки игр для приставок Dendy, NES и Famicom с маппером (mapper) UNROM. Те из вас, кто хоть немного углублялся в особенности архитектуры игр для 8-битных приставок, наверняка слышал про мапперы. Это электронная схема, которая находится на плате картриджа и расширяет возможности консоли, подключаясь напрямую к шинам процессора.

Мапперов для Dendy существует сотни, так как очень часто компании, разрабатывающие игры, делали уникальные мапперы под свои нужды. Поэтому сегодня они есть на любой вкус и цвет. Самые простые мапперы позволяют переключать банки памяти (это было обычным делом для всех компьютеров 1980-х), а самые продвинутые (например, MMC5) уже позволяли использовать дополнительные аппаратные прерывания, улучшенный звук, прокрутку по двум осям и т. д.

Читать далее

+53

Sber 3 мая 2024 в 09:28

Энтропия на страже безопасности: эволюция генераторов случайных чисел

Простой

7 мин

3.2K

Блог компании СберКомпьютерное железоИстория IT

Ретроспектива

Случайности не случайны, особенно когда они реализованы исключительно программными методами и подчиняются распознаваемому детерминизму. А тем временем мы нуждаемся в генерации настоящих, случайных чисел — от криптографии с защитой наших банковских данных, до компьютерных игр.

Может показаться что эта проблема была решена уже давно, но те же процессоры обзавелись модулями энтропии только в 2012-2014 годах. И на этом прогресс не останавливается: всё доступнее становятся квантовые генераторы энтропии, полностью лишённые изъяна детерминизма. Давайте посмотрим, как от ложного рандома мы пришли к недетерминированному.

Читать далее

+22

Sber 23 апр 2024 в 11:17

Обзор архитектуры Compose с использованием паттерна «координатор»

Средний

9 мин

8.2K

Блог компании СберИнтерфейсы*Jetpack Compose*Android*Разработка мобильных приложений*

Туториал

В этой статье рассмотрим, пример реализации архитектуры UI-слоя на Compose, которая основывается на Uni-directional data flow и state hoisting с использованием паттерна «координатор» для навигации. Вдохновением для меня послужила эта публикация, но я решил подробнее развернуть поднятую в ней тему архитектуры Compose и навигации.

Читать далее

+21

Sber 22 апр 2024 в 10:27

Что делать, чтобы эксплуатация не превратилась в бесконечное тушение пожаров

Средний

10 мин

4.5K

Блог компании СберСистемное администрирование*DevOps*

Кейс

Меня зовут Владимир Медин, я работаю в подразделении SberWorks, которое внедряет практики DevOps и MLOps. Хочу поделиться нашим опытом повышения надёжности enterprise-систем, вводимых в эксплуатацию, особенно впервые. Для кого-то эта статья будет в большей степени спасательным кругом, но с напутствием. Многие подходы к обеспечению надёжности у нас регламентированы, но есть и «неуставные» решения, которые вырабатываются только с опытом. Кому-то могут бы непонятны некоторые тонкости, диктуемые условиями крупной компании, поэтому по мере рассказа буду объяснять, почему это важно. Впрочем, на мой взгляд, эти правила применимы в работе компании любого размера, дорожащей стабильностью качества своих услуг.

Читать далее

+26

Sber 19 апр 2024 в 13:04

Просто ли открывается ларчик, Или как протестировать сразу более 10 сервисов

Средний

4 мин

1.9K

Блог компании СберТестирование IT-систем*Тестирование веб-сервисов*

Кейс

Привет, Хабр! Всем известно, что у тестировщиков в жизни много трудностей. И мы, команда QA Департамента общих прикладных сервисов (ДОПС) Сбера, знаем об этом не понаслышке, так как тестируем релизы сервисов Platform V — цифровой облачной платформы СберТеха (более 70 продуктов для быстрого создания и легкого масштабирования приложений любой сложности). Да‑да, именно на Platform V Сбер совершил свою цифровую трансформацию!

Релизы поставляют в банк из СберТеха. Всё бы ничего, пришли изменения — тестируй. Но основная сложность заключается в том, что у платформы десятки продуктов, из‑за чего работа усложняется в разы.

Читать далее

+12

4

5 6 ...