Статьи / Профиль Sber / Хабр

Все потоки

SberTeam@Sber

Пользователь

ПрофильСтатьи242ПостыНовости70Комментарии65

@Sber 14 окт в 12:12

Магия SDK: как облегчить жизнь разработчикам и ускорить интеграции

Простой

6 мин

5.1K

Блог компании СберУправление проектами * Управление разработкой *

Мнение

Представьте, что вы лидер молодого, но быстрорастущего стартапа в области ML. Вам предстоит собрать команду, и вы думаете о том, каких специалистов вам предстоит найти:

- Data Scientist — для создания прототипов моделей машинного обучения, подходящих по задачи вашего проекта;

- ML Engineer — для внедрения в эксплуатацию моделей и сценариев, масштабирования;

- Data Engineer — для создания ETL‑процессов, систематизации сбора и хранения данных;

- DevOps/MLOps — для автоматизации процессов и развития инфраструктуры;

- SRE — для обеспечения мониторинга и надёжности вашей инфраструктуры.

Организовать работу всех направлений с нуля будет задачей не из лёгких. Но как принять этот вызов, если вы не обладаете экспертизой во всех направлениях?

Читать далее

+6

@Sber 8 окт в 08:42

Сокращаем трудозатраты при выводе витрин на Hadoop

Средний

5 мин

4.6K

Блог компании СберDevOps * IT-инфраструктура * Hadoop *

Кейс

Привет, друзья! Я Олег Васильев, владелец продукта Dream DE. В этой статье расскажу, как мы научились быстро и эффективно выводить витрины на Hadoop в эксплуатацию, или как мы за один квартал вывели 26 инициатив в рабочую среду силами четырёх инженеров по данным.

Читать далее

+11

@Sber 3 окт в 14:11

Как мы улучшили персональный музыкальный поток с помощью контекстного многорукого бандита

9 мин

5.4K

Блог компании СберСоциальные сетиМашинное обучение *

Кейс

Музыкальные стриминговые сервисы давно перестали быть просто «цифровыми полками» с треками — они превратились в персонализированные медиаплатформы, на которых ключевую роль играют рекомендательные системы. От Spotify и Apple Music до Яндекс.Музыки, VK Музыки и Звука — все они стремятся не просто хранить музыку, а предугадывать, что пользователь захочет услышать прямо сейчас. Рекомендации покрывают большое количество различных сценариев: плейлисты дня, подборки новинок, экспериментальные плейлисты в смежных для пользователя жанрах и многое другое.

В этой статье мы хотим обсудить один из самых часто используемых и один из самых сложных с технической точки зрения сценариев: персональный поток треков (Персональная Волна).

Читать далее

+13

@Sber 23 сен в 13:58

Роль цифровых двойников в разработке и тестировании роботизированных систем

Простой

6 мин

6.5K

Блог компании СберРобототехникаИнженерные системы * Анализ и проектирование систем *

Обзор

Роботы становятся частью реальных процессов — от производства до медицины. Поэтому создание умных машин требует быстрой разработки, высокой надежности и цифрового контроля. В этом помогает ключевая технология — виртуальный двойник. Это не просто симуляция, а точная цифровая копия реальной роботизированной системы, которая обеспечивает связь между физическим и цифровым миром. Что такое цифровой двойник и чем он полезен для создания и тестирования роботов, расскажем в этой статье.

Читать далее

+12

@Sber 23 сен в 05:57

Топ-9 ИИ-плагинов для WordPress

Простой

7 мин

4.9K

Блог компании СберВеб-разработка * Искусственный интеллектМашинное обучение *

Обзор

Большинство современных ИИ-решений для WordPress работают по принципу облачной интеграции. Плагины подключаются к ИИ-сервисам через API, позволяя использовать технологии искусственного интеллекта прямо в панели управления WordPress.

Читать далее

+12

@Sber 17 сен в 15:24

Великие умы ИТ-мира. Тим Бернерс-Ли

Простой

6 мин

8.7K

Блог компании СберИстория ITСетевые технологии *

Мнение

В сложной истории инноваций, приходящих и исходящих из интернета, одно крупное достижение неоспоримо: в период с 1989 по 1991 год Тим Бернерс-Ли изобрел Всемирную паутину.

«Инновации — это счастливая случайность, поэтому вы не знаете что способны сделать люди». (Бернерс-Ли).

Читать далее

+15

@Sber 11 сен в 14:15

Как брали в долг в дореволюционной России

Простой

7 мин

8.9K

Блог компании СберНаучно-популярноеФинансы в IT

Обзор

Взаймы на Руси брали ещё до появления первых банков, и даже до образования единой денежной системы. Занимали зерно (пшеницу, рожь, овес, ячмень), сено на корм, лошадей, мёд, серебро. Такие займы могли быть даже беспроцентными, но чаще давались «в рост», то есть отдать нужно было больше. Практика кредитования разрасталась, и постепенно эти отношения стали регулироваться властями. Можно проследить, как менялись эти правила, превращаясь в систему кредитования царской России, которая действовала вплоть до 1917 года.

Читать далее

+22

@Sber 10 сен в 11:48

ИИ-рекрутеры: как нейросети работают с персоналом уже сейчас

Простой

7 мин

6.8K

Блог компании СберМашинное обучение * Искусственный интеллектУправление персоналом *

Мнение

HR проходит цифровую трансформацию. По данным Gartner, с июня 2023 года по январь 2024 года число HR-отделов, планирующих внедрить ИИ, увеличилось вдвое. А исследования «Юнион» и «Зарплата.ру» показали, что 75 % респондентов согласны на первичное собеседование с чат-ботом.

Это логично, ведь современный ИИ закрывает ряд HR-задач: от первичных собеседований до прогнозирования увольнений.

Читать далее

+16

@Sber 9 сен в 11:36

Куны, гривны и говяды. Какими раньше были деньги на Руси

Простой

6 мин

14K

Блог компании СберФинансы в ITНаучно-популярное

Обзор

История денег — предмет захватывающий. Можно проследить изменения экономического уклада стран, понять, с кем и как они торговали, и даже узнать по изображениям на монетах, как выглядели давно утраченные памятники культуры. Надписи на древних исчезнувших языках, портреты давно умерших правителей — деньги хранят массу информации.

А какими были деньги в Древней Руси, и чем расплачивались люди до возникновения государственной чеканки монет?

Читать далее

+22

@Sber 5 сен в 16:28

Машинное обучение в финтехе

Простой

5 мин

8.3K

Блог компании СберМашинное обучение * Искусственный интеллект

Мнение

Привет, Хабр! Машинное обучение в финансовой сфере — это полноценный инструмент, который уже меняет подходы к анализу данных, принятию решений и автоматизации процессов. Как именно эта технология работает, и какие конкретные задачи она решает? Поговорим об этом в этой статье.

Читать далее

+11

@Sber 3 сен в 14:00

Сказ о том, как «беспокойные» данные набеспокоили нам скор

Сложный

5 мин

6.1K

Блог компании СберМашинное обучение * Искусственный интеллект

Мнение

Привет, уважаемые Хаброжители ;-) Сегодня мы поговорим о данных, которые представляют собой весьма специфичный случай, а именно о «шумных» данных. Предлагаю вам поразмыслить на тему обратного инжиниринга применительно к таким данным и попытаться поставить всё с ног на голову. О чем речь: не так давно мы написали модель машинного обучения по предсказанию одного тренда и пытались улучшить ее предсказания, применяя различные модификации фильтра Калмана (Kalman Filter, EnKF, Kalman Filter + Numba (Just-in-Time), EnKF + Numba (Just-in-Time)). Другими словами, фильтровали обучающую и тестовую выборку в надежде поднять скор на модели, выделив более качественный сигнал. При этом получили, в целом, весьма хорошее решение. И тут мы начали размышлять: «Так, пааажди… Мы же просто учились всегда на отфильтрованных данных, почему ускорение кода даёт нам поднятие скора на модели, и более того, более качественную балансировку предсказания для наших классов?» Если вам интересно, что у нас получилось, то приглашаю под кат.

Читать далее

+13

@Sber 2 сен в 12:39

Генерация синтетических данных для LLM. Часть 4: теоремы

Сложный

7 мин

5.3K

Блог компании СберМашинное обучение * Алгоритмы *

Туториал

Добрый день, уважаемые хабражители! Как и прежде меня зовут Владимир Миронов, и я занимаюсь тестированием и оценкой синтетических данных ;) Добрались, наконец-то, до четвёртой части в этом цикле статей из (прошлые статьи можно увидеть тут, тут и тут). В этот раз разберём важный момент, связанный с анализом полученных матриц смежностей по нашим графам и представлением их свойств с позиции оптимизации и унификации. В общем, поговорим про алгоритмы, обсудим чисто технические моменты и подходы к унификации данных.

Всё идёт к тому, что интерпретируемое машинное обучение набирает всё больше оборотов, и необходима не только его визуализация, но и новые доказательные выкладки, и понимание границ формирования данных. Сформулирую несколько вопросов:

Читать далее

+15

@Sber 1 сен в 09:01

AI Native Science: наука в эпоху ИИ-трансформации

Простой

5 мин

4.6K

Блог компании СберМашинное обучение * Искусственный интеллект

Мнение

Искусственный интеллект меняет ландшафт научных открытий и значительно ускоряет исследования. Современные системы могут изучать литературу, строить гипотезы и генерировать экспертные статьи — для этого достаточно ввести пару промтов.

Привет, Хабр! Меня зовут Алексей Шпильман, я лидер центра «AI для науки» в Сбербанке. В этой статье я расскажу, как AI повлиял на научную среду, какие ИИ-решения сегодня актуальны и какое будущее ждет AI Native Science.

Читать далее

+13

@Sber 29 авг в 13:14

Интуиция или расчёт — стратегии успешных инвесторов

Простой

7 мин

6.2K

Блог компании СберРазвитие стартапаВенчурные инвестиции

Мнение

Инвестиции всегда считались занятием рискованным. На неудачных вложениях погорело немало людей, некоторые разорились. Что же нужно, чтобы этого не произошло? Играет ли роль интуиция, или все удачные инвестиции — результат лишь спокойного и трезвого анализа?

Как считают сами инвесторы? Признают ли они ценность интуитивного восприятия при решении инвестировать?

Читать далее

+14

@Sber 28 авг в 06:09

Записки с медицинской ИИ-фабрики

Простой

9 мин

5K

Блог компании СберМашинное обучение * Искусственный интеллектЗдоровье

Кейс

Мы обучаем медицине большую языковую модель GigaChat и создаём агентов для здравоохранения на её основе. Наша модель уже сдала множество экзаменов и даже устроилась на работу. Как и в других сферах ИИ, в медицине мы делаем то, что раньше было фантастикой, а теперь быстро входит в практику. Давайте я вам об этом расскажу.

Читать далее

+12

@Sber 27 авг в 10:13

Генерация синтетических данных для LLM. Часть 3: случайные матрицы

Средний

4 мин

4.1K

Блог компании СберМашинное обучение * Алгоритмы *

Мнение

Добрый день, уважаемые Хабровчане :) Продолжаем наши научные изыскания в области определения «синтетических» данных. В этой статье я рассмотрю тему анализа графов с позиции анализа спектров матрицы смежности для случайных матриц. То есть мы зайдём со стороны оптимизации знаний из прошлых двух статей (раз и два) и посмотрим, как применить теорию случайных матриц к нашей исходной задаче. Основная цель — расширение диапазона исследуемых значений.

Итак, погнали, значицо ;)

Читать далее

+12

@Sber 21 авг в 09:27

Почему компании выходят из облака?

8 мин

9.6K

Блог компании СберСистемное администрирование * Информационная безопасность * Облачные сервисы *

Мнение

Привет, Хабр! Почему некоторые компании возвращаются к локальной инфраструктуре, оставляя публичное облако в прошлом? Казалось бы, облачные технологии — это будущее, но растущая тенденция обратной миграции доказывает обратное.

В этой статье мы расскажем вам, что движет этим процессом и какие выгоды он может принести бизнесу.

В 2019 году аналитики Gartner посчитали, что случаи выхода из публичного облака были скорее исключением, чем массовой практикой. А вот в июле 2024 года AWS решили, что этот тренд усиливается, особенно среди компаний, которые хотят усилить контроль над данными, снизить расходы и повысить кибербезопасность. Решение о миграции часто зависит от характера рабочих нагрузок и индивидуальных потребностей бизнеса.

Давайте разберём самые распространённые причины отказа от публичных облаков.

Читать далее

+24

@Sber 15 авг в 09:32

Продвинутые техники RAG в действии

Средний

15 мин

9.2K

Блог компании СберМашинное обучение * Алгоритмы *

Кейс

Всем привет! Представьте таблицу с сотнями или даже тысячами атрибутов. Как в условиях высокой размерности найти релевантные данные по запросу на естественном языке? Классические методы часто не справляются, нужны новые подходы.

Именно за эту сложную задачу взялась команда Департамента управления данными (SberData) в рамках эффективной интеграции ИИ‑агентов в Корпоративную аналитическую платформу Сбера (КАП), которая объединяет современные инструменты для работы с данными: хранение, интеграция, аналитика, моделирование и контроль качества данных. Наличие таких технологий, как продвинутые LLM (например, GigaChat), и большие объёмы данных делают исследование подобных задач актуальным для рынка больших данных.

В статье мы сравним эффективность векторного поиска, гибридных методов и подхода Retrieval‑Augmented Generation (RAG), оценим их влияние на точность результатов и обсудим практические ограничения.

Читать далее

+17

@Sber 12 авг в 06:00

Вёрстка не поехала: как тестировать интерфейсы без боли

Простой

11 мин

6.2K

Блог компании СберДизайнИнтерфейсы *

Туториал

Привет, Хабр!

Мы — Алевтина Чугунова (владелец продукта дизайн‑системы) и Дарья Каткова (QA‑инженер). В этой статье расскажем, как создаём и тестируем дизайн‑систему, с какими проблемами сталкивались и какие инструменты разработали, чтобы упростить жизнь себе и командам.

Вы узнаете:

— Что такое дизайн‑система и зачем она нужна.

— Как тестировать интерфейсы без боли.

— Какие инструменты помогают автоматизировать проверки.

Читать далее

+10

@Sber 7 авг в 15:49

AI Labyrinth от Cloudflare: как генеративный ИИ стал оружием против ботов-скрейперов

Простой

6 мин

8.4K

Блог компании СберИнформационная безопасность * Искусственный интеллектМашинное обучение *

Обзор

С развитием генеративного ИИ боты-скрейперы стали умнее и настойчивее. Они обходят традиционные методы защиты и массово сканируют сайты, собирая данные для обучения своих моделей. Ежедневно в сети Cloudflare фиксируется более 50 миллиардов запросов от ИИ-краулеров — это почти 1% всего интернет-трафика.

Компания предложила новое решение проблемы — AI Labyrinth. Вместо прямого блокирования инструмент дезориентирует ботов, заставляя их тратить время и ресурсы на обработку бесполезного контента.

Читать далее

+15

1

2 3 ...