Pull to refresh
29
169.3
SberTeam @Sber

Пользователь

Send message

Использование машинного обучения для оптимизации логистических процессов

Level of difficultyMedium
Reading time6 min
Views786

Привет! Сегодня в логистике мы сталкиваемся с множеством вызовов, требующих новых подходов. Глобализация, большие объёмы данных, изменчивость потребительских настроений и стремление к экономии делают традиционные способы управления недостаточно эффективными. Поэтому машинное обучение оказывается как никогда кстати и становится важным инструментом для оптимизации логистических процессов.

Традиционная организация цепочек поставок часто сталкивается с проблемами. Например, прогнозирование и планирование могут быть некорректными из-за отсутствия своевременных и точных данных. Для координации участников цепочек поставок требуются значительные, но не всегда оправданные ресурсы. Непредсказуемые обстоятельства, такие как погодные условия или колебания спроса, тоже могут приводить к сбоям. Работа вручную также повышает вероятность ошибок (человеческий фактор, куда ж без него) и снижает общую эффективность.

Читать далее

Почему растёт спрос на гиперконвергентные системы

Level of difficultyMedium
Reading time6 min
Views1.3K

Спрос на локальное оборудование для центров обработки данных снижается по мере того, как организации переносят рабочие нагрузки в облако. Но локальные решения не исчезли, и одним из востребованных сегментов является гиперконвергентная инфраструктура (HCI).

Читать далее

На пути к эмоциональному искусственному интеллекту

Level of difficultyMedium
Reading time7 min
Views1.5K

Привет, Хабр. Меня зовут Андрей Савченко, я научный директор Sber AI Lab. Когда речь заходит про эмоциональность и принятие решений у ИИ, нужно задать себе вопрос: «А как это устроено у людей?» Наверняка почти каждый из вас ответил бы, что он принимает решение рационально, а остальные, зачастую, иррационально. 

Нейропсихологи проводили исследования и выяснили, что большинство решений люди принимают эмоционально. С одной стороны, это экономит ресурсы мозга, а с другой — позволяет быстрее принимать решения. И поэтому очень важно учитывать нашу эмоциональность при взаимодействии с другими и при создании имитации людей или сообществ с помощью современных генеративных моделей. Условно это можно назвать эмоциональным искусственным интеллектом.

Читать далее

Google I/O 2025: Gemini, Google Beam, умные очки и другие ключевые анонсы

Level of difficultyEasy
Reading time6 min
Views1.7K

В мае этого года прошла конференция Google I/O 2025, где компания представила целый ряд технологических новинок и обновлений своих флагманских продуктов. В этой статье подробно пройдёмся по ключевым анонсам мероприятия.

Читать далее

Зачем прыгать в бассейн… преджунов?

Level of difficultyEasy
Reading time7 min
Views6.4K

Привет, Хабр! Меня зовут Стас, я курирую HR-вопросы в ДИТ «Сеть продаж». Мы отвечаем за физические каналы взаимодействия с клиентами: сеть отделений банка, банкоматы, выездные специалисты прямых продаж, доставка финансовых документов и многое другое. В нашем ИТ-департаменте работает более 1000 человек. Мы нанимаем много инженеров разного уровня. Причём берём не только специалистов, но и даём шанс пока не очень квалифицированным, но очень мотивированным ребятам. Это у нас называется «бассейном».

Читать далее

Тайная жизнь домашних V8: как движок JavaScript оптимизирует твой код

Level of difficultyMedium
Reading time10 min
Views4K

Всем привет. Меня зовут Виктор Степанов, я frontend chapter lead на платформе СберТеха GitVerse. Хочу рассказать про внутреннюю «механику» V8 и показать, как писать более быстрый код. Поехали!

Читать далее

«Прилипания» HTTP-запросов в контексте прокси-сервера

Level of difficultyMedium
Reading time14 min
Views2.4K

Сегодня пользователи ожидают от веб-приложений мгновенного отклика. Оптимизация производительности становится критически важной задачей для разработчиков. Один из способов повысить эффективность работы серверов и уменьшить время отклика — «прилипание» HTTP-запросов

Когда приложения обслуживают много пользователей одновременно, каждая миллисекунда задержки может привести к потере клиентов и снижению качества обслуживания. Прилипание запросов позволяет минимизировать количество необходимых операций, эффективнее распределять ресурсы и улучшить пользовательский опыт. 

Меня зовут Ринат Фатхуллин, я владелец продукта Platform V SynGX — веб- и обратного прокси-сервера на основе Nginx. Наш продукт полностью заместил Nginx Plus в Сбере, в том числе благодаря расширенной поддержке «липких» сессий. 

Здесь я подробно рассмотрю сценарии использования и особенности этого подхода. Статья будет особенно интересна специалистам, которые занимаются обеспечением бесперебойной работы высоконагруженных сервисов. 

Читать далее

Не одним MacBook единым: ноутбук для айтишника

Level of difficultyEasy
Reading time9 min
Views43K

В этой статье я хочу поделиться своим опытом использования не‑яблочного ноутбука в мире, где каждый второй айтишник считает своим долгом выложить фотографию своего рабочего места с MacBook и кружкой с лавандовым рафом. Это не попытка доказать, что «макбук плох» или, тем более, что стоит брать HP Victus (не стоит), а мой личный путь с железом, которое сопровождало меня в пути от обычного студента до уже смешарика и винтика в корпоративной машинерии. Можно сказать, история жизни и страданий с HP Victus.

Читать далее

Как мы учились управлять миллионами учётных записей и их секретами

Level of difficultyMedium
Reading time13 min
Views4K

Всем привет. Название статьи говорит за себя, добавлю лишь, что расскажу об объединении IGA, PAM и Vault. Статья будет интересна DevSecOps-инженеров, специалистов по безопасности и администраторов инфраструктуры.

Читать далее

Автоматизация Excel и Google Таблиц с помощью ChatGPT: пошаговое руководство

Level of difficultyEasy
Reading time6 min
Views18K

Интеграция ChatGPT в Excel и Google Sheets позволяет превратить электронные таблицы в интеллектуальные инструменты. ИИ помогает: 

- генерировать формулы и скрипты; 
- анализировать большие данные; 
- переводить текст; 
- автоматизировать повторяющиеся задачи. 

Читать далее

Техноконструктор: как работает платформенный подход Сбера

Level of difficultyEasy
Reading time4 min
Views1.3K

Представьте огромный конструктор, для которого одни специалисты создают идеальные детали, а другие собирают из них сложные, продуманные модели. Примерно так устроен ИТ‑ландшафт Сбера: универсальные технологические платформы здесь становятся основой для сотен уникальных сервисов.

Почти 10 лет назад мы начали создавать платформу с базовыми технологическими компонентами. Эта платформа, которая впоследствии превратилась в Platform V, стала основой одного из трёх ключевых технических фундаментов, предоставляющих универсальные компоненты для создания цифровых решений. А сейчас Сбер уже развивает пять ключевых платформ. Три из них — технологические фундаменты: работа с данными, инфраструктурой и базовыми модулями, с которых мы начали платформизацию. Остальные две платформы включают в себя инструменты для эффективной командной работы и коммуникаций.

Читать далее

3 метода состязательных атак на глубокие нейронные сети: как обмануть ИИ

Level of difficultyMedium
Reading time6 min
Views1.2K

Состязательные атаки используют уязвимости глубоких нейронных сетей (DNN), внося минимальные изменения во входные данные, чтобы заставить модель ошибаться. Они часто незаметны для человека, но могут полностью изменить результат работы модели. В этой статье рассмотрим три популярных метода состязательных атак.

Читать далее

Российский нейроморфный процессор: что это и почему он важен?

Level of difficultyEasy
Reading time6 min
Views10K

Компания «Мотив НТ» из Новосибирска, которая разрабатывает системы технического зрения и аппаратные решения для их работы, выложила open-source код для создания, обучения и использования импульсных нейронных сетей. В основе разработки платформа KNP с программным пакетом и эмулятором нейроморфного процессора AltAI-1. Это позволяет разрабатывать и тестировать алгоритмы для работы на нейроморфном «железе».

Читать далее

Современные DDoS-атаки: чем они опасны для бизнеса

Level of difficultyEasy
Reading time8 min
Views2.4K

Частота DDoS-атак неуклонно растёт. Их количество в 2024 году в мире увеличилось на 108 % по сравнению с 2023 годом. Например, специалисты Центра мониторинга угроз в прошлом году отразили почти 11 тысяч DDoS-атак на российские организации. А самая длительная кибератака длилась более 108 часов. Ни одна компания не застрахована от потенциального ущерба, поэтому нужно знать как распознать DDoS-атаки и предотвратить их.

Читать далее

Генерация синтетических данных для LLM. Часть 2: графовый анализ

Level of difficultyHard
Reading time5 min
Views2K

Добрый день, уважаемый Хабр. Совсем немного времени прошло с первой публикации, но я уже спешу поделиться с вами своими наработками по тестированию «синтетических» данных и анализу их соответствия реальным данным. В прошлой части я кратко рассмотрел существующие методики применительно к генерации данных, также указал возможные предпосылки нарастающего тренда и самых значимых игроков на этом рынке, коих набралось уже немало. И, признаться сразу, качество их генераций заставляет уже призадуматься (например вот, вот и вот).

Здесь же мне захотелось сосредоточится исключительно на инструментальной части и предложить свой подход к анализу «синтетики». То есть посмотреть, как можно «развернуть» задачу, оптимизировав подход к ней более комплексно, так как уже поднадоело без конца «шить» лоскутное одеяло из множества тестов и метрик (Perplexity, BLEU, ROUGE, METEOR, BERTScore, GLUE, MMLU). Основной идеей было представление имеющихся данных через другие форматы, чтобы конвертировать и находить повторяющиеся паттерны, тренды, аналогии, элементы и возможные аномалии в данных. Ведь любой алгоритм, каким бы он сложным не был, не может выйти за пределы своей генерации, а следовательно, так или иначе будет создавать одни и те же «детектирующие» элементы.

Читать далее

Как LLM могут помочь аналитикам баз данных в работе с SQL-запросами

Level of difficultyHard
Reading time9 min
Views3.6K

В современных компаниях корпоративные хранилища данных (Data Warehouse) играют критически важную роль, обеспечивая централизованное хранение и обработку больших объёмов информации. Данные поступают из разнообразных источников: операционных систем, CRM, ERP, IoT-устройств, веб-аналитики, мобильных приложений и других платформ, отражая все аспекты деятельности организации. На основе этой информации компании формируют разного рода отчётность, отслеживают ключевые показатели эффективности (KPI), оптимизируют бизнес-процессы, прогнозируют рыночные тенденции и принимают стратегические решения.

Эффективная работа с хранилищем невозможна без участия бизнес- и системных аналитиков, которые проектируют структуры данных, очищают и объединяют информацию, адаптируя решения под меняющиеся задачи. С ростом объёмов данных и требований к скорости анализа даже опытные команды сталкиваются с вызовами. Рутинные операции — проектирование схем, поиск таблиц, проверка качества данных — требуют не только технических навыков, но и глубокого понимания бизнес-контекста. Большую часть времени занимает написание и оптимизация SQL-запросов, что становится «узким местом» в условиях динамично меняющихся требований.

Ошибки в SQL-запросах или недостаточное знание структуры данных приводит к потерям времени и снижению точности аналитики. Для решения этих проблем на помощь приходят технологии на основе больших языковых моделей (LLM), таких как GigaChat, GPT, BERT или DeepSeek. Обученные на исторических данных и журналах запросов, они способны автоматизировать подбор таблиц, JOIN-условий и шаблонов SQL. 

Читать далее

Зрение и его коррекция — не то, чем кажется

Level of difficultyEasy
Reading time7 min
Views19K

Привет, Хабр! Я — один из инженеров Сбера, и сегодня хочу поговорить с вами не о технологиях, которыми мы обычно делимся в корпоративном блоге, а о том, что волнует каждого айтишника, проводящего долгие часы за монитором — о зрении и способах его коррекции. И нет, это не очередной пост про то, как синий свет от монитора убивает наши глаза (хотя и убивает; вроде бы), и не про то, как сидеть ровно и моргать каждые 20 минут (хотя и нужно; но это не точно).

Читать далее

АйболИТ+: как в Сбере лечат технологические «болезни»

Level of difficultyEasy
Reading time3 min
Views987

Любая крупная компания сталкивается с «проблемами, упавшими между стульями» — так называют ситуации, когда рабочие задачи теряются среди множества подразделений и служб. Сотрудники не понимают, к кому обратиться за помощью, ответственность распределяется между командами, а стандартные подходы урегулирования малоэффективны.

Чтобы избежать подобного, в Сбере создали и развивают сервис АйболИТ+. Каждый день айтишники бигтеха работают над задачами с множеством зависимостей, в том числе в среде разработки, доступа к стендам, кибербезопасности, удалённой работы. Для простых случаев работает портал — оставляешь заявку и получаешь результат. А в нестандартных ситуациях как раз помогает АйболИТ+.

Читать далее

Отдыхаем от ИТ. Моделизм и раскрашивание

Level of difficultyEasy
Reading time14 min
Views3.9K

Привет, Хабр! В ИТ мы привыкли проводить большую часть дня в цифровом мире — кодинг, совещания, таски и проблемы пользователей. А как насчёт того, чтобы отдохнуть от всего этого, при этом не залипая перед монитором ещё на пару часов в игровой сессионке? Сегодня я хочу поделиться с вами своим опытом в области моделизма и прочего рукоделия — занятий, которые удивительным образом помогают мозгу переключиться и отдохнуть от бесконечных строк кода и рабочих задач. По крайней мере, моему уж точно. После работы за компьютером переход к созданию чего-то материального, что можно потрогать руками, иногда творит настоящие чудеса.

Читать далее

Генерация синтетических данных для LLM, или Как не «выстрелить» в ногу продакшену. Часть 1

Level of difficultyMedium
Reading time6 min
Views1.3K

Доброго вам дня, уважаемые Хабражители! В связи с бурным ростом LLM и просто невероятным, прорывными результатами практически ошеломительного качества, всё острее мы погружаемся в вопросы о дальнейшем развитии: «Куда двигаться дальше с точки зрения данных? Где их брать? Какого качества они должны быть? Как их бесшовно встроить в общую канву текущего конвейера? Сколько их вообще надо генерировать?» Всё это порождает массу тревог, размышлений и проводимых тестов. 

Поскольку мы уже вплотную подошли к тому, что данных начинает не хватать, надо заниматься их «разведением в домашних условиях». Ещё полгода назад прогноз был более оптимистичным, но стремительное развитии ИИ только «подлило масла в огонь». По факту, сейчас мы имеем ситуацию «взращивания» новой реальности и формирования целого многомерного мира вокруг любой технической задачи, любого формата и любой направленности. Более того, ставится вопрос, как сохранить исходные характеристики сырых данных и не подменить распределения и иные статистические параметры, дабы не уйти в сторону при обучении модели. Особенно это касается узкоспециализированных тем в широком социокультурном контексте. Говоря более общими словами, как генерировать «природные», а не «мусорные» данные? Более того, разгорающаяся ИИ-соперничество между США и Китаем принесёт много сюрпризов, гонка поднимется на новую высоту.  

Но обо всём по порядку. По традиции, всех заинтересованных любезно приглашаю под кат. Также приветствуются мнения, обсуждения и свежий взгляд ;) 

Читать далее
1
23 ...

Information

Rating
40-th
Works in
Registered
Activity