Обновить
38
-4.8
SberTeam@Sber

Пользователь

Отправить сообщение

Магия SDK: как облегчить жизнь разработчикам и ускорить интеграции

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели5.1K

Представьте, что вы лидер молодого, но быстрорастущего стартапа в области ML. Вам предстоит собрать команду, и вы думаете о том, каких специалистов вам предстоит найти:

- Data Scientist — для создания прототипов моделей машинного обучения, подходящих по задачи вашего проекта;

- ML Engineer — для внедрения в эксплуатацию моделей и сценариев, масштабирования;

- Data Engineer — для создания ETL‑процессов, систематизации сбора и хранения данных;

- DevOps/MLOps — для автоматизации процессов и развития инфраструктуры;

- SRE — для обеспечения мониторинга и надёжности вашей инфраструктуры.

Организовать работу всех направлений с нуля будет задачей не из лёгких. Но как принять этот вызов, если вы не обладаете экспертизой во всех направлениях?

Читать далее

Сокращаем трудозатраты при выводе витрин на Hadoop

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели4.6K

Привет, друзья! Я Олег Васильев, владелец продукта Dream DE. В этой статье расскажу, как мы научились быстро и эффективно выводить витрины на Hadoop в эксплуатацию, или как мы за один квартал вывели 26 инициатив в рабочую среду силами четырёх инженеров по данным.

Читать далее

Как мы улучшили персональный музыкальный поток с помощью контекстного многорукого бандита

Время на прочтение9 мин
Охват и читатели5.4K

Музыкальные стриминговые сервисы давно перестали быть просто «цифровыми полками» с треками — они превратились в персонализированные медиаплатформы, на которых ключевую роль играют рекомендательные системы. От Spotify и Apple Music до Яндекс.Музыки, VK Музыки и Звука — все они стремятся не просто хранить музыку, а предугадывать, что пользователь захочет услышать прямо сейчас. Рекомендации покрывают большое количество различных сценариев: плейлисты дня, подборки новинок, экспериментальные плейлисты в смежных для пользователя жанрах и многое другое. 

В этой статье мы хотим обсудить один из самых часто используемых и один из самых сложных с технической точки зрения сценариев: персональный поток треков (Персональная Волна).

Читать далее

Роль цифровых двойников в разработке и тестировании роботизированных систем

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели6.5K

Роботы становятся частью реальных процессов — от производства до медицины. Поэтому создание умных машин требует быстрой разработки, высокой надежности и цифрового контроля. В этом помогает ключевая технология — виртуальный двойник. Это не просто симуляция, а точная цифровая копия реальной роботизированной системы, которая обеспечивает связь между физическим и цифровым миром. Что такое цифровой двойник и чем он полезен для создания и тестирования роботов, расскажем в этой статье.

Читать далее

Топ-9 ИИ-плагинов для WordPress

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели4.9K

Большинство современных ИИ-решений для WordPress работают по принципу облачной интеграции. Плагины подключаются к ИИ-сервисам через API, позволяя использовать технологии искусственного интеллекта прямо в панели управления WordPress.

Читать далее

Великие умы ИТ-мира. Тим Бернерс-Ли

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели8.6K

В сложной истории инноваций, приходящих и исходящих из интернета, одно крупное достижение неоспоримо: в период с 1989 по 1991 год Тим Бернерс-Ли изобрел Всемирную паутину.

«Инновации — это счастливая случайность, поэтому вы не знаете что способны сделать люди». (Бернерс-Ли).

Читать далее

Как брали в долг в дореволюционной России

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели8.8K

Взаймы на Руси брали ещё до появления первых банков, и даже до образования единой денежной системы. Занимали зерно (пшеницу, рожь, овес, ячмень), сено на корм, лошадей, мёд, серебро. Такие займы могли быть даже беспроцентными, но чаще давались «в рост», то есть отдать нужно было больше. Практика кредитования разрасталась, и постепенно эти отношения стали регулироваться властями. Можно проследить, как менялись эти правила, превращаясь в систему кредитования царской России, которая действовала вплоть до 1917 года.

Читать далее

ИИ-рекрутеры: как нейросети работают с персоналом уже сейчас

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели6.8K

HR проходит цифровую трансформацию. По данным Gartner, с июня 2023 года  по январь 2024 года число HR-отделов, планирующих внедрить ИИ, увеличилось вдвое. А исследования «Юнион» и «Зарплата.ру» показали, что 75 % респондентов согласны на первичное собеседование с чат-ботом.

Это логично, ведь современный ИИ закрывает ряд HR-задач: от первичных собеседований до прогнозирования увольнений.  

Читать далее

Куны, гривны и говяды. Какими раньше были деньги на Руси

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели13K

История денег — предмет захватывающий. Можно проследить изменения экономического уклада стран, понять, с кем и как они торговали, и даже узнать по изображениям на монетах, как выглядели давно утраченные памятники культуры. Надписи на древних исчезнувших языках, портреты давно умерших правителей — деньги хранят массу информации. 

А какими были деньги в Древней Руси, и чем расплачивались люди до возникновения государственной чеканки монет?

Читать далее

Машинное обучение в финтехе

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели8.3K

Привет, Хабр! Машинное обучение в финансовой сфере — это полноценный инструмент, который уже меняет подходы к анализу данных, принятию решений и автоматизации процессов. Как именно эта технология работает, и какие конкретные задачи она решает? Поговорим об этом в этой статье.

Читать далее

Сказ о том, как «беспокойные» данные набеспокоили нам скор

Уровень сложностиСложный
Время на прочтение5 мин
Охват и читатели6.1K

Привет, уважаемые Хаброжители ;-) Сегодня мы поговорим о данных, которые представляют собой весьма специфичный случай, а именно о «шумных» данных. Предлагаю вам поразмыслить на тему обратного инжиниринга применительно к таким данным и попытаться поставить всё с ног на голову. О чем речь: не так давно мы написали модель машинного обучения по предсказанию одного тренда и пытались улучшить ее предсказания, применяя различные модификации фильтра Калмана (Kalman Filter, EnKF, Kalman Filter + Numba (Just-in-Time), EnKF + Numba (Just-in-Time)). Другими словами, фильтровали обучающую и тестовую выборку в надежде поднять скор на модели, выделив более качественный сигнал. При этом получили, в целом, весьма хорошее решение. И тут мы начали размышлять: «Так, пааажди… Мы же просто учились всегда на отфильтрованных данных, почему ускорение кода даёт нам поднятие скора на модели, и более того, более качественную балансировку предсказания для наших классов?» Если вам интересно, что у нас получилось, то приглашаю под кат.

Читать далее

Генерация синтетических данных для LLM. Часть 4: теоремы

Уровень сложностиСложный
Время на прочтение7 мин
Охват и читатели5.3K

Добрый день, уважаемые хабражители! Как и прежде меня зовут Владимир Миронов, и я занимаюсь тестированием и оценкой синтетических данных ;) Добрались, наконец-то, до четвёртой части в этом цикле статей из (прошлые статьи можно увидеть тут, тут и тут). В этот раз разберём важный момент, связанный с анализом полученных матриц смежностей по нашим графам и представлением их свойств с позиции оптимизации и унификации. В общем, поговорим про алгоритмы, обсудим чисто технические моменты и подходы к унификации данных. 

Всё идёт к тому, что интерпретируемое машинное обучение набирает всё больше оборотов, и необходима не только его визуализация, но и новые доказательные выкладки, и понимание границ формирования данных. Сформулирую несколько вопросов: 

Читать далее

AI Native Science: наука в эпоху ИИ-трансформации

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели4.6K

Искусственный интеллект меняет ландшафт научных открытий и значительно ускоряет исследования. Современные системы могут изучать литературу, строить гипотезы и генерировать экспертные статьи — для этого достаточно ввести пару промтов.   

Привет, Хабр! Меня зовут Алексей Шпильман, я лидер центра «AI для науки» в Сбербанке. В этой статье я расскажу, как AI повлиял на научную среду, какие ИИ-решения сегодня актуальны и какое будущее ждет AI Native Science. 

Читать далее

Интуиция или расчёт — стратегии успешных инвесторов

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели6.2K

Инвестиции всегда считались занятием рискованным. На неудачных вложениях погорело немало людей, некоторые разорились. Что же нужно, чтобы этого не произошло? Играет ли роль интуиция, или все удачные инвестиции — результат лишь спокойного и трезвого анализа? 

Как считают сами инвесторы? Признают ли они ценность интуитивного восприятия при решении инвестировать?

Читать далее

Записки с медицинской ИИ-фабрики

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели5K

Мы обучаем медицине большую языковую модель GigaChat и создаём агентов для здравоохранения на её основе. Наша модель уже сдала множество экзаменов и даже устроилась на работу. Как и в других сферах ИИ, в медицине мы делаем то, что раньше было фантастикой, а теперь быстро входит в практику. Давайте я вам об этом расскажу.

Читать далее

Генерация синтетических данных для LLM. Часть 3: случайные матрицы

Уровень сложностиСредний
Время на прочтение4 мин
Охват и читатели4.1K

Добрый день, уважаемые Хабровчане :) Продолжаем наши научные изыскания в области определения «синтетических» данных. В этой статье я рассмотрю тему анализа графов с позиции анализа спектров матрицы смежности для случайных матриц. То есть мы зайдём со стороны оптимизации знаний из прошлых двух статей (раз и два) и посмотрим, как применить теорию случайных матриц к нашей исходной задаче. Основная цель — расширение диапазона исследуемых значений. 

Итак, погнали, значицо ;)

Читать далее

Почему компании выходят из облака?

Время на прочтение8 мин
Охват и читатели9.6K

Привет, Хабр! Почему некоторые компании возвращаются к локальной инфраструктуре, оставляя публичное облако в прошлом? Казалось бы, облачные технологии — это будущее, но растущая тенденция обратной миграции доказывает обратное.

В этой статье мы расскажем вам, что движет этим процессом и какие выгоды он может принести бизнесу.

В 2019 году аналитики Gartner посчитали, что случаи выхода из публичного облака были скорее исключением, чем массовой практикой. А вот в июле 2024 года AWS решили, что этот тренд усиливается, особенно среди компаний, которые хотят усилить контроль над данными, снизить расходы и повысить кибербезопасность. Решение о миграции часто зависит от характера рабочих нагрузок и индивидуальных потребностей бизнеса.

Давайте разберём самые распространённые причины отказа от публичных облаков.

Читать далее

Продвинутые техники RAG в действии

Уровень сложностиСредний
Время на прочтение15 мин
Охват и читатели9.2K

Всем привет! Представьте таблицу с сотнями или даже тысячами атрибутов. Как в условиях высокой размерности найти релевантные данные по запросу на естественном языке? Классические методы часто не справляются, нужны новые подходы.

Именно за эту сложную задачу взялась команда Департамента управления данными (SberData) в рамках эффективной интеграции ИИ‑агентов в Корпоративную аналитическую платформу Сбера (КАП), которая объединяет современные инструменты для работы с данными: хранение, интеграция, аналитика, моделирование и контроль качества данных. Наличие таких технологий, как продвинутые LLM (например, GigaChat), и большие объёмы данных делают исследование подобных задач актуальным для рынка больших данных.

В статье мы сравним эффективность векторного поиска, гибридных методов и подхода Retrieval‑Augmented Generation (RAG), оценим их влияние на точность результатов и обсудим практические ограничения.

Читать далее

Вёрстка не поехала: как тестировать интерфейсы без боли

Уровень сложностиПростой
Время на прочтение11 мин
Охват и читатели6.2K

Привет, Хабр!

Мы — Алевтина Чугунова (владелец продукта дизайн‑системы) и Дарья Каткова (QA‑инженер). В этой статье расскажем, как создаём и тестируем дизайн‑систему, с какими проблемами сталкивались и какие инструменты разработали, чтобы упростить жизнь себе и командам.

Вы узнаете:

— Что такое дизайн‑система и зачем она нужна.

— Как тестировать интерфейсы без боли.

— Какие инструменты помогают автоматизировать проверки.

Читать далее

AI Labyrinth от Cloudflare: как генеративный ИИ стал оружием против ботов-скрейперов

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели8.4K

С развитием генеративного ИИ боты-скрейперы стали умнее и настойчивее. Они обходят традиционные методы защиты и массово сканируют сайты, собирая данные для обучения своих моделей. Ежедневно в сети Cloudflare фиксируется более 50 миллиардов запросов от ИИ-краулеров — это почти 1% всего интернет-трафика.

Компания предложила новое решение проблемы — AI Labyrinth. Вместо прямого блокирования инструмент дезориентирует ботов, заставляя их тратить время и ресурсы на обработку бесполезного контента.

Читать далее
1
23 ...

Информация

В рейтинге
Не участвует
Работает в
Зарегистрирован
Активность