Машинное обучение *

Основа искусственного интеллекта

СтатьиПостыНовостиАвторыКомпании

Sber 3 ноя 2023 в 11:56

Разработка рекомендательных систем: три открытых библиотеки от Сбера

Простой

4 мин

5.3K

Блог компании СберOpen source * Алгоритмы * Машинное обучение *

Обзор

Делимся своими открытыми библиотеками для разработки рекомендательных систем. Что? Да! Рассказываем подробнее. Всем известно, что Сбер это уже не просто банк, а огромная технологическая компания, которая включает в себя и сервисы компаний-партнёров: электронную коммерцию, индустрию развлечений и даже медицину. Количество пользователей достигло 108 млн, и для каждого из них мы создаём персональные рекомендации, которые помогают не потеряться в разнообразии предложений и выбрать лучшее.

Rosatom 2 ноя 2023 в 12:57

Предсказываем цены с помощью методов анализа данных и машинного обучения

Средний

10 мин

13K

Блог компании РосатомМашинное обучение * Исследования и прогнозы в IT *

Кейс

Привет, Хабр! Вас приветствуют Нане Бегларян (инженер данных) и Дмитрий Распопов (эксперт отдела искусственного интеллекта) из компании «Цифрум» Госкорпорации «Росатом». В этой статье мы поговорим с вами о задаче, связанной с разработкой комплексной модели для прогнозирования цен на электроэнергию, которая позволяет обеспечить стабильность и надежность работы энергосистемы; делается это в рамках совместного проекта компаний Росатома РЭИН и «Цифрум».

Цены на электроэнергию могут значительно колебаться в зависимости от множества факторов, что может привести к нестабильности и непредсказуемости в работе энергосистемы. (и росту цифр в коммунальных счетах).

Чтобы было легче морально готовиться к очередной оплате (и заодно потренировать свои знания в ML), делимся с вами опытом и знаниями в области прогнозирования цен на электроэнергию с помощью методов анализа данных и машинного обучения.

badcasedaily1 2 ноя 2023 в 11:23

Применение архитектурных шаблонов в машинном обучении: разбор Gradient Boosting

Простой

12 мин

5.7K

Блог компании OTUSPython * Машинное обучение *

Обзор

Привет, Хабр!

Архитектурные шаблоны в машинном обучении представляют собой общие структуры и методологии, которые позволяют разработчикам более эффективно решать задачи. Они представляют собой набор bewährte Lösungen, то есть "проверенных решений", которые могут быть адаптированы к конкретным задачам и данным. Использование архитектурных шаблонов позволяет сэкономить время и ресурсы при разработке моделей машинного обучения.

Gradient Boosting – это один из наиболее мощных и гибких архитектурных шаблонов в машинном обучении. Он позволяет строить ансамбли моделей, комбинируя слабые ученики в сильную модель, способную решать разнообразные задачи классификации и регрессии. Этот метод обрел популярность благодаря своей способности обучаться на ошибках предыдущих моделей, постепенно улучшая свои прогнозы.

Преимущества Gradient Boosting включают в себя высокую точность прогнозов, устойчивость к переобучению и способность работать с разнородными данными. Он также позволяет эффективно решать задачи как классификации, так и регрессии, что делает его незаменимым инструментом для разработчиков.

shpringer 2 ноя 2023 в 10:28

Сокращаем дистанцию: как сконструировать SQL-модели в MLflow и упростить управление жизненным циклом машинного обучения

9 мин

Блог компании VKМашинное обучение *

Перевод

Сегодня в постоянно меняющейся сфере машинного обучения особую важность приобретает возможность управлять полным жизненным циклом моделей без особых усилий. Этот витиеватый процесс поможет упростить Open-Source-платформа MLflow.

Читать дальше →

+12

a_melnikov 1 ноя 2023 в 09:43

Использование ML для прогнозирования CLTV

Средний

10 мин

4.1K

Блог компании билайнСтатистика в ITУправление продажами * Машинное обучение * Математика *

Туториал

Из прошлой статьи мы узнали, что CLTV (customer lifetime value) — метрика, используемая для оценки прибыли, которую компания может получить от своего клиента за время его пользования продуктами и сервисами компании.

Разберем, что означает каждая буква в определении CLTV (customer lifetime value). Кто такой клиент, что мы понимаем под lifetime и ценностью, которую приносит нам клиент.

CLTV строится для клиента, а не для номера телефона, так как мы не хотим терять историю взаимодействий с ним. Мы учитываем, что абонент может сменить номер телефона и/или может измениться номер договора. Также билайн — это не только мобильная связь, но и домашний интернет, которым наши абоненты могут пользоваться в рамках одного договора. Поэтому мы сразу решили собирать информацию и по этим услугам в рамках одной записи по клиенту. В будущем мы планируем прогнозировать CLTV уже на уровне физического лица и домохозяйств, объединяя историю пользования всех сим-карт клиента.

Под lifetime мы понимаем не полный жизненный цикл клиента от момента заключения договора до момента его закрытия, а пятилетний горизонт, который мы отсчитываем от текущего момента времени. То есть, если мы строим прогноз от января 2023 года, то прогноз будет построен помесячно до декабря 2027 года. Почему 5 лет? Этот срок был определен опытным путем — при нем достигается баланс между качеством предсказаний и потребностью в бизнес-процессах.

В билайне под ценностью клиента принято понимать маржу, которую нам приносит абонент с учетом всех затрат и доходов, которые мы можем аллоцировать на конкретного клиента.

+11

NewTechAudit 1 ноя 2023 в 06:18

Поможем Ходору найти новых друзей с помощью графов

Средний

10 мин

8.9K

Python * Машинное обучение * Алгоритмы *

Туториал

✏️ Технотекст 2023

Привет, Хабр!

На связи участник профессионального сообщества NTA Кухтенко Андрей.

В интернете постоянно что-то рекомендуют: посмотреть новое видео, добавить друга или купить товар. Как работают эти алгоритмы, расскажу в посте ниже и реализую рекомендательную систему с помощью графов.

Помочь Ходору найти друзей

maksler 31 окт 2023 в 20:12

Прогнозирование нагрузки солнечных электростанций

7 мин

Python * Машинное обучение *

Прогнозируем нагрузку группы солнечных электростанций на сутки вперед с помощью машинного обучения. Сравниваем два метода — Random Forest и LSTM.

Keithla 31 окт 2023 в 12:58

Как работают Model Serving инструменты изнутри. Пишем свой на Python и Docker с нуля

Средний

15 мин

4.6K

Машинное обучение * Python *

Туториал

Вы когда-нибудь задумывались, как модели машинного обучения переходят от экспериментов к реальным приложениям? Здесь мы погрузимся в мир сред обслуживания моделей и невоспетых героев, стоящих за развертыванием и обслуживанием моделей ИИ. В этой статье мы раскрывается скрытая магия — от интеграции scikit-learn до контейнеризации Docker, предоставляя вам ключевые идеи для превращения ваших моделей в доступные сервисы.

virtual_explorer 31 окт 2023 в 11:15

Технология «Дятел»: новаторское решение проблемы галлюцинаций ИИ

4 мин

6.5K

Блог компании FirstVDSМашинное обучение * Искусственный интеллект

Исследователи искусственного интеллекта из Университета науки и технологий Китая (USTC) и лаборатории Tencent YouTu Lab разработали инновационную структуру, получившую название «Дятел» (Woodpecker). Она предназначена для коррекции «галлюцинаций» в мультимодальных языковых моделях (MLLM).

Принципы своей работы они описывают встатье, опубликованной несколько дней назад на сервере препринтов arXiv. Их технология достаточно проста, но позволяет убрать глупые, очевидно неверные ответы, которые иногда , казалось бы, в случайном порядке выдают языковые и другие GPT-модели.

+20

totsamymatveev 31 окт 2023 в 09:24

Когда одной ARIMA мало. Прогнозирование временных рядов нейросетями

Средний

12 мин

14K

Блог компании МегаФонPython * Big Data * Машинное обучение * Искусственный интеллект

Туториал

Привет, Хабр! Меня зовут Никита, я работаю в Мегафоне аналитиком больших данных. В этой статье я хочу поговорить про временные ряды, а если конкретнее, про использование нейросетей для их прогнозирования.

В статье мы не только разберем две актуальные архитектуры для прогнозирования, но и применим их на реальных данных. В дополнение к статье вас ждет код, с помощью которого вы легко сможете запустить сетки и применить их для решения своих задач!

dubitskaya 31 окт 2023 в 09:07

Как я ускорила разработку корпоративных онлайн-курсов с помощью современной модели 4С/ID и использования нейросетей

Средний

6 мин

5.8K

Блог компании Единый ЦУПИСМашинное обучение * Учебный процесс в ITИскусственный интеллект

Кейс

В этой статье я на примере разберу процесс проектирования онлайн-курса «Практика эффективной обратной связи» по модели 4C/ID с использованием нейросетей. Расскажу, на каких этапах проектирования нейросети могут быть полезны, какие возникли трудности и каких результатов мы добились. Статья будет полезна методологам, методистам, специалистам L&D и всем, кому интересно заглянуть за кулисы проектирования онлайн-обучения.

DigitalTatarstan 30 окт 2023 в 08:30

Как мы собираемся дать ИИ и гражданам доступ в госуправление: кейс Татарстана

4 мин

1.5K

Блог компании Команда Цифровой Трансформации ТатарстанаИскусственный интеллектBig Data * Машинное обучение *

Кейс

Центр цифровой трансформации Республики Татарстан запустил площадку публичных обсуждений проектов в сфере ИИ, в которой пользователи и предобученная большая языковая модель вместе обсуждают и оценивают инициативы в сфере ИИ.

В статье рассказываем, для чего нужна площадка и как она будет работать.

ptsecurity 30 окт 2023 в 08:11

Поймай меня, если сможешь: как найти хакера в инфраструктуре с помощью ML

9 мин

8.2K

Блог компании Positive TechnologiesИнформационная безопасность * Машинное обучение * Искусственный интеллектПрограммирование *

По результатам пентестов, проведенных нашими специалистами в 2021–2022 годах, 96% компаний оказались не защищены от проникновения в локальную сеть, причем в 8 из 10 организаций мог бы проникнуть даже низкоквалифицированный злоумышленник. Среди протестированных предприятий каждое пятое — из отрасли промышленности, и инциденты на них гораздо серьезнее и страшнее, чем взлом кассового аппарата продуктового магазина. Остановка турбины АЭС грозит экологической катастрофой, авария на металлургическом заводе практически всегда приводит к человеческим жертвам. А что будет, если хакеры атакуют аэропорт?

Мы проверили и узнали — ничего хорошего. На кибербитве Standoff команда красных взломала SCADA-систему аэропорта виртуального Государства F. Более того, им удалось получить контроль над телетрапом.

Сегодня мы пошагово разберем действия red team, расскажем, как модели машинного обучения могли бы помочь их поймать, и покажем, какими методами можно обнаружить атаку и выявить ее источник.

Читать

dentsuRU 27 окт 2023 в 12:47

Как мы определили веса алгоритмов ранжирования крупнейших маркетплейсов на открытых данных

Простой

6 мин

6.2K

Блог компании OKKAM GroupАлгоритмы * Машинное обучение *

Кейс

Привет, Хабр! Меня зовут Владислав Абрамов, я аналитик в команде разработки компании Easy Commerce. Перед нами стояла задача создать алгоритм, который определяет влияние характеристик карточки товара на поисковую позицию в крупнейших российских маркетплейсах. Большинство из них не раскрывают принципы ранжирования — эту проблему нужно было решить с помощью анализа открытых данных. В этой статье расскажу, как мы прошли этот путь и проверили, что решение действительно работает.

+11

Lithium_vn 27 окт 2023 в 12:39

ИИ выходит на новый уровень: LLM обретают пространственно-временную картину мира

Средний

5 мин

36K

Блог компании BotHubМашинное обучение * Научно-популярноеИскусственный интеллект

Обзор

✏️ Технотекст 2023

Исследователи из MIT под руководством Макса Тегмарка сделали важное открытие в области искусственного интеллекта. Им удалось доказать, что современные языковые модели (LLM), обученные на огромных массивах текстов, формируют внутри себя целостные модели мира, включающие представления о таких фундаментальных понятиях, как пространство и время.

Это открытие имеет принципиальное значение. Считалось, что для искусственного интеллекта недоступны базовые человеческие возможности, такие как самосознание, наличие картины мира и способность к человекоподобному мышлению, в принципе. Но это открытие стало gamechanger’ом в плане понимания того, как у ИИ происходит мыслительный процесс.

Предлагаем и Вам углубиться в это исследование и узнать, что конкретно было сделано и как!

s_valuev 27 окт 2023 в 12:37

MLOps-инструменты, обзоры рынка и тренды потоковой обработки данных

Средний

6 мин

4.9K

Блог компании SelectelBig Data * IT-инфраструктура * Искусственный интеллектМашинное обучение *

Дайджест

Привет, Хабр! В сегодняшнем дайджесте продолжаю делиться материалами, которые помогут вам лучше разобраться в темах ML, искусственного интеллекта и дата-аналитики. Какие перспективы у LLM и BI? Куда Amazon и Google инвестировали более $4 млрд? Как организовать работу аналитических команд? Отвечаем на вопросы в статье.

Еще больше полезных материалов по DataOps и MLOps — в Telegram-сообществе «MLечный путь».

Читать дальше →

+31

dereyly 27 окт 2023 в 11:40

От Style Transfer до диффузии: эволюция визуальных эффектов на смартфонах

Средний

11 мин

2.8K

AR и VRМашинное обучение * Обработка изображений * Разработка мобильных приложений * iOS *

Четыре года я занимаюсь разработкой различных спецэффектов для фото и видео в мобильных приложениях. Вроде бы это локальная и как бы несерьезная тема, но одну только плачущую маску в Snapchat посмотрели 9 млрд раз. Такие штуки пользуются бешеной популярностью и здорово повышают виральность мобильных приложений, но с каждым годом удивлять людей становится все сложнее.

В этой статье я разберу эволюцию видеоэффектов, поделюсь наблюдениями и раскрою пару инсайдов о том, как перенести стилизацию изображения из StableDiffusion на смартфоны.

Читать дальше →

+12

MAKO_digital 27 окт 2023 в 11:10

Как страшненький лендинг Midjourney втрое повысил конверсию, а банальные тексты Chat GPT оказались вдвое кликабельнее

Простой

8 мин

17K

Блог компании МАКО DIGITALИскусственный интеллектМашинное обучение * Контекстная реклама * Интернет-маркетинг *

Мнение

Неочевидный маркетинг с Chat GPT и Midjourney. ИИ придумал УТП для разных ценовых сегментов аудитории, а потом написал скрипт для подмены контента на сайте, и это на 23% повысило конверсию. Рекомендация от нейросети увеличила на 5% бронирования в сети отелей. Как задавать нейросетям правильные запросы и получать классные маркетинговые решения.

Расскажем, о нашем практическом опыте использования нейросетей в контекстной рекламе и интернет-маркетинге. Вы узнаете:

1. Как сделать рекламные объявления в 2 раза более кликабельными при помощи Chat GPT

2. Как рекомендация от нейросети принесла дополнительные 5% бронирований для сети отелей

3. Как ИИ придумал эффективное УТП для разных ценовых сегментов аудитории

4. А потом ИИ написал скрипт для подмены контента на сайте, и это на 23% увеличило его конверсию

5. Как страшненький на вид лендинг от Midjourney оказался в 3 раза более конверсионным

6. Как правильно пользоваться нейросетями: 6 выводов для интернет-маркетолога

randall 27 окт 2023 в 09:36

Объясняем простым языком, что такое трансформеры

Простой

12 мин

67K

Блог компании МТСБлог компании MWSИскусственный интеллектМашинное обучение * Natural Language Processing *

Обзор

Перевод

Облако предлагает много возможностей для развития ИИ. С помощью облачных вычислений проще масштабировать ML-модели, повышать точность обучения и предоставлять данные удаленно пользователям. Однако масштабное развертывание ML-моделей требует понимания архитектуры нейронных сетей.

Один из важнейших инструментов машинного обучения — трансформеры. Популярность трансформеров взлетела до небес в связи с появлением больших языковых моделей вроде ChatGPT, GPT-4 и LLama. Эти модели созданы на основе трансформерной архитектуры и демонстрируют отличную производительность в понимании и синтезе естественных языков.

Хотя в сети уже есть хорошие статьи, в которых разобран принцип действия трансформеров, большинство материалов изобилует запутанными терминами. Мы подготовили перевод статьи, в которой без кода и сложной математики объясняют современную трансформерную архитектуру.

+35

FirstJohn 27 окт 2023 в 08:02

Машинное обучение помогает классическому моделированию квантовых систем

Средний

6 мин

1.9K

Блог компании FirstVDSМашинное обучение * Квантовые технологии

Обзор

Перевод

Используя «классические тени», обычные компьютеры могут превзойти квантовые компьютеры в сложной задаче понимания квантового поведения.

Понять квантовую вселенную — задача непростая. Интуитивные представления о пространстве и времени терпят крах в крошечной сфере субатомной физики, допуская поведение, которое нашему макрочувству кажется совершенно странным.

Квантовые компьютеры должны позволить нам использовать эту странность. Такие машины теоретически могли бы исследовать молекулярные взаимодействия для создания новых лекарств и материалов. Но, возможно, самое важное то, что сам мир построен на этой квантовой вселенной — если мы хотим понять, как она работает, нам, вероятно, понадобятся квантовые инструменты.

1 2 ...

177 178

179

180 181 ...

472 473

Машинное обучение *

Разработка рекомендательных систем: три открытых библиотеки от Сбера

Предсказываем цены с помощью методов анализа данных и машинного обучения

Применение архитектурных шаблонов в машинном обучении: разбор Gradient Boosting

Сокращаем дистанцию: как сконструировать SQL-модели в MLflow и упростить управление жизненным циклом машинного обучения

Использование ML для прогнозирования CLTV

Поможем Ходору найти новых друзей с помощью графов

Прогнозирование нагрузки солнечных электростанций

Как работают Model Serving инструменты изнутри. Пишем свой на Python и Docker с нуля

Технология «Дятел»: новаторское решение проблемы галлюцинаций ИИ

Когда одной ARIMA мало. Прогнозирование временных рядов нейросетями

Как я ускорила разработку корпоративных онлайн-курсов с помощью современной модели 4С/ID и использования нейросетей

Как мы собираемся дать ИИ и гражданам доступ в госуправление: кейс Татарстана

Поймай меня, если сможешь: как найти хакера в инфраструктуре с помощью ML

Ближайшие события

Как мы определили веса алгоритмов ранжирования крупнейших маркетплейсов на открытых данных

ИИ выходит на новый уровень: LLM обретают пространственно-временную картину мира

MLOps-инструменты, обзоры рынка и тренды потоковой обработки данных

От Style Transfer до диффузии: эволюция визуальных эффектов на смартфонах

Как страшненький лендинг Midjourney втрое повысил конверсию, а банальные тексты Chat GPT оказались вдвое кликабельнее

Объясняем простым языком, что такое трансформеры

Машинное обучение помогает классическому моделированию квантовых систем

Вклад авторов