Машинное обучение *

Основа искусственного интеллекта

СтатьиПостыНовостиАвторыКомпании

NapoleonIT 12 мар 2024 в 10:34

Как мы делаем веб-сервис для автоматизации рабочих задач на базе агентов LLM

9 мин

5.4K

Машинное обучение *

Recovery Mode

Друзья, всем привет! Сегодня хотим рассказать про то, как мы — Виталий, Даниил, Роберт и Никита — при поддержке AI Talent Hub, совместной магистратуры Napoleon IT и ИТМО, создаем Цифработа — сервис цифровых работников, который помогает оптимизировать временные затраты у сотрудников на выполнение рабочих задач с помощью агентов больших языковых моделей (LLM).

В данной статье мы вкратце рассмотрим, кто такие агенты, как они могут автоматизировать рабочие процессы, и обсудим ключевые вызовы, с которыми мы столкнулись при разработке сервиса. Сразу хочется отметить, что данная статья, скорее, служит обзором нашего решения проблемы и тех задач, над которыми мы работали, нежели преследует цель предоставить подробное руководство по применению агентов или проектированию архитектуры сервиса.

Предлагаем начинать!

egaoharu_kensei 11 мар 2024 в 18:19

Стекинг и блендинг в ML. Ключевые особенности и реализация с нуля на Python

Сложный

11 мин

13K

Python * Data Mining * Алгоритмы * Машинное обучение * Искусственный интеллект

Туториал

Среди всех методов ансамблирования особое внимание заслуживают две очень мощные техники, известные как стекинг (stacked generalization) и блендинг, особенность которых заключается в возможности использования прогнозов не только однородных, но и сразу нескольких разных по природе алгоритмов в качестве обучающих данных для другой модели, на которой будет сделан итоговый прогноз. Например, прогнозы логистической регрессии и градиентного бустинга могут быть использованы для обучения случайного леса, на котором уже будет выполнен итоговый прогноз.

Стекинг и блендинг очень схожи между собой, однако между ними есть существенные различия, заключающиеся в разделении и использовании тренировочных данных. Рассмотрим более подробно как это происходит.

hivaze 11 мар 2024 в 13:15

Контекст больше не предел: Линейка русскоязычных энкодеров ruRoPEBert и как она создавалась

Средний

9 мин

9.2K

Блог компании Точка БанкNatural Language Processing * Искусственный интеллектМашинное обучение *

Привет, Хабр! Если вы интересуетесь NLP или просто современными DL моделями, то приглашаю вас узнать, как можно, имея всего лишь одну A100, около 30 гигабайтов текста и несколько дней обучения, решить проблему ограниченного окна контекста для русскоязычных трансформеров. А ещё сделаем несколько оптимизаций и добьёмся почти лучших метрик в бенчмарке encodechka.

Погрузиться в контекст

+13

dasafyev 11 мар 2024 в 09:00

Как AI помогает побороть монополию в спортивной рекламе и при чем тут GPU и выделенные серверы

Простой

6 мин

Блог компании HOSTKEYМедийная реклама * GPGPU * Машинное обучение * Big Data *

Кейс

Спортивные соревнования сегодня переполнены рекламой — от роликов на экранах до статичных логотипов компаний на рекламных щитах стадионов. Эфир охватывает множество стран, в которых представлены различные бренды и действуют разные законы о рекламе. Благодаря прорыву в развитии ИИ и AR-технологий появляется возможность замены информации на поле под каждую аудиторию, причем непосредственно во время трансляции матча.

boramorka 11 мар 2024 в 08:31

Я написал бесплатную книгу для профессионалов в области AI (и не только)

Сложный

2 мин

19K

Машинное обучение *

Из песочницы

Привет, Хабр! Меня зовут Никита Горячев, работаю в позиции AI/ML Engineer в Сбере. В мой скоуп входит работа с SOTA (state-of-the-art) алгоритмами в областях NLP и RecSys.

Книга написана в форме Guide Book с теоретическими и практическими заданиями. Ниже написал анонс в виде Q&A, чтобы вы на первых двух пунктах смогли понять, интересно ли вам.

Ссылка на книгу

+11

LanskoyGames 10 мар 2024 в 08:17

Создание генетического алгоритма для нейросети и нейроcети для графических игр и видеоигр с помощью Python и NumPy

Средний

6 мин

7.5K

Искусственный интеллектМашинное обучение * Алгоритмы * Программирование * Python *

Туториал

Привет, Хабр!

Сегодня я расскажу и покажу, как сделать Genetic Algorithm(GA) для нейросети, чтобы с помощью него она смогла проходить разные игры. Я его испробовал на игре Pong и Flappy bird. Он себя показал очень хорошо. Советую прочитать, если вы не читали первую статью: "Создание простого и работоспособного генетического алгоритма для нейросети с Python и NumPy" , так как я доработал свой код который, был показан в той статье.

Я разделил код на две скрипта, в одной нейросеть играет в какую-то игру, в другой обучается и принимает решения(сам генетический алгоритм). Код с игрой представляет из себя функцию которая возвращает фитнес функцию (она нужна для сортировки нейросетей, например, сколько времени она продержалась, сколько очков заработала и т.п.). Поэтому код с играми(их две) будет в конце статьи. Генетический алгоритм для нейросети для игры Pong и игры Flappy Bird различаются лишь параметрами.

Используя скрипт, который я написал и описал в предыдущей статье, я создал сильно изменённый код генетического алгоритма для игры Pong, который я и буду описывать больше всего, так как именно на него я опирался, когда я уже создавал GA для Flappy Bird.

Вначале нам потребуется импортировать модули, списки и переменные:

+11

egaoharu_kensei 9 мар 2024 в 16:56

Метод главных компонент (PCA). Принцип работы и реализация с нуля на Python

Сложный

8 мин

34K

Искусственный интеллектМашинное обучение * Алгоритмы * Data Mining * Python *

Туториал

Метод главных компонент (Principal Component Analysis или же PCA) — алгоритм обучения без учителя, используемый для понижения размерности и выявления наиболее информативных признаков в данных. Его суть заключается в предположении о линейности отношений данных и их проекции на подпространство ортогональных векторов, в которых дисперсия будет максимальной.

Такие вектора называются главными компонентами и они определяют направления наибольшей изменчивости (информативности) данных. Альтернативно суть PCA можно определить как линейное проецирование, минимизирующее среднеквадратичное расстояние между исходными точками и их проекциями.

+10

interesting-cs-math 9 мар 2024 в 11:06

Nearest-Neighbors (python 3)

Средний

13 мин

3.4K

Машинное обучение *

Туториал

Исходный код + Описание команд программы + Описание идеи алгоритма

sklearn.neighbors — это библиотека, которая предоставляет возможности работы с алгоритмами, основанными на соседях (как для случая обучения с учителем, так и для случая обучения без учителя).

Метод ближайших соседей без учителя является основой для многих других алгоритмов машинного обучения, в частности, manifold learning и спектральной кластеризации.

Обучение с учителем, основанное на соседях представляется в двух вариантах: классификация (для данных с дискретными метками) и регрессия (для данных с непрерывными метками).

Принцип метода ближайших соседей заключается в поиске предопределенного количества тренировочных (учебных) образцов, ближайших по расстоянию до новой точки, и предсказать метку по ним. Число образцов может быть определено пользователем константой (k‑ближайших соседей), либо варьироваться в зависимости от локальной плотности точек (радиус‑ориентированное обучение). Расстояние, вообще говоря, может быть любой метрической мерой: стандартное евклидово расстояние является наиболее распространенным выбором. Методы, основанные на соседях, известны как не обобщающие методы машинного обучения, так как они просто «запоминают» все свои учебные данные (возможно, превращаются в быструю структуру индексирования, такую как дерево шаров или KD дерево).

Несмотря на свою простоту, ближайшие соседи успешно справились с большим количеством проблем классификации и регрессии, включая рукописные цифры или сцены спутникового изображения. Будучи непараметрическим методом, он часто бывает успешным в ситуациях классификации, где граница решения очень нерегулярна.

egaoharu_kensei 8 мар 2024 в 19:01

Кластеризация в ML: от теоретических основ популярных алгоритмов к их реализации с нуля на Python

Сложный

34 мин

60K

Python * Data Mining * Алгоритмы * Машинное обучение * Искусственный интеллект

Туториал

✏️ Технотекст 2023

Кластеризация — это набор методов без учителя для группировки данных по определённым критериям в так называемые кластеры, что позволяет выявлять сходства и различия между объектами, а также упрощать их анализ и визуализацию. Из-за частичного сходства в постановке задач с классификацией кластеризацию ещё называют unsupervised classification.

В данной статье описан не только принцип работы популярных алгоритмов кластеризации от простых к более продвинутым, но а также представлены их упрощённые реализации с нуля на Python, отражающие основную идею. Помимо этого, в конце каждого раздела указаны дополнительные источники для более глубокого ознакомления.

+36

camunar 8 мар 2024 в 09:19

Платформа Rasa в действии: оценка работы виртуального ассистента с помощью конвейера данных диалогов и аналитики

Средний

4 мин

863

Машинное обучение *

Туториал

Перевод

Вы создали ассистента, настроили намерения, запустили его — клиенты с ним взаимодействуют. Но как определить, что все прошло успешно? Как вообще измерить успех? По каким признакам вы оцениваете удовлетворенность клиентов или определяете, что ассистент работает так, как было задумано? Как понять, что именно необходимо оптимизировать, если он работает недостаточно эффективно?

derunat 7 мар 2024 в 10:46

Выбор данных, малые языковые модели и причём здесь Шмидхубер

4 мин

2.9K

Блог компании НТРМашинное обучение * Искусственный интеллект

Обзор

Большие языковые модели — это хорошо, но интересно, можно ли получить сравнимое качество на малых моделях. Вести диалог с GPT-2 не получится, а тем более написать диплом или научную статью. Она и другие small language models (SLM) по большей части выдают слабый текст, даже если обучить их на всей Википедии.

Возможно, тут стоит вспомнить теорию Шмидхубера, который, как известно, всё придумал.

Denis_Voloshin 6 мар 2024 в 11:00

Звоните Кузе: как мы записали FAQ для инженеров

7 мин

2.6K

Блог компании ИТ-холдинг Т1Платежные системы * Машинное обучение *

Каждый месяц мы получаем 20–50 тысяч звонков с вопросами по обслуживанию банкоматов. Чаще всего звонят инженеры: узнать статус заявки, получить доступ, проверить версии ПО и т.п. Или инкассаторы — чтобы понять, есть ли на препарируемом ими банкомате неисправности. Вопросы в 90% случаев одни и те же.

Мы взяли движки для голосовой автоматизации и речевых технологий, объединили их и получили робота, который помогает человекам, подключили и поставили его на линию.

Функционал был тот же, что и у оператора, но инженеры принципиально не хотели общаться с роботом. Даже если это был типовой вопрос «всё ли хорошо с банкоматом?». Потом мы поменяли голос на приятный женский, протестировали в АБ с мужским — и количество переключений на оператора с робота-женщины упало: 24% обработок с Денисом и 65% с Джулией.

Читать дальше →

+19

Flokis_guy 6 мар 2024 в 10:31

WaveSync: Новый путь к нелинейному анализу эмбеддингов

Средний

8 мин

3.2K

Математика * Natural Language Processing * Машинное обучение *

Из песочницы

WaveSync — новый алгоритм для детального, нелинейного и быстрого анализа сходства эмбеддингов и векторов.

Алгоритм является в большинстве задач заменой линейному косиносному сходству. Он позволяет улучшить точность обработки языка и открывает новые перспективы для разработчиков и исследователей в области NLP.

darkasevgen 6 мар 2024 в 10:10

Портретная гармонизация изображений

Средний

8 мин

3.1K

Блог компании SberDevicesОбработка изображений * Машинное обучение * Искусственный интеллект

Обзор

Привет! В данной публикации команда RnD CV из SberDevices познакомит вас с нашим подходом к решению задачи повышения степени реалистичности портретных изображений (по-научному — портретной гармонизации изображений). Мы не только расскажем о задаче портретной гармонизации, но и представим архитектуру нейронной сети, которая прекрасно решает эту задачу. В конце статьи будут представлены примеры работы нашей модели и получившиеся метрики.

+24

Demir_Uzun 6 мар 2024 в 09:05

Модель глубокого обучения, использующая данные ЭКГ для прогнозирования риска внезапной сердечной смерти

Средний

23 мин

2.9K

Исследования и прогнозы в IT * Data Engineering * Big Data * Python * Машинное обучение *

Recovery Mode

Перевод

Внезапная сердечная смерть (ВСС) происходит, когда возникают проблемы с электрической активностью в сердце. Это распространенная причина смерти по всему миру, поэтому было бы полезно легко выявлять людей с высоким риском ВСС. Электрокардиограммы - это доступный и широко используемый способ измерения электрической активности сердца. Мы разработали вычислительный метод, который может использовать электрокардиограммы для определения, находится ли человек в повышенном риске ВСС. Наш метод может позволить врачам скрининг больших групп людей и выявление тех, кто находится в повышенном риске ВСС. Это может позволить регулярное наблюдение за этими людьми и, возможно, предотвращение ВСС у некоторых из них.

artmaro 6 мар 2024 в 09:05

Как защитить бизнес при внедрении LLM (часть 2)

Средний

8 мин

2.9K

Блог компании Конференции Олега Бунина (Онтико)Блог компании RaftИнформационная безопасность * Машинное обучение *

Новый мир с LLM — прекрасен! Нам, инженерам, он открывает много перспектив. А тем, кто его незаконно использует — предоставляет новые страшные инструменты. Как же защитить свой бизнес от угроз нейросетей?

Меня зовут Евгений Кокуйкин и я — руководитель AI продуктов компании Raft. Занимаюсь внедрением технологий искусственного интеллекта. В течение карьеры работал с протоколами баз данных, проводил фишинговые тренинги и аудит веб приложений. Продолжу рассказывать про безопасность решений на больших языковых моделях!

s_valuev 6 мар 2024 в 08:30

Ликбез по Data Governance, защита LLM, рейтинг BI-инструментов и другие новинки в мире ML и DA

Средний

7 мин

3.4K

Блог компании SelectelBig Data * IT-компанииИскусственный интеллектМашинное обучение *

Дайджест

✏️ Технотекст 7

Привет, Хабр! После перерыва возвращаюсь с новым выпуском полезных материалов, которые помогут лучше разобраться в ML, AI и дата-аналитике. Сегодня в программе — эволюция СУБД, миграция с Apache Druid на ClickHouse и подходы к экономии ресурсов для инфраструктуры. Еще больше полезных материалов — в Telegram-сообществе «MLечный путь».

Читать дальше →

+26

Dmytro_Kikot 6 мар 2024 в 08:05

Дивергентное мышление: человек vs GPT-4

10 мин

6.2K

Блог компании ua-hosting.companyНаучно-популярноеМашинное обучение * Искусственный интеллект

За последние годы применение больших языковых моделей искусственного интеллекта стало крайне распространенным явлением. Популярность ChatGPT повлекла за собой море дискуссий на тему правильности применения таких систем как с практической, так и с этической стороны вопроса. Рассматривая тот или иной ИИ, ученые сравнивают его возможностями с возможностями человеческого мозга. К примеру, ученые из университета Арканзаса (США) провели исследование, в ходе которого сравнивали креативное мышление людей и ChatGPT-4. Какие параметры сравнивались, как себя показал ChatGPT, и какие выводы можно сделать по результатам данного исследования? Ответы на эти вопросы мы найдем в докладе ученых.

Читать дальше →

Serg_SH 6 мар 2024 в 07:37

Типовой процесс разработки решений на базе ИИ и типовые ошибки при их внедрении

6 мин

3.9K

Блог компании ГК ICLИскусственный интеллектМашинное обучение * Управление разработкой *

Мнение

Когда мы говорим про решения на базе ИИ, кто-то может представлять себе просто обученные модели машинного обучения или нейросети, кто-то магический черный ящик, который умеет «делать магию» и желательно с «точностью 100%», а кто-то просто кусок кода, который надо заставить работать. И с определенной точки зрения каждый будет прав. Кто и в какой части прав, как все происходит чаще всего и какие типовые ошибки ждут на пути внедрения решений на базе ИИ – об этом решил рассказать в статье ниже.

MediascopeTeam 6 мар 2024 в 07:30

Как мы делали корпоративный чемпионат по Python

Средний

7 мин

Блог компании MediascopePython * Машинное обучение *

Кейс

Большинство сотрудников Mediascope используют Python для решения повседневных задач: разрабатывают модели машинного обучения, пишут код для веб-сервисов, анализируют данные, автоматизируют рутинные процессы. В прошлом году мы провели корпоративный чемпионат, который помог повысить мотивацию к изучению Python и оживить внутреннее комьюнити. А ещё чемпионат получил продолжение: модель из ML-трека стала прототипом во внутреннем конвейере обработки данных. Расскажем, как это было.

1 2 ...

150 151

152

153 154 ...

466 467

Машинное обучение *

Как мы делаем веб-сервис для автоматизации рабочих задач на базе агентов LLM

Стекинг и блендинг в ML. Ключевые особенности и реализация с нуля на Python

Контекст больше не предел: Линейка русскоязычных энкодеров ruRoPEBert и как она создавалась

Как AI помогает побороть монополию в спортивной рекламе и при чем тут GPU и выделенные серверы

Я написал бесплатную книгу для профессионалов в области AI (и не только)

Создание генетического алгоритма для нейросети и нейроcети для графических игр и видеоигр с помощью Python и NumPy

Метод главных компонент (PCA). Принцип работы и реализация с нуля на Python

Nearest-Neighbors (python 3)

Кластеризация в ML: от теоретических основ популярных алгоритмов к их реализации с нуля на Python

Платформа Rasa в действии: оценка работы виртуального ассистента с помощью конвейера данных диалогов и аналитики

Выбор данных, малые языковые модели и причём здесь Шмидхубер

Звоните Кузе: как мы записали FAQ для инженеров

WaveSync: Новый путь к нелинейному анализу эмбеддингов

Ближайшие события

Портретная гармонизация изображений

Модель глубокого обучения, использующая данные ЭКГ для прогнозирования риска внезапной сердечной смерти

Как защитить бизнес при внедрении LLM (часть 2)

Ликбез по Data Governance, защита LLM, рейтинг BI-инструментов и другие новинки в мире ML и DA

Дивергентное мышление: человек vs GPT-4

Типовой процесс разработки решений на базе ИИ и типовые ошибки при их внедрении

Как мы делали корпоративный чемпионат по Python

Вклад авторов