Машинное обучение *

Основа искусственного интеллекта

Статьи Посты Новости Авторы Компании

splatt 9 апр в 22:43

Создаем изометрические уровни игры с помощью Stable Diffusion

Простой

5 мин

19K

Разработка игр*Машинное обучение*Дизайн игр*

Туториал

Всем привет. Сегодня я покажу вам, как можно создавать 2.5D уровни в изометрии с помощью быстрого прототипирования техникой grayboxing, и генеративного искусственного интеллекта, а именно Stable Diffusion. Практически весь процесс, описываемый в статье, довольно легко автоматизируется.

Если интересно, добро пожаловать под кат.

+84

MarselMM 9 апр в 18:33

Задача Эйнштейна — большой тест LLM нейросетей на логическое мышление

28 мин

3.4K

Машинное обучение*Искусственный интеллект

Я был вдохновлен ранее вышедшей статьей автора MikeMSN - "Задача Эйнштейна. ChatGPT, YaGPT2, Gigachat, Mistral Large" и решил провести большой тест наиболее популярных LLM нейросетей. Использовал для этого сайт Chatbot Arena, а также свой компьютер, на котором можно запустить локальные LLM нейронные сети.

derunat 9 апр в 12:14

Как устроен RAPTOR — новый подход для RAG, который понимает контекст сразу всей книги

Средний

4 мин

934

Блог компании НТРМашинное обучение*Искусственный интеллект

Обзор

Помните, как на школьных уроках литературы иногда надо было развернуто ответить на вопрос о сюжетной линии героя или каком-то событии книги? Например, объяснить мотивацию и развитие Евгения Онегина. Чтобы ответить на этот вопрос на пятёрку, мало пролистать краткий пересказ романа — придётся прочитать его весь.

Примерно для этого в 2020 году предложили RAG (retrieval-augmented generation) методы. Есть и другая мотивация для RAG — после обучения LLM на большой базе данных возникает вопрос, что делать с обновлением этой самой базы. Дообучение — не беспроигрышный вариант, так как это не всегда удобно для гигантских объемов данных. В базовом подходе RAG база знаний нарезается на небольшие куски текста, chunks, в 100-1000 слов, которые в виде эмбеддингов хранятся, как правило, в векторной БД, пока не понадобятся. Запросы пользователя дополняются найденными чанками в качестве контекста и выглядят для модели как один большой запрос.

Так вот, большинство существующих RAG методов способны переварить только небольшое количество достаточно коротких и последовательных чанков. Это ограничивает возможность оперировать крупномасштабным контекстом. Возвращаясь к уроку литературы, если перед тем, как выдать ответ, прочитать несколько последовательных строф романа, этого явно будет недостаточно. Недавно вышедшая Стэнфордская статья RAPTOR: Recursive Abstractive Processing for Tree-organized Retrieval призвана решить эту проблему. Основная идея заключается в том, чтобы обобщать отдельные куски большого материала, затем обобщать обобщения и так дальше.

JediPhilosopher 9 апр в 10:54

Разворачиваем ML модель с использованием ONNX на Android в километре над землей

Средний

8 мин

1.3K

Разработка под Android*Машинное обучение*

Туториал

Иногда в жизни программиста возникают интересные задачи. Например, как перенести полученную ML модель, созданную в Python, на Android смартфон. Потому что этот самый смартфон пристегнут к параплану, висящему в километре над землей, а модель должна помогать пилоту лучше искать восходящие потоки.

Интернета в полете при этом обычно нет, так что вариант с доступом к удаленному Python-серверу по API отпадает. Ноутбук с запущенным Jupyter с собой тоже не возьмешь.

На помощь приходит промежуточный формат ONNX, созданный для обмена ML моделями между разными системами. Под катом описание того, как сконвертировать модель в этот формат и как загрузить и использовать ее в Android приложении.

snk4tr 9 апр в 10:15

Открываем YandexART API и рассказываем, как мы учили нейросеть создавать картинки, которые понравятся людям

16 мин

11K

Блог компании ЯндексБлог компании Yandex Cloud & Yandex InfrastructureОбработка изображений*Машинное обучение*Искусственный интеллект

В Yandex Cloud с сегодняшнего дня открыт доступ к тестированию API YandexART — нейросети для генерации изображений и анимаций, которая лежит в основе приложения Шедеврум. Протестировать API можно в сервисе Foundation Models, в котором доступно несколько моделей машинного обучения, включая YandexGPT для генерации текстов и эмбеддинги для задач семантического поиска.

+37

ksenia-plesovskikh 8 апр в 14:36

Можно ли научить чат-бота всегда говорить правду. Часть 2

Средний

10 мин

1.7K

Машинное обучение*Искусственный интеллект

Обзор

Эта статья является продолжением анализа существующих способов устранения галлюцинаций чат-ботов и повышения точности их ответа. В прошлый раз был разбор того, как оценивать точность в процессе диалога, а сегодня мы поговорим о методах, которые из научного сообщества уже проникли в такую библиотеку как llamaIndex, но еще не получили освещения на Хабре.

Часть первая тут.

Как пользователи, мы хотим иметь возможность просто загрузить все нужные нам документы в RAG и пользоваться ими без дополнительных настроек. Большинство традиционных подходов RAG также используют полученные документы “как есть”, без проверок, являются ли эти документы релевантными или нет. Более того, современные методы в основном рассматривают полные документы как справочные знания, как во время поиска, так и во время использования. Но значительная часть текста в этих извлеченных документах часто не важна для генерации и только затрудняет поиск релевантной информации. А если результат работы ретривера окажется низкого качества, есть большая вероятность получить галлюцинацию в ответе.

Для решения проблемы можно двигаться в нескольких направлениях.

ggospodinov 8 апр в 09:50

GigaAM: класс открытых моделей для обработки звучащей речи

Средний

10 мин

6.2K

Блог компании SberDevicesOpen source*Машинное обучение*Искусственный интеллект

Салют, Хабр! Ранее мы в SberDevices анонсировали предобученную на русском языке модель GigaAM (Giga Acoustic Model) и её дообученные состояния под распознавание речи (GigaAM-CTC) и определение эмоций (GigaAM-Emo). Сегодня же делимся с сообществом весами моделей и примерами использования.

Приглашаем под кат погрузиться в self-supervised learning для звучащей речи и оценить возможности предобученных моделей!

+30

The-Founder-1 8 апр в 08:56

Объединить большие языковые модели реально с помощью mergekit?

Средний

13 мин

Машинное обучение*

Туториал

Перевод

Искусственный интеллект развивается, используя подход, аналогичный коллективному интеллекту людей. Вместо одной мощной системы, разработчики создают много маленьких систем с разными специализациями, которые взаимодействуют между собой.

Сейчас в открытом доступе уже есть огромное количество ИИ-моделей, которые разработчики улучшают и комбинируют, чтобы создавать новые модели для более глубоких и сложных задач. И нынешние технологии позволяют им делать это, не тратя много времени и ресурсов на обучение.

Слияние моделей — это методика, которая объединяет две или более LLM-модели в одну. Это относительно новый и экспериментальный метод создания новых моделей без использования GPU, а значит, недорого. И да, это работает. Причем работает на удивительно хорошо, что в результате дает множество современных моделей на доске лидеров Open LLM.

Сегодня мы рассмотрим, как работает объединение больших языков моделей с использованием библиотеки mergekit. Если более конкретно, то мы рассмотрим четыре метода слияния и предоставим примеры конфигураций. Затем мы воспользуемся mergekit для создания собственной модели, Marcoro14-7B-slerp, которая стала самой эффективной моделью на доске лидеров Open LLM (02/01/2024).

Код доступен на GitHub и Google Colab. Кстати, для простого запуска mergekit можно использовать LazyMergekit.

Golangcoder 7 апр в 18:03

Дайджест полезных находок, инструментов, статей и видео из мира машинного обучения

Простой

3 мин

2.8K

Машинное обучение*

Каждую неделю мир машинного обучения наполняется новыми открытиями, проектами и статьями, которые не только вдохновляют дата саентистов, но и расширяют горизонты знаний. В этой статье мы собрали для вас подборку самых интересных и актуальных материалов недели, которые помогут вам быть в курсе последних тенденций и достижений. Погрузитесь в мир инноваций и узнайте о проектах, которые заслуживают вашего внимания.

Интересные библиотеки:

• Command R+ - Новая модель с открытым исходным кодом показывает крутые результаты на уровне с GPT-4 и Claude 3. 104 миллиарда параметров, 128к контекста

• LLocalSearch - полностью локально работающая система метапоиска, использующая LLM-агентов.

• MagicLens: новое семейство моделей для поиска изображений от Google.

• DINO-Tracker: Новая SOTA для отслеживания объектов.

• Stable Audio 2.0 — Stability AI представили нейросеть Stable Audio 2.0 для генерации треков с вокалом.

• SV3D - еще один проект от Stability AI- новая модель для реконструкции изображения в 3D в хорошем качетсве.

• Gaussian Head Avatar - качественная генерация ваш 3D-аватаров сразу с нескольких ракурсов.

• Financial Datasets - это библиотека Python с открытым исходным кодом, которая позволяет разработчикам создавать синтетические наборы финансовых данных с использованием больших языковых моделей

Что почитать:

— Как OpenAI создавали бота, который победил проигроков в Dota 2

— Аппаратные требования больших языковых моделей ИИ сокращаются вдвое каждые восемь месяцев

— Как обнаружить галлюцинации в LLM?

Читать

SGarik 6 апр в 18:18

Автоматизированная торговля акциями с использованием глубокого обучения с подкреплением

Средний

7 мин

11K

Блог компании OTUSМашинное обучение*Финансы в IT

Туториал

В этой статье мы начинаем рассматривать практическое применение библиотеки FinRL для построения торгового агента. В предыдущей статье мы вкратце рассмотрели библиотеку FinRL, предоставляемые ей возможности моделирования рынка и обучения торговых агентов на основании алгоритмов обучения с подкреплением.

Это вторая статья нашего обучающего цикла и в ней мы построим примитивного агента, который анализирует поступающие данные о стоимости позиции на рынке и пытается предсказать будущую цену. Вполне очевидно, что результат такого примитивного агента будет весьма далек от приемлемого уровня, но этот шаг поможет нам создать модель рынка с помощью библиотеки FinRL, обучить агента и быть готовыми к построению более сложных и осмысленных моделей.

+17

Datactive 6 апр в 11:30

Анализ новостей с помощью сегментации и кластеризации временных рядов

10 мин

4.9K

Блог компании OTUSPython*Визуализация данных*Машинное обучение*

Из песочницы

В Отусе я прошла курс ML Advanced и открыла для себя интересные темы, связанные с анализом временных рядов, а именно, их сегментацию и кластеризацию. Я решила позаимствовать полученные знания для своей дипломной университетской работы по ивент-анализу социальных явлений и событий и описать часть этого исследования в данной статье.

Шаг 1. Сбор данных

В качестве источника данных я взяла информационно-новостной ресурс Лента.ру, так как с него легко парсить данные, новости разнообразны и пополняются в большом объеме ежедневно. Для теста я спарсила новости за последний год (март 2023 – март 2024) с помощью питоновских BeautifulSoup и requests.

В коде происходит процедура сбора заголовка, даты и тематики новостей:

+20

zhannazhanna 5 апр в 11:23

Fashion is ML profession! Материалы митапа

2 мин

776

Блог компании Lamoda TechBig Data*Разработка под e-commerce*Машинное обучение*

Репортаж

Использование ML в онлайн-шоппинге не ограничивается рекомендациями товаров. Покупать одежду и обувь проще, когда у любого бренда ты знаешь нужный размер, видишь удачное сочетания товаров и легко находишь похожие внешне или по цвету вещи.

В Lamoda Tech мы создаем продукты, которые решают самые разные задачи пользователей и бизнеса. На митапе 28 марта мы рассказали, какие ML-модели работают у нас в проде и как мы строили эту работу.

Делимся с вами видео выступлений и презентациями.

veseluha 4 апр в 18:00

Как обнаружить галлюцинации в LLM?

Средний

10 мин

2.8K

Блог компании BotHubМашинное обучение*Искусственный интеллект

Туториал

LLM продолжают свое пребывание в центре технологических дискуссий. Они трансформируют наши взаимодействия с технологиями, поскольку предоставляют возможность усовершенствованной работы в обработке и генерации текстов. Однако и упомянутые модели не идеальны, так как одна из их самых значительных проблем - галлюцинации, критическое препятствие в развитии LLM, возникающие в основном из-за качества обучающих данных, поскольку они могут быть неполными или противоречивыми.

Для эффективной работы с LLM крайне важно понимать что такое, эти "галлюцинации" и как их обнаружить. В статье мы опробуем обнаружение галлюцинаций, исследуя различные метрики сходства текста, и проанализируем их релевантность.

AleksandrKliushev 4 апр в 17:56

Как мы реализовали текстовый поиск за 48 часов

Простой

5 мин

2.1K

Блог компании ЦианМашинное обучение*

Кейс

В компании Циан (где я, Клюшев Александр, и работаю в роли ML-инженера) проводятся внутренние хакатоны, и один из таких проходил в начале лета 2023. Достаточно давно в компании обсуждали идею по реализации поиска объявлений через текстовую строку, и было принято решение эту идею воплотить в жизнь. В статье я расскажу, как выглядит флоу поиска, какую мы использовали модель и какие результаты получили.

+16

itmo_nsslab 4 апр в 17:04

Open Source в российском ИИ: исследование ландшафта

Простой

7 мин

1.8K

Блог компании ИТМОOpen source*GitHub*Машинное обучение*Искусственный интеллект

Аналитика

Привет, Хабр!

Это исследователи из NSS Lab ИТМО и создатели сообщества ITMO.OpenSource. Мы считаем, что важно делать не просто науку, а открытую науку, результатами которой можно легко воспользоваться. Поэтому пишем об открытом коде, проводим митапы «Scientific Open Source» и разрабатываем научные решения с открытым кодом. Эта статья написана на материале исследования, которое мы презентовали на последнем митапе. В ней поговорим об открытом научном коде, посмотрим, как с ним обстоят дела в разных организациях, и поделимся подборкой репозиториев, которые могут решать различные научные задачи.

+19

Rubcov 4 апр в 13:42

Размышления о высококачественных данных, собранных людьми

Сложный

19 мин

3.8K

Блог компании Magnus TechМашинное обучение*Natural Language Processing*Data Engineering*

Перевод

Высококачественные данные — это «топливо» для современных моделей глубокого обучения. Большая часть данных, размеченных под конкретные задачи, создается живыми людьми — аннотаторами, которые занимаются классификацией или проводят RLHF-разметку для LLM alignment. Многие из представленных в этой публикации методов машинного обучения могут помочь улучшить качество данных, но главным остается внимание к деталям и скрупулёзность.

Сообщество разработчиков машинного обучения осознает ценность высококачественных данных, но почему-то складывается впечатление, что «все хотят работать над моделями, а не над данными» (Sambasivan et al. 2021).

Рисунок 1. Два направления обеспечения высокого качества данных.

Читать дальше →

+26

ddimitrov 4 апр в 12:54

Kandinsky 3.1 — новая быстрая модель генерации изображений по тексту

Средний

15 мин

17K

Блог компании СберБлог компании SberDevicesОбработка изображений*Машинное обучение*Natural Language Processing*

Обзор

Прошёл ровно год с момента релиза модели Kandinsky 2.1 — именно эта модель принесла известность нашей исследовательской группе Sber AI Research и дала толчок развитию всей линейки моделей Kandinsky. В честь этой даты мы выпускаем новую версию модели Kandinsky 3.1, о которой я расскажу подробнее в этой статье.

+72

KionX 4 апр в 11:09

Идеи улучшения точности, удобства и скорости языковых моделей

3 мин

836

Машинное обучение*

Из песочницы

Я не специалист, и это не статья, а список моих идей для улучшения работы языковых моделей. К сожалению хорошо проверить это не имею возможности. Нигде не встречал таких идей. Интересно узнать мнения о них.

Технический текст.

Читать 10 идей

Aremys 3 апр в 23:00

Введение в нейросети: что, зачем и как?

Средний

25 мин

33K

Python*Математика*Машинное обучение*Искусственный интеллект

Туториал

Из песочницы

Это модное слово всё чаще используется в разговорной речи: обывателей плотнее окутывают угрозами бунта искусственного интеллекта и войны с роботами — с одной стороны, и рекламой нейросетевых продуктов — с другой. Отдельный котёл в аду — для тех, кто впаривает «курсы дата‑саентистов». А когда бедный юзернейм в поисках истины обращается к ~~Гуглу~~ своему любимому поисковику — то вместо простого ответа на простой вопрос, получает ещё больше вопросов — таких как тензорфлоу, сигмоида и, не дай Бог, линейная алгебра.

Как же нейросети рисуют картинки?

+54

alexmusyka 3 апр в 21:51

Как я стал специалистом по машинному обучению. Open AI и Dota 2

Простой

7 мин

7.8K

Машинное обучение*Карьера в IT-индустрииИгры и игровые консолиIT-компании

Ретроспектива

Перевод

Грег Брокман - американский предприниматель, инвестор и разработчик ПО, один из основателей и президент компании OpenAI. Начал свою карьеру в компании Stripe в 2010 году и стал ее CTO в 2013 году. Покинул Stripe в 2015 году, чтобы стать соучредителем OpenAI, где он также взял на себя роль технического директора.

Первые три года существования OpenAI я мечтал стать экспертом в области машинного обучения, но мало продвигался к этой цели. За последние девять месяцев я наконец-то перешел к практической работе в области машинного обучения. Это было трудно, но не невозможно, и я думаю, что большинство людей, которые хорошо программируют и знают (или готовы изучать) математику, тоже могут это сделать. Существует множество онлайн-курсов для самостоятельного изучения технической стороны (тык, тык, тык и тык), и то, что оказалось моим самым большим препятствием, было ментальным барьером - смириться с тем, что я снова новичок.

1 2 3

5 6 ...

324 325

Машинное обучение *

Создаем изометрические уровни игры с помощью Stable Diffusion

Задача Эйнштейна — большой тест LLM нейросетей на логическое мышление

Как устроен RAPTOR — новый подход для RAG, который понимает контекст сразу всей книги

Разворачиваем ML модель с использованием ONNX на Android в километре над землей

Истории

Открываем YandexART API и рассказываем, как мы учили нейросеть создавать картинки, которые понравятся людям

Можно ли научить чат-бота всегда говорить правду. Часть 2

GigaAM: класс открытых моделей для обработки звучащей речи

Объединить большие языковые модели реально с помощью mergekit?

Дайджест полезных находок, инструментов, статей и видео из мира машинного обучения

Автоматизированная торговля акциями с использованием глубокого обучения с подкреплением

Анализ новостей с помощью сегментации и кластеризации временных рядов

Fashion is ML profession! Материалы митапа

Как обнаружить галлюцинации в LLM?

Ближайшие события

Как мы реализовали текстовый поиск за 48 часов

Open Source в российском ИИ: исследование ландшафта

Размышления о высококачественных данных, собранных людьми

Kandinsky 3.1 — новая быстрая модель генерации изображений по тексту

Идеи улучшения точности, удобства и скорости языковых моделей

Введение в нейросети: что, зачем и как?

Как я стал специалистом по машинному обучению. Open AI и Dota 2

Вклад авторов

Работа