Машинное обучение *

Основа искусственного интеллекта

СтатьиПостыНовостиАвторыКомпании

beeline_cloud 10 апр 2024 в 17:13

Векторные СУБД и другие инструменты для разработки ML-моделей

Средний

6 мин

5.4K

Блог компании Beeline CloudВысоконагруженные системы * Машинное обучение * Хранение данных * Data Mining *

Обзор

На фоне развития генеративных и больших языковых моделей набирают обороты векторные базы данных. В прошлый раз в блоге beeline cloud мы обсудили, насколько этот тренд устойчив, а также предложили несколько книг для желающих погрузиться в тему. Сегодня же мы собрали компактную подборку открытых СУБД и поисковых движков, способных помочь в разработке систем ИИ. Обсуждаем такие инструменты, как Lantern, LanceDB, CozoDB, ArcadeDB, Dart Vector DB, Marqo и Orama.

AlekseiPodkletnov 10 апр 2024 в 05:55

Как работают алгоритмы музыкальных стримингов. Разбираем на примере

9 мин

14K

ЗвукИскусственный интеллектЧитальный залМашинное обучение * Алгоритмы *

Кажется, что рекомендательный движок музыкального сервиса - это черный ящик. Берет кучу данных на входе, выплевывает идеальную подборку лично для вас на выходе. В целом это и правда так, но что конкретно делают алгоритмы в недрах музыкальных рекомендаций? Разберем основные подходы и техники, иллюстрируя их конкретными примерами.

Начнем с того, что современные музыкальные сервисы не просто так называются стриминговыми. Одна из их ключевых способностей - это выдавать бесконечный поток (stream) треков. А значит, список рекомендаций должен пополняться новыми композициями и никогда не заканчиваться. Нет, безусловно, собственноручно найти свои любимые песни и слушать их тоже никто не запрещает. Но задача стримингов именно в том, чтобы помочь юзеру не потеряться среди миллионов треков. Ведь прослушать такое количество композиций самостоятельно просто физически нереально!

Так как они это делают?

+35

splatt 9 апр 2024 в 19:43

Создаем изометрические уровни игры с помощью Stable Diffusion

Простой

5 мин

25K

Машинное обучение * Дизайн игр * Разработка игр *

Туториал

Всем привет. Сегодня я покажу вам, как можно создавать 2.5D уровни в изометрии с помощью быстрого прототипирования техникой grayboxing, и генеративного искусственного интеллекта, а именно Stable Diffusion. Практически весь процесс, описываемый в статье, довольно легко автоматизируется.

Если интересно, добро пожаловать под кат.

+83

MarselMM 9 апр 2024 в 15:33

Задача Эйнштейна — большой тест LLM нейросетей на логическое мышление

28 мин

14K

Машинное обучение * Искусственный интеллект

Я был вдохновлен ранее вышедшей статьей автора MikeMSN - "Задача Эйнштейна. ChatGPT, YaGPT2, Gigachat, Mistral Large" и решил провести большой тест наиболее популярных LLM нейросетей. Использовал для этого сайт Chatbot Arena, а также свой компьютер, на котором можно запустить локальные LLM нейронные сети.

derunat 9 апр 2024 в 09:14

Как устроен RAPTOR — новый подход для RAG, который понимает контекст сразу всей книги

Средний

4 мин

3.5K

Блог компании НТРМашинное обучение * Искусственный интеллект

Обзор

Помните, как на школьных уроках литературы иногда надо было развернуто ответить на вопрос о сюжетной линии героя или каком-то событии книги? Например, объяснить мотивацию и развитие Евгения Онегина. Чтобы ответить на этот вопрос на пятёрку, мало пролистать краткий пересказ романа — придётся прочитать его весь.

Примерно для этого в 2020 году предложили RAG (retrieval-augmented generation) методы. Есть и другая мотивация для RAG — после обучения LLM на большой базе данных возникает вопрос, что делать с обновлением этой самой базы. Дообучение — не беспроигрышный вариант, так как это не всегда удобно для гигантских объемов данных. В базовом подходе RAG база знаний нарезается на небольшие куски текста, chunks, в 100-1000 слов, которые в виде эмбеддингов хранятся, как правило, в векторной БД, пока не понадобятся. Запросы пользователя дополняются найденными чанками в качестве контекста и выглядят для модели как один большой запрос.

Так вот, большинство существующих RAG методов способны переварить только небольшое количество достаточно коротких и последовательных чанков. Это ограничивает возможность оперировать крупномасштабным контекстом. Возвращаясь к уроку литературы, если перед тем, как выдать ответ, прочитать несколько последовательных строф романа, этого явно будет недостаточно. Недавно вышедшая Стэнфордская статья RAPTOR: Recursive Abstractive Processing for Tree-organized Retrieval призвана решить эту проблему. Основная идея заключается в том, чтобы обобщать отдельные куски большого материала, затем обобщать обобщения и так дальше.

JediPhilosopher 9 апр 2024 в 07:54

Разворачиваем ML модель с использованием ONNX на Android в километре над землей

Средний

8 мин

4.1K

Android * Машинное обучение *

Туториал

Иногда в жизни программиста возникают интересные задачи. Например, как перенести полученную ML модель, созданную в Python, на Android смартфон. Потому что этот самый смартфон пристегнут к параплану, висящему в километре над землей, а модель должна помогать пилоту лучше искать восходящие потоки.

Интернета в полете при этом обычно нет, так что вариант с доступом к удаленному Python-серверу по API отпадает. Ноутбук с запущенным Jupyter с собой тоже не возьмешь.

На помощь приходит промежуточный формат ONNX, созданный для обмена ML моделями между разными системами. Под катом описание того, как сконвертировать модель в этот формат и как загрузить и использовать ее в Android приложении.

snk4tr 9 апр 2024 в 07:15

Открываем YandexART API и рассказываем, как мы учили нейросеть создавать картинки, которые понравятся людям

16 мин

21K

Блог компании ЯндексБлог компании Yandex Cloud & Yandex InfrastructureОбработка изображений * Машинное обучение * Искусственный интеллект

✏️ Технотекст 7

В Yandex Cloud с сегодняшнего дня открыт доступ к тестированию API YandexART — нейросети для генерации изображений и анимаций, которая лежит в основе приложения Шедеврум. Протестировать API можно в сервисе Foundation Models, в котором доступно несколько моделей машинного обучения, включая YandexGPT для генерации текстов и эмбеддинги для задач семантического поиска.

+38

ksenia-plesovskikh 8 апр 2024 в 11:36

Можно ли научить чат-бота всегда говорить правду. Часть 2

Средний

10 мин

2.8K

Блог компании Группа IT-компаний LadМашинное обучение * Искусственный интеллект

Обзор

Эта статья является продолжением анализа существующих способов устранения галлюцинаций чат-ботов и повышения точности их ответа. В прошлый раз был разбор того, как оценивать точность в процессе диалога, а сегодня мы поговорим о методах, которые из научного сообщества уже проникли в такую библиотеку как llamaIndex, но еще не получили освещения на Хабре.

Часть первая тут.

Как пользователи, мы хотим иметь возможность просто загрузить все нужные нам документы в RAG и пользоваться ими без дополнительных настроек. Большинство традиционных подходов RAG также используют полученные документы “как есть”, без проверок, являются ли эти документы релевантными или нет. Более того, современные методы в основном рассматривают полные документы как справочные знания, как во время поиска, так и во время использования. Но значительная часть текста в этих извлеченных документах часто не важна для генерации и только затрудняет поиск релевантной информации. А если результат работы ретривера окажется низкого качества, есть большая вероятность получить галлюцинацию в ответе.

Для решения проблемы можно двигаться в нескольких направлениях.

ggospodinov 8 апр 2024 в 06:50

GigaAM: класс открытых моделей для обработки звучащей речи

Средний

10 мин

22K

Блог компании SberDevicesИскусственный интеллектМашинное обучение * Open source *

Салют, Хабр! Ранее мы в SberDevices анонсировали предобученную на русском языке модель GigaAM (Giga Acoustic Model) и её дообученные состояния под распознавание речи (GigaAM-CTC) и определение эмоций (GigaAM-Emo). Сегодня же делимся с сообществом весами моделей и примерами использования.

Приглашаем под кат погрузиться в self-supervised learning для звучащей речи и оценить возможности предобученных моделей!

+30

The-Founder-1 8 апр 2024 в 05:56

Объединить большие языковые модели реально с помощью mergekit?

Средний

13 мин

3.7K

Машинное обучение *

Туториал

Перевод

Искусственный интеллект развивается, используя подход, аналогичный коллективному интеллекту людей. Вместо одной мощной системы, разработчики создают много маленьких систем с разными специализациями, которые взаимодействуют между собой.

Сейчас в открытом доступе уже есть огромное количество ИИ-моделей, которые разработчики улучшают и комбинируют, чтобы создавать новые модели для более глубоких и сложных задач. И нынешние технологии позволяют им делать это, не тратя много времени и ресурсов на обучение.

Слияние моделей — это методика, которая объединяет две или более LLM-модели в одну. Это относительно новый и экспериментальный метод создания новых моделей без использования GPU, а значит, недорого. И да, это работает. Причем работает на удивительно хорошо, что в результате дает множество современных моделей на доске лидеров Open LLM.

Сегодня мы рассмотрим, как работает объединение больших языков моделей с использованием библиотеки mergekit. Если более конкретно, то мы рассмотрим четыре метода слияния и предоставим примеры конфигураций. Затем мы воспользуемся mergekit для создания собственной модели, Marcoro14-7B-slerp, которая стала самой эффективной моделью на доске лидеров Open LLM (02/01/2024).

Код доступен на GitHub и Google Colab. Кстати, для простого запуска mergekit можно использовать LazyMergekit.

SGarik 6 апр 2024 в 15:18

Автоматизированная торговля акциями с использованием глубокого обучения с подкреплением

Средний

7 мин

15K

Блог компании OTUSМашинное обучение * Финансы в IT

Туториал

В этой статье мы начинаем рассматривать практическое применение библиотеки FinRL для построения торгового агента. В предыдущей статье мы вкратце рассмотрели библиотеку FinRL, предоставляемые ей возможности моделирования рынка и обучения торговых агентов на основании алгоритмов обучения с подкреплением.

Это вторая статья нашего обучающего цикла и в ней мы построим примитивного агента, который анализирует поступающие данные о стоимости позиции на рынке и пытается предсказать будущую цену. Вполне очевидно, что результат такого примитивного агента будет весьма далек от приемлемого уровня, но этот шаг поможет нам создать модель рынка с помощью библиотеки FinRL, обучить агента и быть готовыми к построению более сложных и осмысленных моделей.

+15

Datactive 6 апр 2024 в 08:30

Анализ новостей с помощью сегментации и кластеризации временных рядов

10 мин

9.4K

Блог компании OTUSPython * Визуализация данных * Машинное обучение *

Из песочницы

В Отусе я прошла курс ML Advanced и открыла для себя интересные темы, связанные с анализом временных рядов, а именно, их сегментацию и кластеризацию. Я решила позаимствовать полученные знания для своей дипломной университетской работы по ивент-анализу социальных явлений и событий и описать часть этого исследования в данной статье.

Шаг 1. Сбор данных

В качестве источника данных я взяла информационно-новостной ресурс Лента.ру, так как с него легко парсить данные, новости разнообразны и пополняются в большом объеме ежедневно. Для теста я спарсила новости за последний год (март 2023 – март 2024) с помощью питоновских BeautifulSoup и requests.

В коде происходит процедура сбора заголовка, даты и тематики новостей:

+17

zhannazhanna 5 апр 2024 в 08:23

Fashion is ML profession! Материалы митапа

2 мин

1.6K

Блог компании Lamoda TechМашинное обучение * Разработка под e-commerce * Big Data *

Репортаж

Использование ML в онлайн-шоппинге не ограничивается рекомендациями товаров. Покупать одежду и обувь проще, когда у любого бренда ты знаешь нужный размер, видишь удачное сочетания товаров и легко находишь похожие внешне или по цвету вещи.

В Lamoda Tech мы создаем продукты, которые решают самые разные задачи пользователей и бизнеса. На митапе 28 марта мы рассказали, какие ML-модели работают у нас в проде и как мы строили эту работу.

Делимся с вами видео выступлений и презентациями.

veseluha 4 апр 2024 в 15:00

Как обнаружить галлюцинации в LLM?

Средний

10 мин

5.5K

Блог компании BotHubМашинное обучение * Искусственный интеллект

Туториал

LLM продолжают свое пребывание в центре технологических дискуссий. Они трансформируют наши взаимодействия с технологиями, поскольку предоставляют возможность усовершенствованной работы в обработке и генерации текстов. Однако и упомянутые модели не идеальны, так как одна из их самых значительных проблем - галлюцинации, критическое препятствие в развитии LLM, возникающие в основном из-за качества обучающих данных, поскольку они могут быть неполными или противоречивыми.

Для эффективной работы с LLM крайне важно понимать что такое, эти "галлюцинации" и как их обнаружить. В статье мы опробуем обнаружение галлюцинаций, исследуя различные метрики сходства текста, и проанализируем их релевантность.

AleksandrKliushev 4 апр 2024 в 14:56

Как мы реализовали текстовый поиск за 48 часов

Простой

5 мин

3.2K

Блог компании ЦианМашинное обучение *

Кейс

В компании Циан (где я, Клюшев Александр, и работаю в роли ML-инженера) проводятся внутренние хакатоны, и один из таких проходил в начале лета 2023. Достаточно давно в компании обсуждали идею по реализации поиска объявлений через текстовую строку, и было принято решение эту идею воплотить в жизнь. В статье я расскажу, как выглядит флоу поиска, какую мы использовали модель и какие результаты получили.

+13

itmo_nsslab 4 апр 2024 в 14:04

Open Source в российском ИИ: исследование ландшафта

Простой

7 мин

2.9K

Блог компании ИТМОИскусственный интеллектМашинное обучение * GitHub * Open source *

Аналитика

Привет, Хабр!

Это исследователи из NSS Lab ИТМО и создатели сообщества ITMO.OpenSource. Мы считаем, что важно делать не просто науку, а открытую науку, результатами которой можно легко воспользоваться. Поэтому пишем об открытом коде, проводим митапы «Scientific Open Source» и разрабатываем научные решения с открытым кодом. Эта статья написана на материале исследования, которое мы презентовали на последнем митапе. В ней поговорим об открытом научном коде, посмотрим, как с ним обстоят дела в разных организациях, и поделимся подборкой репозиториев, которые могут решать различные научные задачи.

+16

Rubcov 4 апр 2024 в 10:42

Размышления о высококачественных данных, собранных людьми

Сложный

19 мин

4.9K

Блог компании Magnus TechData Engineering * Natural Language Processing * Машинное обучение *

Перевод

Высококачественные данные — это «топливо» для современных моделей глубокого обучения. Большая часть данных, размеченных под конкретные задачи, создается живыми людьми — аннотаторами, которые занимаются классификацией или проводят RLHF-разметку для LLM alignment. Многие из представленных в этой публикации методов машинного обучения могут помочь улучшить качество данных, но главным остается внимание к деталям и скрупулёзность.

Сообщество разработчиков машинного обучения осознает ценность высококачественных данных, но почему-то складывается впечатление, что «все хотят работать над моделями, а не над данными» (Sambasivan et al. 2021).

Рисунок 1. Два направления обеспечения высокого качества данных.

Читать дальше →

+24

ddimitrov 4 апр 2024 в 09:54

Kandinsky 3.1 — новая быстрая модель генерации изображений по тексту

Средний

15 мин

35K

Блог компании СберБлог компании SberDevicesОбработка изображений * Машинное обучение * Natural Language Processing *

Обзор

Прошёл ровно год с момента релиза модели Kandinsky 2.1 — именно эта модель принесла известность нашей исследовательской группе Sber AI Research и дала толчок развитию всей линейки моделей Kandinsky. В честь этой даты мы выпускаем новую версию модели Kandinsky 3.1, о которой я расскажу подробнее в этой статье.

+69

KionX 4 апр 2024 в 08:09

Идеи улучшения точности, удобства и скорости языковых моделей

3 мин

Машинное обучение *

Из песочницы

Я не специалист, и это не статья, а список моих идей для улучшения работы языковых моделей. К сожалению хорошо проверить это не имею возможности. Нигде не встречал таких идей. Интересно узнать мнения о них.

Технический текст.

Читать 10 идей

Aremys 3 апр 2024 в 20:00

Введение в нейросети: что, зачем и как?

Средний

25 мин

59K

Python * Математика * Машинное обучение * Искусственный интеллект

Туториал

Из песочницы

✏️ Технотекст 2023

Это модное слово всё чаще используется в разговорной речи: обывателей плотнее окутывают угрозами бунта искусственного интеллекта и войны с роботами — с одной стороны, и рекламой нейросетевых продуктов — с другой. Отдельный котёл в аду — для тех, кто впаривает «курсы дата‑саентистов». А когда бедный юзернейм в поисках истины обращается к ~~Гуглу~~ своему любимому поисковику — то вместо простого ответа на простой вопрос, получает ещё больше вопросов — таких как тензорфлоу, сигмоида и, не дай Бог, линейная алгебра.

Как же нейросети рисуют картинки?

+51

1 2 ...

145 146

147

148 149 ...

466 467

Машинное обучение *

Векторные СУБД и другие инструменты для разработки ML-моделей

Как работают алгоритмы музыкальных стримингов. Разбираем на примере

Создаем изометрические уровни игры с помощью Stable Diffusion

Задача Эйнштейна — большой тест LLM нейросетей на логическое мышление

Как устроен RAPTOR — новый подход для RAG, который понимает контекст сразу всей книги

Разворачиваем ML модель с использованием ONNX на Android в километре над землей

Открываем YandexART API и рассказываем, как мы учили нейросеть создавать картинки, которые понравятся людям

Можно ли научить чат-бота всегда говорить правду. Часть 2

GigaAM: класс открытых моделей для обработки звучащей речи

Объединить большие языковые модели реально с помощью mergekit?

Автоматизированная торговля акциями с использованием глубокого обучения с подкреплением

Анализ новостей с помощью сегментации и кластеризации временных рядов

Fashion is ML profession! Материалы митапа

Ближайшие события

Как обнаружить галлюцинации в LLM?

Как мы реализовали текстовый поиск за 48 часов

Open Source в российском ИИ: исследование ландшафта

Размышления о высококачественных данных, собранных людьми

Kandinsky 3.1 — новая быстрая модель генерации изображений по тексту

Идеи улучшения точности, удобства и скорости языковых моделей

Введение в нейросети: что, зачем и как?

Вклад авторов