Машинное обучение *

Основа искусственного интеллекта

Статьи Посты Новости Авторы Компании

Dmytro_Kikot 17 апр в 10:00

Голопалуба: реализация технологии из сериала «Звездный путь»

13 мин

1.5K

Блог компании ua-hosting.companyМашинное обучение*Научно-популярноеИскусственный интеллект

Современный мир сложно представить без технологий, которые его наполняют. Некоторые из них малозаметны, тогда как другие приковывают к себе внимание буквально всех и каждого. Одной из таких технологий является искусственный интеллект. Данное направление объединяет в себе множество отдельных, но взаимосвязанных ветвей, одной из которых является генеративный ИИ. Основная функция такого ИИ заключается в генерации текстов, изображений или других медиаданных в ответ на запрос человека. Говоря о таком взаимоотношении между человеком и машиной, первым на ум приходит крайне популярный ChatGPT. Но его возможности хоть и велики, но не безграничны. Ученые из Школы инженерии и прикладных наук Пенсильванского университета (США) разработали систему, способную в ответ на текстовый запрос пользователя генерировать трехмерную виртуальную среду, как это делала голопалуба в сериале «Звездный путь: Следующее поколение». Как работает данная система, насколько обширны ее возможности, и где она может быть полезна? Ответы на эти вопросы мы найдем в докладе ученых.

Читать дальше →

+14

dblmokk 15 апр в 17:04

Строим lineage моделей машинного обучения и признаков с помощью OpenMetadata

Средний

9 мин

9.3K

Блог компании билайнBig Data*Хранение данных*Машинное обучение*

Туториал

Привет, Хабр!

Мы в билайне любим машинное обучение. В какой-то момент моделей машинного обучения стало так много, что это вынудило нас решать определенные задачи. Я Дмитрий Ермилов, руковожу ML в дирекции по искусственному интеллекту и цифровым продуктам. О решении одной такой задачи и будет этот рассказ.

Давайте представим, что у вас в компании большое количество моделей машинного обучения, каждая из которой может зависеть от нескольких десятков до нескольких тысяч признаков (фич). Причем разные модели могут зависеть от одних и тех же фич. Неожиданно случается несчастье, и одна из популярных фич ломается. Может произойти поломка на уровне подготовки данных, могут измениться внешние источники, отвалиться интеграции и прочее. Что делать с этим знанием? Конечно, бежать в продуктовые команды и кричать, что модели, которые зависят от этой фичи, могут деградировать, то есть их метрики качества могут снизиться. Вопрос только в том, какие модели могут деградировать и в какие команды бежать?

Напомним, в каких условиях мы анализируем данные и строим модели машинного обучения.

+14

badcasedaily1 19 апр в 21:05

Пять лучших NLP инструментов для работы с русским языком на Python

Простой

5 мин

6.4K

Блог компании OTUSПрограммирование*Машинное обучение*Natural Language Processing*

Обзор

В этой статье рассмотрим пять лучших библиотек Python, предназначенных специально для работы с русским языком в контексте NLP. От базовых задач, таких как токенизация и морфологический анализ, до сложных задач обработки и понимания естественного языка.

+13

milewe 12 апр в 21:11

Простейшая нейронная сеть, мой опыт и выводы

Простой

6 мин

6.8K

Машинное обучение*

Из песочницы

Мой маленький шажок на пути подготовки к написанию шахматного движка. Написание простейшей нейронной сети, выяснение, что это за зверь такой.

+12

Cloud4Y 11 апр в 08:43

Как большие языковые модели в Street Fighter играли

Простой

4 мин

2.6K

Блог компании Cloud4YПрограммирование*Машинное обучение*Искусственный интеллектИгры и игровые консоли

Перевод

Что будет, если устроить совершенно новый тип тестирования для больших языковых моделей (LLM)? Например, выпустить несколько моделей на арену и заставить их соревноваться друг с другом?

Именно это я и решил сделать: столкнуть LLM друг с другом в классической аркаде Street Fighter III. Далее расскажу, как я создал эту арену и какие интересные наблюдения сделал во время битв LLM на виртуальных улицах Метро-Сити.

+12

slivka_83 29 апр в 18:34

Подбор гиперпараметров RAG-системы с помощью Optuna

Средний

16 мин

1.8K

Python*Data Mining*Машинное обучение*Искусственный интеллектNatural Language Processing*

Туториал

Сказ о том, как с помощью Opuna’ы сделать вашу RAG-систему чуточку (а может и не чуточку) эффективнее :)

+11

badcasedaily1 23 апр в 12:41

Разбираемся в ROC и AUC

Простой

6 мин

2.5K

Блог компании OTUSPython*Программирование*Машинное обучение*

Обзор

Привет, Хабр!

В машинном обучение очень важны метрики оценки эффективности моделей. Среди таких метрик есть: кривые ROC и показатель AUC. Они позволяют оценивать бинарные классификаторы.

В этой статье мы как раз и разберем их.

+11

dt_sicutglacies 19 апр в 12:21

Как общаться с базой знаний на естественном языке с помощью LLM и объективно оценить работу полученной системы

Простой

11 мин

3.6K

Блог компании DoubletappМашинное обучение*Искусственный интеллектNatural Language Processing*

Туториал

Привет, Хабр! Меня зовут Даниил, работаю в ML-отделе Doubletapp. В статье расскажу про особенности применения больших языковых моделей для оптимизации бизнес-процессов.

Большая языковая модель (LLM) — это тип языковой модели, который способен распознавать и генерировать осмысленные тексты, а также другие сложные типы данных (например, код). Такого рода модели обучаются на огромных массивах данных, чаще всего собранных из открытых источников.

Тем не менее LLM все еще имеют ряд проблем, одной из которых является галлюцинирование (придумывание фактов). Сложно винить модель за то, что она не знает, как устроен тот или иной процесс/продукт в вашей компании, и пытается придумать вразумительный ответ. Поэтому нужно подсказать LLM фактическую информацию, а она уже даст нам понятную человеку персонализированную реплику.

Такая система ответов на вопросы с использованием фактической информации называется RAG (Retrieval Augmented Generation).

Данная статья состоит из двух частей:

• мы рассмотрим построение RAG-системы на основе библиотеки langchain;

• объективно оценим работоспособность созданной системы, используя синтетические данные на русском языке с помощью фреймворка RAGAs.

+11

divolko3 14 апр в 11:00

Больше ИИ-инструментов, хороших и разных: Google представила помощника для написания кода

3 мин

5.9K

Блог компании МТСПрограммирование*Машинное обучение*Искусственный интеллектIT-компании

Всё больше компаний создают разнообразные ИИ-модели, и, конечно, крупные корпорации — впереди планеты всей. На днях Google представила свой новый проект — Gemini Code Assist, инструмент, который помогает разработчикам писать код. О том, что это за новинка и какие ей дали возможности — читайте под катом.

+11

efreelancer 26 апр в 10:00

Обучение модели токсификации текстов с помощью TorchTune, подробное руководство

Средний

11 мин

2.3K

Python*Машинное обучение*Искусственный интеллектNatural Language Processing*

Туториал

Приветствую, хабровчане!

Сегодня пятница, поэтому предлагаю немного пошалить и поговорить о слегка необычном, но весьма забавном проекте обучения нейросетевой модели на базе LLaMA2 7B, которая умеет превращать невинные предложения на русском языке в чуть более "токсичные" их версии.

Но обучать модель мы будем не абы как, а при помощи недавно вышедшего в свет проекта под названием TorchTune, так как надо ведь пробовать новые инструменты, иными словами, предлагаю соединить тему интересную с темой полезной.

Так что пристегнитесь, будет весело и слегка токсично!

+10

MaxRokatansky 17 апр в 21:20

Определение жанра фильма по описанию

17 мин

1.6K

Блог компании OTUSМашинное обучение*Искусственный интеллект

В ходе поиска темы проектной работы, которой должен был завершиться курс Machine Learning. Professional, я решил поэкспериментировать с данными о фильмах, мультфильмах, сериалах и прочей схожей продукции. Немного сожалея, что времени смотреть кинопродукцию у меня почти нет, приступим.

+10

ptsecurity 11 апр в 13:58

Как меняются методы расследования на Standoff: кейс аналитика PT Expert Security Center

Простой

14 мин

2.7K

Блог компании Positive TechnologiesИнформационная безопасность*Антивирусная защита*IT-инфраструктура*Машинное обучение*

Всем привет! Меня зовут Юлия Фомина, в Positive Technologies я занимаюсь проактивным поиском и обнаружением угроз, что в профессиональной среде называется threat hunting. И все эти знания наша команда превращает в экспертизу продуктов Positive Technologies. И конечно же, мы не только обогащаем наши продукты уникальной экспертизой, но и в буквальном смысле пробуем каждый продукт в деле. Сегодня поговорим про мой опыт работы с одной из наших новейших разработок — автопилотом MaxPatrol O2, а также о том, как он упростил нам работу при анализе и расследовании активности белых хакеров во время двенадцатой кибербитвы Standoff.

Читать

+10

Muliwe 28 апр в 09:17

LLM-чатбот в основе консьерж-сервиса

Простой

9 мин

1.1K

Машинное обучение*Искусственный интеллект

Кейс

Из песочницы

Когда мы с командой брались за создание MVP нашего консьерж-сервиса для букинга отелей, казалось, что это область, в которой давно не осталось нерешенных, и при этом значимых проблем, суть лишь в том, чтобы сделать сам процесс гибче и удобнее. Но на практике, разумеется, все оказалось несколько сложнее.

Использование стандартного набора инструментов в сочетании с новыми коммерческими API открыло перед нами не только новые горизонты, но и обеспечило массу подводных камней, вполне традиционных для такого рода технологических стартапов. О том, как мы с ними справлялись, мы и решили написать эту небольшую статью. Надеемся, что наши уроки помогут вам избежать наших ошибок и ускорить разработку вашего прототипа.

The-Founder-1 26 апр в 18:44

ViT для новичков: как нейросети научились определять зависимости в изображениях

Простой

8 мин

3.1K

Python*Обработка изображений*Математика*Машинное обучение*

Обзор

В этой статье мы попытаемся рассказать про трансформерную архитектуру VIT и предысторию его формирования. Сегодня не совсем понятно, почему этот "формат" нейронок настолько эффективен. Некоторые говорят механизм внимания, но некоторые практики делают больше ставок в области Computer Vision на MetaFormer. https://github.com/sail-sg/poolformer

Нейросети остаются для нас “теневым” процессом, подобным черному ящику. И изучение Deep Learning уже напоминает больше не математику, а биологию, где мы следим за поведением нашего детища.

AntonSoroka 18 апр в 14:20

Автоматически выделяем кусочно-линейные тренды временного ряда

Средний

7 мин

4.4K

Open source*Python*Математика*Машинное обучение*Статистика в IT

Из песочницы

Меня зовут Антон Сорока, я математик и аналитик данных.

Я хотел бы рассказать об алгоритме, который выделяет кусочно-линейный тренд из временного ряда и сам определяет точки изменения тренда. Другими словами, это алгоритм для автоматического кусочно-линейного приближения любой функции. Это может понадобиться, если вам важно анализировать линейные тренды ряда, но единственная линия явно недостаточно точно описывает ряд, и самостоятельно искать точки, где тренд менялся, неудобно. Реализация этого алгоритма есть в open-source библиотеке для анализа изменений временных рядов, написанной на Python.

rmilovanov 12 апр в 08:01

Как мы тестировали большие языковые модели для модерации отзывов

10 мин

2.1K

Блог компании Magnit TechМашинное обучение*Искусственный интеллектNatural Language Processing*

Кейс

В приложении «Магнит: акции и доставка» можно оставлять отзывы на товары. Отзывы модерируются: мы публикуем те, которые считаем полезными для других покупателей, — они должны описывать потребительские свойства товара. Отклоняем все остальные: как правило, это жалобы на ценники, сервис в магазине, условия хранения либо просто нерелевантные тексты. Отзывы с жалобами обрабатывают службы поддержки и сервиса.

Рассказываем о том, как мы попробовали применять большие языковые модели, чтобы автоматизировать модерацию отзывов.

CTSG 11 апр в 17:08

Распознавание лиц на микрокомпьютерах

9 мин

4.4K

Блог компании Crosstech Solutions GroupМашинное обучение*

Кейс

В последние годы появляется всё больше технологий с использованием Computer Vision: это и беспилотные автомобили, и Face ID в телефоне, и умные камеры, способные фиксировать утечку теплоизоляции крыши. Кто-то прогресс приветствует, кто-то нет, но неизменно одно – процесс этот неостановим. Особенно активно развивается технология распознавания лиц, которую мы разберем в этой статье. Только в этот раз вас ожидает не классический пайплайн системы, но разбор технологии на микрокопьютерах. Подготовил ее я, Саша Шувалов – аналитик-разработчик компании Кросстех Солюшнс Групп.

ph_piter 11 апр в 16:56

Книга «Разработка приложений на базе GPT-4 и ChatGPT»

11 мин

11K

Блог компании Издательский дом «Питер»Программирование*Машинное обучение*Искусственный интеллектNatural Language Processing*

Привет, Хаброжители!

Эта небольшая книга представляет собой подробное руководство для разработчиков на Python, желающих научиться создавать приложения с использованием больших языковых моделей. Авторы расскажут об основных возможностях и преимуществах GPT-4 и ChatGPT, а также принципах их работы. Здесь же вы найдете пошаговые инструкции по разработке приложений с использованием библиотеки поддержки GPT-4 и ChatGPT для Python, в том числе инструментов для генерирования текста, отправки вопросов и получения ответов и обобщения контента.

«Разработка приложений на базе GPT-4 и ChatGPT» содержит множество легковоспроизводимых примеров, которые помогут освоить особенности применения моделей в своих проектах. Все примеры кода на Python доступны в репозитории GitHub. Решили использовать возможности LLM в своих приложениях? Тогда вы выбрали правильную книгу.

Читать дальше →

JediPhilosopher 9 апр в 10:54

Разворачиваем ML модель с использованием ONNX на Android в километре над землей

Средний

8 мин

1.4K

Разработка под Android*Машинное обучение*

Туториал

Иногда в жизни программиста возникают интересные задачи. Например, как перенести полученную ML модель, созданную в Python, на Android смартфон. Потому что этот самый смартфон пристегнут к параплану, висящему в километре над землей, а модель должна помогать пилоту лучше искать восходящие потоки.

Интернета в полете при этом обычно нет, так что вариант с доступом к удаленному Python-серверу по API отпадает. Ноутбук с запущенным Jupyter с собой тоже не возьмешь.

На помощь приходит промежуточный формат ONNX, созданный для обмена ML моделями между разными системами. Под катом описание того, как сконвертировать модель в этот формат и как загрузить и использовать ее в Android приложении.

phillennium 26 апр в 14:04

Про ML по-серьёзному: что расскажут в докладах на I'ML

7 мин

1.4K

Блог компании JUG Ru GroupМашинное обучение*КонференцииИскусственный интеллектNatural Language Processing*

Слова «доклад про AI/ML» могут звучать словно очередной рассказ про будущее, где вкалывают роботы, а не человек. Такое мы все уже слышали сто раз.

Но на нашей онлайн-конференции I'ML всё будет иначе:
— Она рассчитана на тех, кто лично использует ML в проектах.
— Она не о далёком будущем, а о вопросах, актуальных уже здесь и сейчас.
— Она не об абстрактном («было бы здорово…»), а о конкретном: «как бороться с ML-галлюцинациями», «как рекомендовать размер одежды с помощью ML».
— Она не о том, как «нейросети отберут работу», а наоборот: о ML-работе, которую нейросети нам дали.

В общем, она не для желающих просто пофантазировать, а для специалистов, желающих эффективно работать.

А что именно там будет? До конференции остался месяц, и мы представляем Хабру её программу:

1 2

4 5 6

Машинное обучение *

Голопалуба: реализация технологии из сериала «Звездный путь»

Строим lineage моделей машинного обучения и признаков с помощью OpenMetadata

Пять лучших NLP инструментов для работы с русским языком на Python

Простейшая нейронная сеть, мой опыт и выводы

Истории

Как большие языковые модели в Street Fighter играли

Подбор гиперпараметров RAG-системы с помощью Optuna

Разбираемся в ROC и AUC

Как общаться с базой знаний на естественном языке с помощью LLM и объективно оценить работу полученной системы

Больше ИИ-инструментов, хороших и разных: Google представила помощника для написания кода

Обучение модели токсификации текстов с помощью TorchTune, подробное руководство

Определение жанра фильма по описанию

Как меняются методы расследования на Standoff: кейс аналитика PT Expert Security Center

LLM-чатбот в основе консьерж-сервиса

Ближайшие события

ViT для новичков: как нейросети научились определять зависимости в изображениях

Автоматически выделяем кусочно-линейные тренды временного ряда

Как мы тестировали большие языковые модели для модерации отзывов

Распознавание лиц на микрокомпьютерах

Книга «Разработка приложений на базе GPT-4 и ChatGPT»

Разворачиваем ML модель с использованием ONNX на Android в километре над землей

Про ML по-серьёзному: что расскажут в докладах на I'ML

Вклад авторов

Работа