Машинное обучение *

Основа искусственного интеллекта

Статьи Посты Новости Авторы Компании

kucev 22 мая в 10:00

Распознавание именованных сущностей: механизм, методики, сценарии использования и реализация

13 мин

1.4K

Data Mining*Big Data*Машинное обучение*Искусственный интеллектData Engineering*

Перевод

Естественные языки сложны. А когда на горизонте появляется контекст, они становятся ещё сложнее. Возьмём для примера фамилию Линкольн. Некоторые сразу подумают о шестнадцатом президенте США, выдающейся исторической фигуре. Однако для других это производитель автомобилей с тем же названием. Одно простое слово имеет разные значения.

Мы, люди, без проблем различаем значения и категории. Это свидетельствует о нашем интуитивном понимании окружающего мира. Но когда дело касается компьютеров, эта, казалось бы, простая задача превращается в неоднозначную проблему. Подобные трудности подчёркивают необходимость надёжного распознавания именованных сущностей (named entity recognition, NER) — механизма, при помощи которого мы учим машины понимать различные лингвистические нюансы.

В этой статье мы расскажем о том, что такое NER, о его принципах работы и о том, как оно используется в реальной жизни. Также в ней мы прольём свет на различные методики NER и способы реализации модели NER.

Читать дальше →

badcasedaily1 21 мая в 19:26

Основные алгоритмы многоруких бандитов в рекомендательных системах

Простой

6 мин

3.9K

Блог компании OTUSPython*Программирование*Машинное обучение*

Обзор

Рекомендательные системы становятся все более сложными и точными, а методы их реализации разнообразнее. Один из хороших подходов в этой области - это алгоритмы, основанные на проблеме многоруких бандитов. Эти алгоритмы позволяют анализировать предпочтения юзеров и адаптироваться к изменяющимся условиям.

Проблема многоруких бандитов представляет собой рамки принятия решений в условиях неопределенности. Основная задача состоит в том, чтобы выбрать руку или действие, которое предоставит наибольшую награду, при минимальных потерях в процессе исследования разных вариантов.

+14

Tapatakt 21 мая в 14:54

В остаточном потоке трансформеров представлена геометрия состояний их убеждений

Средний

15 мин

1.1K

Машинное обучение*Искусственный интеллект

Аналитика

Перевод

Какую вычислительную структуру мы встраиваем в LLM, когда обучаем их предсказанию следующего токена? В этом посте мы представляем свидетельство того, что это структура задаётся мета-закономерностями обновления убеждений о скрытых состояниях генерирующего данные процесса.

freQuensy23 21 мая в 11:47

Разбираем KAN по полочкам

4 мин

6.5K

Математика*Машинное обучение*

Аналитика

Недавно аспиранты из MIT выпустили очень интересную статью про концептуально новый подход к проектированию наверное самого базового "кирпичика" нейронок - полносвязного слоя.

Постараюсь дать небольшое описание того, что происходит под каптом кана, при этом не превращая публикацию в учебник по матанализу

+27

MaxRokatansky 20 мая в 15:36

Обнаружение аварийных твитов с использованием NLP

Простой

4 мин

1.1K

Блог компании OTUSМашинное обучение*Искусственный интеллект

Кейс

Всем привет!

Хочу поделиться своей проектной работой, которую написала в рамках курса OTUS «Machine Learning.Professional».

Повсеместное распространение смартфонов позволяет людям сообщать о чрезвычайной ситуации, которую они наблюдают, в режиме реального времени. По этой причине все больше агентств (например, организации по оказанию помощи при стихийных бедствиях и информационные агентства) заинтересованы в программном мониторинге социальной сети X (бывший Twitter). Но не всегда ясно, действительно ли слова человека объявляют о катастрофе.

В данной работе я хотела бы рассказать, как с помощью обработки естественного языка (NLP) можно разработать систему, способную точно определять контекст твита.

El_Gato_Grande 20 мая в 11:01

Новые процессоры, апдейт TimescaleDB, кешбэк за S3 и многое другое: что мы обновили в апреле

5 мин

2.8K

Блог компании SelectelОблачные вычисления*Серверное администрирование*Машинное обучение*IT-компании

Привет! С вами снова Саша, технический писатель в Selectel. В этом дайджесте рассказываю, как обновились наши продукты в апреле, раскрываю подробности новых акций и напоминаю о квизе для новичков и профи в IT.

Читать дальше →

+36

kucev 20 мая в 10:01

Разметка данных в Label Studio при помощи GPT-4: интеграция ML Backend

7 мин

1.5K

Data Mining*Big Data*Машинное обучение*Искусственный интеллектData Engineering*

Перевод

Введение

Получение качественных данных — краеугольный камень любого проекта машинного обучения. Этот процесс, в котором традиционно доминирует трудозатратная разметка данных, часто может превращаться в длительную и дорогостоящую задачу. Но что, если мы сможем воспользоваться прогрессом в развитии больших языковых моделей (LLM) для перехода от разметки данных к проверке разметки?

На сцене появляется GPT-4. Эта система (разработанная на основе GPT-4), имеющая более ста миллионов пользователей — одна из самых популярных языковых моделей.

В предыдущей статье мы показали, как можно ускорить процесс разметки предварительным аннотированием данных при помощи GPT-4. Эта методика позволяет нам загружать готовый к проверке предварительно размеченный датасет, а не выполнять монотонный процесс, начиная с нуля. В этой статье мы продолжим развивать эту тему, оказав, как можно объединить GPT-4 с бэкендом машинного обучения (ML Backend) Label Studio.

При помощи Label Studio ML Backend можно размечать данные непосредственно в Label Studio, что позволяет нам совершить переход от трудозатратной задачи разметки данных к гораздо более эффективному процессу проверки и совершенствования предварительных меток, что существенно ускоряет работу.

Читать дальше →

derunat 20 мая в 09:32

Как ИИ и методы прошлого века обошли золотых медалистов IMO в геометрии

Простой

4 мин

2.4K

Машинное обучение*Искусственный интеллект

Обзор

Решение геометрических задач, даже обычной школьной сложности, — процесс довольно творческий. Нужно что-то заметить, где-то проявить интуицию, пробовать разные подходы и придумывать свои. Отсюда возникает два вывода. Первый — раз задача творческая и не всегда понятно, какими именно принципами руководствоваться, значит она прекрасно подходит для искусственного интеллекта. Второй — противоположный, о котором наверняка думали хоть раз все, у кого с геометрией в школе было туго: нужно максимально формализовать решение, найти законы и превратить творческий процесс в набор правил. Как это обычно бывает, лучшим решением оказывается объединение противоположностей. Но обо всём по порядку.

veseluha 18 мая в 18:00

DIY для шпиона: использование обнаружения объектов с помощью YOLOv8 в рамках военных стратегий

8 мин

7.5K

Блог компании BotHubМашинное обучение*Искусственный интеллектDIY или Сделай сам

Перевод

Применим геопространственную разведку для точного количественного учета воздушных судов противника? Используем для этого технологию обнаружения объектов YOLOv8 на основе аэрофотосъемки, выполненной разведывательными беспилотниками, что обеспечит надежное планирование военных действий.

В рамках глобальной системы мониторинга, известной как «The Machine». , функционируют разнообразные элементы. Данная система объединяет множество устройств, распределенных по всему земному шару, что обеспечивает комплексное наблюдение. Это позволяет государственным органам осуществлять мониторинг за индивидуальными лицами, анализировать общественные поведенческие тенденции и контролировать военные объекты на международном уровне. Геопространственная разведка (GEOINT) занимает центральное место в этой системе.

В этой статье основное внимание уделим GEOINT в качестве ключевого средства для мониторинга военных авиабаз противника. Такой подход к наблюдению за объектами и базирующейся на них авиацией способствует глубокой проработке стратегии и тактики ведения боевых действий.

+24

Flokis_guy 17 мая в 14:20

Интуитивное понимание пространств и ядер в машинном обучении: Часть 1

Сложный

9 мин

6.1K

Data Mining*Математика*Машинное обучение*Искусственный интеллект

Туториал

При изучении темы ядер (kernel) в ML/DS программы вузов, роадмэпы и видео на YouTube обычно рассматривают её через призму SVM, не говоря уже о всеми любимых курсах:). Казалось бы, это неплохо: вот тебе краткое объяснение и модель, которая использует ядра. Но, увы, в этих областях желательно понимать многие процессы интуитивно, так сказать — «тяжело в учении, легко в бою». К тому же, эта тема нечто большее, чем просто метод; она позволяет связать многие вещи в машинном обучении в единую картину через пространство, что я и хочу показать в этой статье.

+18

vsevolod026 17 мая в 11:41

Миграция пеликанов в облака: как реализовать сложный орнитологический проект на базе облачной платформы. Часть 1

6 мин

922

Блог компании VKМашинное обучение*Облачные сервисы*

ML-технологии помогают значительно сократить ручной труд, повысить точность и скорость расчетов. Но, чтобы использование ML было результативным, важно правильно выстроить весь пайплайн работы с данными и развернуть его в удобной для пользования среде. Последнее особенно важно, если конечный пользователь продукта — человек без глубокой экспертизы в ИТ. В этом на своем опыте убедилась команда проекта «Сохранение кудрявого и розового пеликанов».

Читать дальше →

+14

The-Founder-1 17 мая в 06:07

Ансамблевое обучение для самых маленьких

Средний

13 мин

2.4K

Python*Программирование*Машинное обучение*Искусственный интеллект

Обзор

В прошлой статье мы лишь мельком затронули такую тему, как ансамблевое обучение, дав краткое определение парочке терминов. Сегодня в планах зарыться в это дело подробнее, рассмотрев некоторые из популярных методов. Поэтому предупреждаем сразу: букв будет много. А также концептов, терминов и примеров. Со своей стороны обещаем рассказать настолько простым языком, насколько это возможно в контексте машинного обучения. В любом случае располагайтесь поудобнее. Мы здесь надолго.

Rombneromb 16 мая в 11:55

Магия перестала быть магией и превратилась в технологию

6 мин

1.7K

Блог компании Конференции Олега Бунина (Онтико)Машинное обучение*Управление сообществом*Конференции

Всё, что сложно или невозможно объяснить, называют магией. Ещё в 1997 году суперкомпьютер Deep Blue обыграл чемпиона мира по шахматам. Шок, недоверие и теории заговора. В 2016 году другой суперкомпьютер AlphaGo обыграл топового игрока в самую сложную в мире игру Го. Восстание машин и разнообразные фобии. Сейчас нейросети уже снимают кино, пишут песни и сценарии, делают научные открытия и ловят мошенников. И уже мало кому кажется шуткой то, что скоро они заменят программистов. Но, несмотря на все достижения и перспективы — эти технологии всё ещё кажутся магией. А люди, которые в этом понимают — магами. Но магам, как и всем остальным, нужно делиться заклинаниями, новыми свитками и рецептами зелий. Поэтому в этом году откроется ~~первая школа волшебства~~ Прикладная техническая конференция по Data Science AiConf 2024.

Общение незаменимо даже в кругу магов. Кто, если ни другой маг, лучше всего расскажет про новых жучков-древоточцев, которые пожирают даже самые новые свитки. Или про то, каким маслом смазывать волшебный котёл перед тем, как варить зелье. Про CV, NLP, Automotive, AutoML, Predictive analytics, Reinforcement Learning, Artificial General Intelligence и другие заклинания. Это ли не лучший повод передать свой бесценный магический потенциал и опыт?

Готовьте мётлы и телепорты! Встречаемся 26 и 27 сентября 2024 года в Москве на Красном Октябре.

+22

camunar 16 мая в 08:26

Достижение лучших результатов в бизнесе благодаря отладке виртуального ассистента в Rasa X

Простой

4 мин

238

Машинное обучение*

Туториал

Перевод

Если вам доводилось когда-нибудь заниматься разработкой виртуального ассистента на базе искусственного интеллекта, то я уверен, вы согласитесь, когда я скажу, что это очень сложно. Удивительно, но зачастую в качестве примера самого трудного этапа разработки ИИ-помощника приводят совсем не то, что ожидаешь услышать. Общаясь со множеством клиентов и пользователей Rasa на протяжении многих лет, мы часто слышим одно и то же: создание прототипа — это самая легкая часть. Настоящие проблемы возникают, когда нужно сделать из прототипа продукт, обеспечивающий лучший в своем классе опыт взаимодействия с компанией, который можно представить клиентам и пользователям.

high_fly 16 мая в 00:10

LLM field landscape

Средний

43 мин

Машинное обучение*Искусственный интеллектNatural Language Processing*

Обзор

Ради чего эта статья?

Сфера генеративных моделей сегодня кипит, булькает и шипит — каждый день выходят новые статьи, новые бенчмарки, новая модель вырывается вперёд на Arena, открывается очередной AI‑стартап… Только мы успеваем потрогать одну модель и сделать свои выводы, выходит другая, а Sam Altman в каждом интервью намекает, насколько GPT-5 будет умнее, лучше и круче, чем GPT-4.

В общем, за сферой LLM сегодня очень трудно уследить. Но уследить хочется. Хочется сделать снэпшот, в котором отразить максимально актуальное состояние области на текущий момент, насколько это возможно, чтоб было от чего отталкиваться потом. На самом деле, это задача для серьёзного научного review, но лучшее враг хорошего, поэтому начну я со статьи на Хабре.

+14

janvarev 15 мая в 17:01

Да, это не OpenAI — на Google I/O показали LLM Gemini Flash 1.5 с дешевым контекстом на 1 миллион токенов

Простой

5 мин

Блог компании Timeweb CloudМашинное обучение*Искусственный интеллектNatural Language Processing*

Google I/O, на удивление, не повезло. Крупнейшие анонсы от Google в сфере ИИ остались в тени конференции OpenAI, которая прошла 13 мая — на Хабре было сразу несколько постов о бьющей рекорды GPT-4o, в то время как о конференции Гугла была достаточно небольшая новость.

В общем, давайте вкратце расскажу, на что (предположительно) делает ставку Google, а также как я, как ~~упоротый~~ большой фанат LLM уже подключил Gemini Flash и GPT-4o в свой сервис VseGPT (доступ к нейросетям из России по API), и про то, как они ощущаются на русском языке.

Читать дальше →

+17

ozlik 15 мая в 15:45

Создаём свою стример-тян из зефира и палок

Средний

127 мин

8.5K

Python*Java*SQLite*Машинное обучение*Natural Language Processing*

Наверняка вы слышали о нашумевшей в своё время ИИ стримерше NeuroSama. Однако мое внимание привлекало не само шоу и эти нашумевшие самые «крутейшие» моменты стримов, а сам факт того, что нейросеть реально может полностью автономно и полноценно вести стрим, удерживая внимание зрителей! Меня очень заинтересовала такая задумка, и я решился её повторить!

В этой статье я расскажу о попытке создать свою нейро-тян для русского сегмента, которая сможет автономно и без перерывов играть и вести трансляции на различных стриминг-платформах и ~~буллить кожаных мешков~~ конечно же развлекать зрителей и игроков, не получая баны! В результате получился самый настоящий ~~гомункул~~ киборг-убийца (мозгов) квадратных людей, поэтому запасайтесь бочкой кваса и ванной попкрона, как и в прошлый раз, приключение обещает быть жарким, но не только потому, что скоро лето, а ещё потому, что сейчас весна (и сопутствующее весеннее обострение), ведь мы с вами будем создавать настоящую (виртуальную) девушку-стримера!

Может, немного опоздал с трендом, но не пропадать же добру просто так! Кому-нибудь да пригодится (хотя бы для того, чтобы посмеяться или кринжануть с человека, который год занимался никому не нужной фигнёй).

Статья получилась без преувеличения огромной из-за совмещения просто ТУЧИ разных технологий и необходимости погружения в тонкости некоторых, так что отправьте ссылку себе на комп, расположитесь поудобнее и предупредите свою попу, что она рискует не отрываться от стула на протяжении целого часа!

Будет весело, сложно и очень интересно как опытному «бойцу», так и простому обывателю!

Читать далее →

+61

Dmytro_Kikot 15 мая в 09:45

Ходить как человек: генеративный ИИ и локомоция

11 мин

1.7K

Блог компании ua-hosting.companyАлгоритмы*Машинное обучение*Научно-популярноеИскусственный интеллект

Глядя на улицы города утром буднего дня, мы видим множество людей, каждый из которых торопливо или размеренно идет куда-то по своим делам, будь то на учебу или на работу. Скорость, особенности шага и общая картина локомоции человеческой ходьбы являются уникальными для каждого человека. При этом обстоятельства окружающей среды имеют немалое влияние на то как ходит человек. Говоря о роботах, мы уже давно научили их ходить, подобно человеку. Однако адаптация к динамическим условиям окружающей среды, особенно настройка скорости в реальном времени, остаются крайне сложной задачей. Ученые из Университета Тохоку (Япония) разработали новую методику обучения роботов, использовав возможности генеративного ИИ. Насколько данная методика была эффективной для обучения роботов, и насколько лучше стала их локомоция? Ответы на эти вопросы мы найдем в докладе ученых.

Читать дальше →

+21

linuxacademy 14 мая в 20:41

Google наносит ответный удар. Gemini 1.5 Pro против Gpt4o, чей контекст длиннее! Крутые инновации от Google

Простой

2 мин

321

Машинное обучение*Искусственный интеллект

Репортаж

Вчера Open AI представили свой революционный Gpt4o, теперь давайте посмотрим ответ от Google.

Улучшенная Gemini 1.5 Pro теперь доступна в Gemini Advanced и для разработчиков.

А также станет доступна для разработчиков во всём мире.

phillennium 14 мая в 17:42

Неочевидное ML: примеры от SberDevices

Простой

5 мин

2.4K

Блог компании JUG Ru GroupМашинное обучение*КонференцииИскусственный интеллект

Дайджест

Казалось бы, нам всем так прожужжали уши аббревиатурой «ИИ», что с ней всё уже очевидно.

Но весь хайп последних лет крутится вокруг нескольких сценариев: «нарисуй картинку», «напиши код», «ответь на вопрос».

И по-моему, сейчас самое интересное — это менее заезженные применения. Окей, стало можно одним промптом нарисовать капибару верхом на драконе, это мы поняли. А вот чем нейросети могут помочь инженерам, редакторам или неслышащим людям? До чего дошёл прогресс, в чём сложности, как их преодолевают?

Скоро мы проведём конференцию I'ML, а недавно помогали SberDevices провести GIGA R&D DAY. Я посмотрел записи докладов GIGA R&D DAY — и там как раз говорится о подобных гранях AI. По-моему, это интересно, поэтому захотелось сделать так:

— Перескажу завязки трёх докладов, а дальше вы можете посмотреть любой из них целиком.
— Буду рад, если в комментариях вы добавите, какие направления развития ИИ вам лично кажутся перспективными и не слишком заезженными.

1 2 3

5 6 ...

331 332

Машинное обучение *

Распознавание именованных сущностей: механизм, методики, сценарии использования и реализация

Основные алгоритмы многоруких бандитов в рекомендательных системах

В остаточном потоке трансформеров представлена геометрия состояний их убеждений

Разбираем KAN по полочкам

Истории

Обнаружение аварийных твитов с использованием NLP

Новые процессоры, апдейт TimescaleDB, кешбэк за S3 и многое другое: что мы обновили в апреле

Разметка данных в Label Studio при помощи GPT-4: интеграция ML Backend

Введение

Как ИИ и методы прошлого века обошли золотых медалистов IMO в геометрии

DIY для шпиона: использование обнаружения объектов с помощью YOLOv8 в рамках военных стратегий

Интуитивное понимание пространств и ядер в машинном обучении: Часть 1

Миграция пеликанов в облака: как реализовать сложный орнитологический проект на базе облачной платформы. Часть 1

Ансамблевое обучение для самых маленьких

Магия перестала быть магией и превратилась в технологию

Ближайшие события

Достижение лучших результатов в бизнесе благодаря отладке виртуального ассистента в Rasa X

LLM field landscape

Да, это не OpenAI — на Google I/O показали LLM Gemini Flash 1.5 с дешевым контекстом на 1 миллион токенов

Создаём свою стример-тян из зефира и палок

Ходить как человек: генеративный ИИ и локомоция

Google наносит ответный удар. Gemini 1.5 Pro против Gpt4o, чей контекст длиннее! Крутые инновации от Google

Неочевидное ML: примеры от SberDevices

Вклад авторов

Работа