Машинное обучение *

Основа искусственного интеллекта

Статьи Посты Новости Авторы Компании

nikks вчера в 11:30

Как мы сломали языковой барьер с помощью одной модели?

8 мин

3.1K

Python*Машинное обучение*Natural Language Processing*

Из песочницы

В этой статье я расскажу о реализации моего бесшовного модуля мультиязычности. Технологии, способной преодолевать языковые барьеры.

Виртуальный ассистент поддерживает 109 языков, понимает на каком языке к нему обратились и генерирует ответ уже на этом языке. И все это благодаря пайплайну на основе языковой модели LaBSE (Language-agnostic BERT Sentence Embedding) и фреймворка RASA.

alyaa17 вчера в 08:30

Sentiment Analysis Bot на Rasa 3.1

5 мин

361

Python*Машинное обучение*

Из песочницы

Начну с того, что последние 3 месяца я стажировалась в лаборатории искусственного интеллекта ООО "ОЦРВ" в группе обработки естественного языка. За это время успела поучаствовать в разработке системы сентимент-анализа для компании. В этой статье расскажу как вижу эту задачу я, что делала и с какими проблемами пришлось столкнуться.

YandexCloudEditor 7 июн в 17:00

Фишки и «грабли» использования машинного обучения от спикеров ML2Business

Простой

8 мин

766

Блог компании Yandex Cloud & Yandex InfrastructureМашинное обучение*КонференцииИскусственный интеллект

Кейс

В среду 29 мая мы провели ML2Business — первую конференцию от Yandex Cloud, посвящённую кейсам применения GenAI, NLP, CV и других технологий ML в бизнесе.

Реальный опыт внедрения машинного обучения был представлен в двух треках: GenAI&NLP и GenAI&CV. Их программа была полностью посвящена историям использования ML в разных компаниях. В этой статье мы собрали инсайты спикеров из компаний «Инфосистемы Джет», «ВкусВилл» и Банки.ру, которые могут быть интересны техническим специалистам.

boryskyn 7 июн в 15:37

Анализ повторяемости инцидентов

Средний

5 мин

970

Блог компании АвтомаконPython*Машинное обучение*

Привет, Хабр!

Здесь начинаем разбирать анализ текстовых данных. По-разному «от руки» написанных отчетов о причинах возникновения инцидентов. Сегодня о том, как я пытаюсь выявлять паттерны возникновения Инцидентов, другими словами, искать мелкие Проблемы.

Эта статья не будет полезна матерым дата-сатанистам, но может быть полезна менеджерам, которые хотят отследить повторяемость похожих задач, или как я – похожих технических неполадок.

bombora_IT 7 июн в 11:50

Где лучше всего пробовать идеи для обучающихся систем?

Средний

2 мин

1.3K

Python*Программирование*Визуализация данных*Машинное обучение*

Обзор

Для того, чтобы разобраться в сложной и объемной теме машинного обучения, попробовать свои силы и отточить навыки, оптимально подходит библиотека scikit-learn (sklearn).

-1

SK599 7 июн в 11:41

Повышаем интерпретируемость SHAP-графиков

Средний

8 мин

3.1K

Блог компании VKМашинное обучение*

Туториал

Привет, Хабр! В моей работе часто возникают задачи на исследование влияния факторов, на которые мы можем оказывать продуктовое влияние, на целевые метрики сообществ ВКонтакте. Один из возможных способов решения подобных задач — обучение ML‑моделей и последующий анализ значимости признаков в них. Базовым подходом видится использование графиков из библиотеки shap. Однако наиболее популярным является summary_plot, хотя он и повышает интерпретируемость модели, но отвечает не на все возникающие вопросы.

Меня зовут Сергей Королёв, я продуктовый аналитик в бизнес‑юните СМБ в VK, занимаюсь улучшением опыта предпринимателей на нашей платформе. В этой статье я представлю свое решение по кастомизации shap.dependence_plot для простого восприятия графиков влияния факторов на целевую метрику.

+21

Seleditor 7 июн в 11:00

Не статья, а позорище какое-то! Sentiment-анализ комментариев из блога Selectel на Хабре

12 мин

Блог компании SelectelPython*IT-инфраструктура*Машинное обучение*IT-компании

Каждый месяц в блоге Selectel на Хабре появляется 35-40 публикаций. Сбор статистики по ним мы давно автоматизировали, но до последнего времени не охватывали sentiment-анализ, то есть оценку тональности комментариев средствами машинного обучения.

У нас есть своя ML-платформа, серверное железо и опыт в развертывании IT-инфраструктуры. Вполне логично, что в какой-то момент возник вопрос: что, если проанализировать эмоциональный окрас комментариев в блоге на Хабре с помощью LLM?

Под катом рассказываем, что из этого получилось.

Читать дальше →

+42

leongl 7 июн в 07:50

LLM и 1С: изучаем сервисы для автоматизации написания кода 1С

10 мин

3.8K

Блог компании Magnit TechМашинное обучение*Искусственный интеллект1С*

Обзор

Мы решили пощупать рынок LLM в контексте 1С-разработки. Рассказываем, какие есть инструменты, как их можно использовать и к каким выводам мы пришли.

Barseadar 6 июн в 17:30

До AGI и ASI осталось 20 лет: почему до восстания ИИ ещё далеко

Простой

11 мин

7.1K

Блог компании СЕРВЕР МОЛЛМашинное обучение*Исследования и прогнозы в IT*Производство и разработка электроники*Искусственный интеллект

Аналитика

Помните ту фольклорную фразу?

"До управляемого термоядерного синтеза осталось 20 лет."

И сколько бы лет не прошло, мы находимся всё в тех же 20 годах от него.

Однако модели ИИ прогрессируют крайне быстро. Далёкие от технологий люди уже задумались о сюжетах Матрицы и Терминатора. Чуть более продвинутые технооптимисты ждут AGI или сингулярность, чтобы получать безусловный базовый доход и не работать, а технофобы консерваторы говорят, что всё нужно ограничить и запретить (ха-ха). Локальные запреты в отдельных странах усилят их глобальное отставание, а страны без запретов получат преимущество. Так что процесс развития нейросетей необратим.

Дропдаун

+11

Epoch8 6 июн в 16:34

Metabase VS Power BI: выбираем систему визуализации данных

Средний

6 мин

3.5K

Блог компании AGIMAВизуализация данных*Машинное обучение*

Туториал

Привет! Меня зовут Евгения Новосилецкая, я более 3-х лет работаю аналитиком в AGIMA AI. В основном занимаюсь разработкой аналитических решений, анализом данных и их визуализацией. И каждый раз при старте нового проекта встает один и тот же вопрос: какую систему визуализации выбрать? В этой статье попробуем разобраться с основными инструментами — Power BI и Metabase. А заодно поймем, как выбрать между ними.

Sber 6 июн в 10:10

Машинное обучение с Python и TensorFlow на Windows. Быстрый старт

Простой

6 мин

6.4K

Блог компании СберPython*Машинное обучение*TensorFlow*

Туториал

Словосочетание «машинное обучение» становится всё более значимым с каждым годом и проникает во все возможные сферы жизни, а с появлением в открытом доступе таких нейронных сетей как Chat GPT [1] интерес к машинному обучению стал высок как никогда. Но при этом многих отпугивает сложность создания своих систем на основе машинного обучения, потому что нужно одновременного использовать и настраивать много разных инструментов разработки.

Поэтому я хочу представить вашему вниманию максимально простую инструкцию для быстрого погружения в мир машинного обучения. Инструкция ориентирована в первую очередь на начинающих программистов, мы будем применять Python 3 [2] с библиотекой TensorFlow [3]. Это лучший выбор для начинающих из-за простоты языка и большого сообщества разработчиков, использующих TensorFlow.

+12

uberkinder 5 июн в 16:02

Мечтает ли GPT-4o о сегментации картинок...?

Простой

10 мин

6.4K

Яндекс API*Машинное обучение*Искусственный интеллект

Кейс

Всем привет, Меня зовут Богдан, Я фаундер Vibe AI – это AI Dating Copilot для парней и девушек, который помогает в переписке на сайтах знакомств и в мессенджерах (в сервисе зарегистрировано уже 13,000+ пользователей).

Сегодня Я расскажу, как мы заставили GPT-4o работать с детекцией объектов на изображении (выделять координаты объекта на изображении) на примере задачи распознавания сообщений по скриншоту, которая лежит в основе нашего приложения.

Обсудим, какие ограничения у Vision-модулей в языковых моделях, как происходит обработка картинок, где теряется информация и как преодолеть эти лимиты.

+16

jstmeowme 5 июн в 13:08

Разбор документа про AGI от Леопольда Ашенбреннера, бывшего сотрудника OpenAI

Средний

11 мин

25K

Блог компании BotHubМашинное обучение*Исследования и прогнозы в IT*Искусственный интеллект

Аналитика

Леопольд Ашенбреннер, бывший сотрудник OpenAI из команды Superalignment, опубликовал документ под названием «Осведомленность о ситуации: Предстоящее десятилетие», в котором он делится своим видением будущего ИИ. Основываясь на своих знаниях в этой области, Ашенбреннер предсказывает стремительное развитие искусственного интеллекта в ближайшее десятилетие.

Мы прочитали этот документ объемом в 165 страниц за вас. В этой статье расскажем о ключевых идеях Ашенбреннера и о его прогнозах на будущее искусственного интеллекта.

+48

186

avshkol 5 июн в 00:25

Справочник по применению GPU в машинном обучении

Средний

35 мин

Машинное обучение*ГаджетыКомпьютерное железо

Туториал

Перевод

Это перевод популярного лонгрида Тима Детмерса "Выбор графического процессора для глубокого обучения: мой опыт и советы".

Глубокое обучение (Deep learning, DL) - область с высокими вычислительными требованиями, и выбор графического процессора будет в корне определять ваши возможности в этой сфере. Какие характеристики важны при выборе нового GPU? Оперативная память GPU, ядра, тензорные ядра, кэш? Как сделать экономически эффективный выбор? Мы рассмотрим эти вопросы, заодно разберемся с распространенными заблуждениями, разберемся в характеристиках GPU, дадим советы, которые помогут вам сделать правильный выбор.

+25

neuromancertdi 4 июн в 15:00

Система команд на основе переменных

Простой

10 мин

Программирование*Алгоритмы*Машинное обучение*Искусственный интеллект

Я пытаюсь описать одну концепцию ИИ, сам ее пока понимаю плохо. Думаю суть этой концепции в том, чтобы создавать различные переменные в системе нейросетей, которые отвечают за различные действия, процессы. В этой статье я расскажу про идею, суть которой в том, что все знания программы, такие как команды или слова, рассматриваются как переменные, и немного про эту концепцию ИИ (в конце статьи). Чтобы лучше понять идею описанную в этой статье, нужно прочитать предыдущую статью про систему команд.

patapum_gg 4 июн в 13:47

ML в OCR: зачем и как

Простой

5 мин

1.7K

Блог компании SL SoftОбработка изображений*Машинное обучение*

Привет, меня зовут Георгий Гончаров, я инженер‑консультант OCR‑платформы SOICA, предназначенной для распознавания и обработки текстовых и графических данных. Поскольку это собственная разработка, то мы постоянно внедряем новые фичи. Недавно появилась еще одна — мы назвали ее ML‑локатор. В статье расскажу, почему и как мы реализовали эту функциональность и каких результатов удалось достичь.

badcasedaily1 4 июн в 09:15

Кратко про Seq2Seq-модели

Средний

9 мин

799

Блог компании OTUSPython*Программирование*Машинное обучение*

Обзор

Привет, Хабр!

Seq2Seq модели — это архитектуры ML, предназначенные для задач, связанных с последовательными данными, типо машинного перевода, суммирования текста, создания описаний к пикчам и прочие задачи, где требуется преобразование одной последовательности в другую.

В этой статье в общих деталях рассмотрим то, как реализуются Seq2Seq модели.

evaclick 3 июн в 13:51

Сравниваем популярные алгоритмы кластеризации DBSCAN и OPTICS

10 мин

2.9K

Python*Алгоритмы*R*Julia*Машинное обучение*

Привет, хаброчеловек)
В этой статье рассмотрим алгоритмы кластеризации DBSCAN и OPTICS, посмотрим их особенности, обсудим, когда что лучше применять
Welcome под кат

+13

Hanamime 3 июн в 13:44

Кто будет разрабатывать лекарства?

Простой

8 мин

1.1K

Блог компании СберМашинное обучение*БиотехнологииХимия

Мнение

Появление новых лекарств — всегда ожидаемое событие. Несмотря на широкомасштабные исследования фармкомпаний эффективных средств по–прежнему не хватает. В среднем на разработку одного препарата уходит 10–15 лет и около 2,5 млрд долларов — это долго и дорого. Научное сообщество готово привлечь к работе нейросетевые модели, чтобы ускорить процесс и улучшить результат. В центре «Искусственный интеллект в Фарме» при Сеченовском университете намерены сократить время на разработки и снизить количество ошибок.

AlexSam27 3 июн в 12:50

Машинное обучение в браузере

9 мин

3.2K

JavaScript*WebGL*Машинное обучение*WebAssembly*TensorFlow*

Из песочницы

Меня зовут Алексей, сегодня мы с вами поговорим, как можно ускорить вычисления машинного обучения веб приложения с помощью WASM, WebGL или WebGPU.

Когда фронтенд‑разработчик слышит о машинном обучении в браузере, первое, что приходит ему на ум, это вопрос: «Как это может быть применено? Мы же работаем в браузере на JS, который, как известно, медленный (по сравнению с компилируемыми языками)».

2 3 ...

331 332

Машинное обучение *

Как мы сломали языковой барьер с помощью одной модели?

Новости

Sentiment Analysis Bot на Rasa 3.1

Фишки и «грабли» использования машинного обучения от спикеров ML2Business

Анализ повторяемости инцидентов

Истории

Где лучше всего пробовать идеи для обучающихся систем?

Повышаем интерпретируемость SHAP-графиков

Не статья, а позорище какое-то! Sentiment-анализ комментариев из блога Selectel на Хабре

LLM и 1С: изучаем сервисы для автоматизации написания кода 1С

До AGI и ASI осталось 20 лет: почему до восстания ИИ ещё далеко

Metabase VS Power BI: выбираем систему визуализации данных

Машинное обучение с Python и TensorFlow на Windows. Быстрый старт

Мечтает ли GPT-4o о сегментации картинок...?

Разбор документа про AGI от Леопольда Ашенбреннера, бывшего сотрудника OpenAI

Ближайшие события

Справочник по применению GPU в машинном обучении

Система команд на основе переменных

ML в OCR: зачем и как

Кратко про Seq2Seq-модели

Сравниваем популярные алгоритмы кластеризации DBSCAN и OPTICS

Кто будет разрабатывать лекарства?

Машинное обучение в браузере

Вклад авторов

Работа