Как стать автором
Обновить
448.14

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Как мы сломали языковой барьер с помощью одной модели?

Время на прочтение8 мин
Количество просмотров3.1K

В этой статье я расскажу о реализации моего бесшовного модуля мультиязычности. Технологии, способной преодолевать языковые барьеры.

Виртуальный ассистент поддерживает 109 языков, понимает на каком языке к нему обратились и генерирует ответ уже на этом языке. И все это благодаря пайплайну на основе языковой модели LaBSE (Language-agnostic BERT Sentence Embedding) и фреймворка RASA.

Читать далее
Всего голосов 4: ↑3 и ↓1+4
Комментарии0

Новости

Sentiment Analysis Bot на Rasa 3.1

Время на прочтение5 мин
Количество просмотров361

Начну с того, что последние 3 месяца я стажировалась в лаборатории искусственного интеллекта ООО "ОЦРВ" в группе обработки естественного языка. За это время успела поучаствовать в разработке системы сентимент-анализа для компании. В этой статье расскажу как вижу эту задачу я, что делала и с какими проблемами пришлось столкнуться.

Читать далее
Всего голосов 3: ↑3 и ↓0+5
Комментарии1

Фишки и «грабли» использования машинного обучения от спикеров ML2Business

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров766

В среду 29 мая мы провели ML2Business — первую конференцию от Yandex Cloud, посвящённую кейсам применения GenAI, NLP, CV и других технологий ML в бизнесе.

Реальный опыт внедрения машинного обучения был представлен в двух треках: GenAI&NLP и GenAI&CV. Их программа была полностью посвящена историям использования ML в разных компаниях. В этой статье мы собрали инсайты спикеров из компаний «Инфосистемы Джет», «ВкусВилл» и Банки.ру, которые могут быть интересны техническим специалистам.

Читать далее
Всего голосов 6: ↑6 и ↓0+8
Комментарии0

Анализ повторяемости инцидентов

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров970

Привет, Хабр!

Здесь начинаем разбирать анализ текстовых данных. По-разному «от руки» написанных отчетов о причинах возникновения инцидентов. Сегодня о том, как я пытаюсь выявлять паттерны возникновения Инцидентов, другими словами, искать мелкие Проблемы.

Эта статья не будет полезна матерым дата-сатанистам, но может быть полезна менеджерам, которые хотят отследить повторяемость похожих задач, или как я – похожих технических неполадок.

Читать далее
Всего голосов 2: ↑2 и ↓0+2
Комментарии1

Истории

Где лучше всего пробовать идеи для обучающихся систем?

Уровень сложностиСредний
Время на прочтение2 мин
Количество просмотров1.3K

Для того, чтобы разобраться в сложной и объемной теме машинного обучения, попробовать свои силы и отточить навыки, оптимально подходит библиотека scikit-learn (sklearn).

Читать далее
Всего голосов 1: ↑0 и ↓1-1
Комментарии0

Повышаем интерпретируемость SHAP-графиков

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров3.1K

Привет, Хабр! В моей работе часто возникают задачи на исследование влияния факторов, на которые мы можем оказывать продуктовое влияние, на целевые метрики сообществ ВКонтакте. Один из возможных способов решения подобных задач — обучение ML‑моделей и последующий анализ значимости признаков в них. Базовым подходом видится использование графиков из библиотеки shap. Однако наиболее популярным является summary_plot, хотя он и повышает интерпретируемость модели, но отвечает не на все возникающие вопросы.

Меня зовут Сергей Королёв, я продуктовый аналитик в бизнес‑юните СМБ в VK, занимаюсь улучшением опыта предпринимателей на нашей платформе. В этой статье я представлю свое решение по кастомизации shap.dependence_plot для простого восприятия графиков влияния факторов на целевую метрику.

Читать далее
Всего голосов 21: ↑21 и ↓0+21
Комментарии0

Не статья, а позорище какое-то! Sentiment-анализ комментариев из блога Selectel на Хабре

Время на прочтение12 мин
Количество просмотров6K

Каждый месяц в блоге Selectel на Хабре появляется 35-40 публикаций. Сбор статистики по ним мы давно автоматизировали, но до последнего времени не охватывали sentiment-анализ, то есть оценку тональности комментариев средствами машинного обучения.

У нас есть своя ML-платформа, серверное железо и опыт в развертывании IT-инфраструктуры. Вполне логично, что в какой-то момент возник вопрос: что, если проанализировать эмоциональный окрас комментариев в блоге на Хабре с помощью LLM?

Под катом рассказываем, что из этого получилось.
Читать дальше →
Всего голосов 42: ↑37 и ↓5+42
Комментарии15

LLM и 1С: изучаем сервисы для автоматизации написания кода 1С

Время на прочтение10 мин
Количество просмотров3.8K

Мы решили пощупать рынок LLM в контексте 1С-разработки. Рассказываем, какие есть инструменты, как их можно использовать и к каким выводам мы пришли.

Читать далее
Всего голосов 11: ↑9 и ↓2+8
Комментарии4

До AGI и ASI осталось 20 лет: почему до восстания ИИ ещё далеко

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров7.1K

Помните ту фольклорную фразу?

"До управляемого термоядерного синтеза осталось 20 лет."

И сколько бы лет не прошло, мы находимся всё в тех же 20 годах от него.

Однако модели ИИ прогрессируют крайне быстро. Далёкие от технологий люди уже задумались о сюжетах Матрицы и Терминатора. Чуть более продвинутые технооптимисты ждут AGI или сингулярность, чтобы получать безусловный базовый доход и не работать, а технофобы консерваторы говорят, что всё нужно ограничить и запретить (ха-ха). Локальные запреты в отдельных странах усилят их глобальное отставание, а страны без запретов получат преимущество. Так что процесс развития нейросетей необратим.

Дропдаун
Всего голосов 9: ↑9 и ↓0+11
Комментарии54

Metabase VS Power BI: выбираем систему визуализации данных

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров3.5K

Привет! Меня зовут Евгения Новосилецкая, я более 3-х лет работаю аналитиком в AGIMA AI. В основном занимаюсь разработкой аналитических решений, анализом данных и их визуализацией. И каждый раз при старте нового проекта встает один и тот же вопрос: какую систему визуализации выбрать? В этой статье попробуем  разобраться с основными инструментами — Power BI и Metabase. А заодно поймем, как выбрать между ними.

Читать далее
Всего голосов 6: ↑5 и ↓1+4
Комментарии0

Машинное обучение с Python и TensorFlow на Windows. Быстрый старт

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров6.4K

Словосочетание «машинное обучение» становится всё более значимым с каждым годом и проникает во все возможные сферы жизни, а с появлением в открытом доступе таких нейронных сетей как Chat GPT [1] интерес к машинному обучению стал высок как никогда. Но при этом многих отпугивает сложность создания своих систем на основе машинного обучения, потому что нужно одновременного использовать и настраивать много разных инструментов разработки.

Поэтому я хочу представить вашему вниманию максимально простую инструкцию для быстрого погружения в мир машинного обучения. Инструкция ориентирована в первую очередь на начинающих программистов, мы будем применять Python 3 [2] с библиотекой TensorFlow [3]. Это лучший выбор для начинающих из-за простоты языка и большого сообщества разработчиков, использующих TensorFlow.

Читать далее
Всего голосов 10: ↑9 и ↓1+12
Комментарии6

Мечтает ли GPT-4o о сегментации картинок...?

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров6.4K

Всем привет, Меня зовут Богдан, Я фаундер Vibe AI – это AI Dating Copilot для парней и девушек, который помогает в переписке на сайтах знакомств и в мессенджерах (в сервисе зарегистрировано уже 13,000+ пользователей).

Сегодня Я расскажу, как мы заставили GPT-4o работать с детекцией объектов на изображении (выделять координаты объекта на изображении) на примере задачи распознавания сообщений по скриншоту, которая лежит в основе нашего приложения.

Обсудим, какие ограничения у Vision-модулей в языковых моделях, как происходит обработка картинок, где теряется информация и как преодолеть эти лимиты.

Читать далее
Всего голосов 19: ↑16 и ↓3+16
Комментарии7

Разбор документа про AGI от Леопольда Ашенбреннера, бывшего сотрудника OpenAI

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров25K

Леопольд Ашенбреннер, бывший сотрудник OpenAI из команды Superalignment, опубликовал документ под названием «Осведомленность о ситуации: Предстоящее десятилетие», в котором он делится своим видением будущего ИИ. Основываясь на своих знаниях в этой области, Ашенбреннер предсказывает стремительное развитие искусственного интеллекта в ближайшее десятилетие.

Мы прочитали этот документ объемом в 165 страниц за вас. В этой статье расскажем о ключевых идеях Ашенбреннера и о его прогнозах на будущее искусственного интеллекта.

Читать далее
Всего голосов 41: ↑38 и ↓3+48
Комментарии186

Ближайшие события

Конференция HR API 2024
Дата14 – 15 июня
Время10:00 – 18:00
Место
Санкт-ПетербургОнлайн
Конференция «IT IS CONF 2024»
Дата20 июня
Время09:00 – 19:00
Место
Екатеринбург
Summer Merge
Дата28 – 30 июня
Время11:00
Место
Ульяновская область

Справочник по применению GPU в машинном обучении

Уровень сложностиСредний
Время на прочтение35 мин
Количество просмотров6K

Это перевод популярного лонгрида Тима Детмерса "Выбор графического процессора для глубокого обучения: мой опыт и советы".

Глубокое обучение (Deep learning, DL) - область с высокими вычислительными требованиями, и выбор графического процессора будет в корне определять ваши возможности в этой сфере. Какие характеристики важны при выборе нового GPU? Оперативная память GPU, ядра, тензорные ядра, кэш? Как сделать экономически эффективный выбор? Мы рассмотрим эти вопросы, заодно разберемся с распространенными заблуждениями, разберемся в характеристиках GPU, дадим советы, которые помогут вам сделать правильный выбор.

Читать далее
Всего голосов 20: ↑20 и ↓0+25
Комментарии2

Система команд на основе переменных

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров2K

Я пытаюсь описать одну концепцию ИИ, сам ее пока понимаю плохо. Думаю суть этой концепции в том, чтобы создавать различные переменные в системе нейросетей, которые отвечают за различные действия, процессы. В этой статье я расскажу про идею, суть которой в том, что все знания программы, такие как команды или слова, рассматриваются как переменные, и немного про эту концепцию ИИ (в конце статьи). Чтобы лучше понять идею описанную в этой статье, нужно прочитать предыдущую статью про систему команд.

Читать далее
Всего голосов 3: ↑3 и ↓0+3
Комментарии4

ML в OCR: зачем и как

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров1.7K

Привет, меня зовут Георгий Гончаров, я инженер‑консультант OCR‑платформы SOICA, предназначенной для распознавания и обработки текстовых и графических данных. Поскольку это собственная разработка, то мы постоянно внедряем новые фичи. Недавно появилась еще одна — мы назвали ее ML‑локатор. В статье расскажу, почему и как мы реализовали эту функциональность и каких результатов удалось достичь.

Читать далее
Всего голосов 6: ↑5 и ↓1+4
Комментарии11

Кратко про Seq2Seq-модели

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров799

Привет, Хабр!

Seq2Seq модели — это архитектуры ML, предназначенные для задач, связанных с последовательными данными, типо машинного перевода, суммирования текста, создания описаний к пикчам и прочие задачи, где требуется преобразование одной последовательности в другую.

В этой статье в общих деталях рассмотрим то, как реализуются Seq2Seq модели.

Читать далее
Всего голосов 3: ↑1 и ↓20
Комментарии0

Сравниваем популярные алгоритмы кластеризации DBSCAN и OPTICS

Время на прочтение10 мин
Количество просмотров2.9K

Привет, хаброчеловек)
В этой статье рассмотрим алгоритмы кластеризации DBSCAN и OPTICS, посмотрим их особенности, обсудим, когда что лучше применять
Welcome под кат

Читать далее
Всего голосов 13: ↑13 и ↓0+13
Комментарии1

Кто будет разрабатывать лекарства?

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров1.1K

Появление новых лекарств — всегда ожидаемое событие. Несмотря на широкомасштабные исследования фармкомпаний эффективных средств по–прежнему не хватает. В среднем на разработку одного препарата уходит 10–15 лет и около 2,5 млрд долларов — это долго и дорого. Научное сообщество готово привлечь к работе нейросетевые модели, чтобы ускорить процесс и улучшить результат. В центре «Искусственный интеллект в Фарме» при Сеченовском университете намерены сократить время на разработки и снизить количество ошибок. 

Читать далее
Всего голосов 5: ↑5 и ↓0+6
Комментарии4

Машинное обучение в браузере

Время на прочтение9 мин
Количество просмотров3.2K

Меня зовут Алексей, сегодня мы с вами поговорим, как можно ускорить вычисления машинного обучения веб приложения с помощью WASM, WebGL или WebGPU.

Когда фронтенд‑разработчик слышит о машинном обучении в браузере, первое, что приходит ему на ум, это вопрос: «Как это может быть применено? Мы же работаем в браузере на JS, который, как известно, медленный (по сравнению с компилируемыми языками)».

Читать далее
Всего голосов 5: ↑5 и ↓0+6
Комментарии0
1
23 ...

Вклад авторов

Работа

Data Scientist
79 вакансий