Машинное обучение *

Основа искусственного интеллекта

СтатьиПостыНовостиАвторыКомпании

@ksenia-plesovskikh 13 фев 2024 в 13:35

Можно ли научить чат-бота всегда говорить правду

Средний

6 мин

3.7K

Блог компании Группа IT-компаний LadМашинное обучение * Искусственный интеллект

Из песочницы

Привет, Хабр, меня зовут Ксения Плесовских и я развиваю генеративный ИИ в компании lad, разрабатывая чат-боты для бизнеса на основе LLM. В процессе работы над точностью ответов чат-бота, проверкой фактов и устранением галлюцинаций от LLM, мне довелось проанализировать и опробовать разные подходы к этой проблеме, чем сегодня и хочу с вами поделиться. Поскольку объем материала получился достаточно большой, на несколько публикаций, в этой части расскажу лишь о подходе самокритики SELF-RAG.

@karinakvanchiani 13 фев 2024 в 13:02

Распознавание и перевод жестовых языков: обзор подходов

Средний

11 мин

5.9K

Блог компании SberDevicesМашинное обучение * Искусственный интеллект

Обзор

Всем привет! В статье «Slovo и русский жестовый язык» мы рассказывали, как решаем задачу распознавания изолированных жестов, в статье «Русский жестовый язык: первое место в американском бенчмарке» делились результатами решения, а в статье «GigaChat и русский жестовый язык» речь шла о реализации прототипа общения с генеративной языковой моделью GigaChat. В этой статье речь пойдет о распознавании и переводе жестового языка и передовых подходах для их решениях.

+25

@NatalieVT 13 фев 2024 в 09:15

Помощь с текстом, перевод видео с японского и корейского, распознавание QR-кодов — что умеет обновлённый Яндекс Браузер

Простой

11 мин

17K

Блог компании ЯндексБраузерыМашинное обучение * Искусственный интеллектIT-компании

✏️ Технотекст 2023

Сегодня мы выпускаем большое обновление для Браузера с рекордным числом изменений, в основе которых лежат нейросети или другие методы машинного обучения. Теперь Браузер исправит ошибки в тексте, сократит или улучшит его, перескажет видео с японского или корейского, распознает QR-код в трансляции и предложит перейти по ссылке в один клик, а также защитит от фишинг-страниц и не только.

В этой статье расскажем, как мы обучали нейросеть с помощью учебника Розенталя, как модель, отвечающая за субтитры, понимает, что начал говорить другой человек, почему не каждый QR-код легко распознать и за счёт чего мы научились ловить фишинговые сайты, которые появились буквально 5 минут назад. Обо всём этом — под катом.

+55

@FlexiTech 13 фев 2024 в 09:01

Как самостоятельно запустить персонализированные чат-боты на базе Chat GPT? Собираем бота на noCode платформе

Средний

7 мин

19K

Блог компании FlexiTech.aiРазработка под e-commerce * Мессенджеры * Машинное обучение * Искусственный интеллект

Обзор

NoCode чат-бот платформы — это конструкторы на базе искусственного интеллекта, использующие технологии обработки естественного языка для создания автоматизированных, но индивидуально настраиваемых диалоговых систем. Эти боты используют алгоритмы искусственного интеллекта, зачастую они задействуют API токен от OpenAI, который способен генерировать максимально приближенные к человеческому языку ответы.

С появлением GPT маркетплейса в январе 2023 года, кастомизация чат-ботов получила новый виток развития. Благодаря способности искусственных интеллектов работать с загруженными в них базами данных, стало возможным быстро создавать решения для различных бизнес-сценариев, сократив время разработки в десятки раз без привлечения разработчиков. Конечно, не OpenAi единым, для создания кастомизированных чат ботов использовать можно любую нейросеть — тот же Google Bard или Claude.

Тем не менее, существуют определенные ограничения. Во-первых, основой часто служит технология Chat GPT. Во-вторых, отсутствует удобная система интеграции с другими инструментами. К тому же, типичные решения предполагают работу с ограниченным количеством текстовых материалов, до 20 единиц, и взаимодействие в рамках этого контента.

Для создания действительно гибких и адаптированных под бизнес-процессы решений требуются кастомные подходы. Это включает разработку API для GPT, настройку серверов, обработку баз данных и разработку пользовательского интерфейса, что может быть затратно и сложно.

К счастью, сегодня доступны платформенные решения, упрощающие запуск чат-ботов. Для кастомизации достаточно иметь API-токен выбранной нейросети и базовое понимание работы с векторными базами данных и потенциальными сценариями использования. Эти решения обеспечивают быстрое и эффективное внедрение индивидуализированных чат-ботов, открывая новые горизонты для бизнеса. Про что в этой статье мы и расскажем!

@Savvi 13 фев 2024 в 07:31

Космос будущего: о чём говорят патенты игроков мирового аэрокосмического сектора

7 мин

2.1K

Анализ и проектирование систем * Машинное обучение * Патентование * Научно-популярноеКосмонавтика

Аналитика

С 2019 по январь 2022 года я занималась патентной аналитикой мирового аэрокосмического сектора. В данной статье раскрою некоторые результаты реализованной работы, покажу, как патентная аналитика способна выявить технологические тренды будущего на примере конкретной отрасли, и представлю один из ключевых надвигающихся трендов, рассвет которого нас ещё только ожидает.

Интересно

@aansty4U 13 фев 2024 в 05:00

Лапочки с характером: Как машинное обучение помогает определить тип личности ваших пёсиков

Простой

18 мин

Блог компании BotHubМашинное обучение * Искусственный интеллект

Обзор

Предлагаю Вам разбавить все серьезные, обсуждаемые здесь темы, небольшой отдушиной для многих из нас!

Собаки – настоящие маленькие спутники жизни каждого хозяина, поэтому многих обрадовала бы возможность подобрать питомца, который будет вписываться в привычный образ жизни, и, например, сможет смирно сидеть на коленях, пока Вы пишете код, или безостановочно носиться по дому, требуя все Ваше внимание и любовь.

Все это станет реальным, благодаря машинному обучению! :) Теперь Вы можете почти так же просто определить тип личности своего питомца, как и свой собственный (излюбленный MBTI тест – такая же разработка ML)

В данной статье описывается успешная попытка применить методы искусственного интеллекта и ML для классификации и прогнозирования личностных качеств собак с использованием поведенческих данных, полученных из базы данных C-BARQ. Я в подробностях расскажу об основных теоретических и практических аспектах проделанной работы!

Приятного прочтения! :)

+12

@averkij 12 фев 2024 в 12:38

Язык твой — друг твой. Дообучаем языковые модели, собираем корпуса, делаем книги на малоресурсных языках

Средний

14 мин

10K

Open source * Машинное обучение * Искусственный интеллектИзучение языковNatural Language Processing *

Туториал

📌 градиент обреченный

Всем привет. Хочу поделиться с сообществом небольшим опытом и наработками для исследования и развития языков, в особенности малых. Для большинства таких языков нет ни систем машинного перевода, ни виртуальных ассистентов, ни других языковых моделей. Основная проблема тут в недостатке данных и отсутствии большого интереса у крупных компаний в их развитии. Однако есть достаточно большое число людей, которым дорог их язык, и которые прикладывают усилия по их сохранению и развитию. Предлагаю обсудить это и познакомиться с инструментами, которые помогут не только собирать данные, но и делать на их основе полезные вещи, типа паралельных книг для изучения языка и систем машинного перевода.

Мы научимся:

1. Дообучать мультиязычные языковые модели, переводящие текст в векторное представление (эмбеддинги).

2. Использовать их для выравнивания текстов библиотекой lingtrain-aligner, извлекая из текстов параллельные корпуса.

3. Загружать датасеты и модели на HuggingFace, чтобы это было доступно всем.

4. Создавать из выравнивания параллельные книги для изучения языков.

5. Начнем собирать датасет инструкций на малых языках, чтобы языковые модели и виртуальные смогли понимать и общаться на чувашском, якутском, башкирском и других языках.

Все это в делается в виде открытых проектов и сообществ, поэтому приглашаю всех интересующихся изучением и поддержкой языков подключаться к нам, будет интересно.

+43

@mr-pickles 12 фев 2024 в 10:05

Использование Jupyter Notebook для разведочного анализа данных ⬝ Методические рекомендации

Простой

19 мин

24K

Блог компании Wunder FundПрограммирование * Машинное обучение *

Туториал

Перевод

Блокноты Jupyter — это, уже довольно давно, один из самых неоднозначных инструментов в среде дата‑сайентистов. Одни яро критикуют Jupyter, другие горячо поддерживают этот проект. Но, тем не менее, многие согласятся с тем, что блокноты Jupyter, при правильном их использовании, могут быть очень ценным инструментом. Именно этому и посвящена данная статья — вторая в серии моих материалов про науку о данных и машинное обучение. Я поделюсь здесь методическими рекомендациями по использованию Jupyter Notebook для разведочного анализа данных.

Но для начала нам надо ответить на вопрос о том, почему блокноты Jupyter обосновались именно в научном сообществе. Когда тема Data Science была у всех на слуху, блокноты Jupyter ещё ничего из себя не представляли. До них у нас был IPython, интерактивная оболочка для Python, которую встраивали в различные IDE, вроде Spyder. Эти IDE пытались подражать работе RStudio или Matlab. Подобные инструменты получили широкое распространение среди исследователей.

В 2014 году из среды IPython вырос проект Jupyter. Масштабы его использования очень быстро стали просто огромными, чему, в основном, способствовали исследователи, которые перенесли в бизнес‑среду то, чем пользовались, занимаясь наукой. Но те подходы к использованию блокнотов, которые хороши для научных учреждений, не всегда нормально переносятся на анализ данных, проводимый в обычных организациях. Часто бывает так, что дата‑сайентистам, взятым на работу сразу после университета, очень сложно выдать то, что от них ожидают в бизнесе. Речь идёт о структуре аналитических разработок и об оформлении их результатов.

+21

@t3chnowolf 12 фев 2024 в 09:41

Нужно больше нейросетей: корпорация Google открыла общий доступ к старшей модели. Как это работает?

3 мин

5.1K

Блог компании МТСМашинное обучение * Искусственный интеллектIT-компании

Сейчас крупные IT-компании спешат разработать собственный продукт на базе ИИ-моделей, и многим это удается. Например, корпорация Google не так давно представила сразу несколько моделей, а сейчас открыла доступ к наиболее мощной из них. Кроме того, компания анонсировала и приложение, которое позволит работать с этой технологией. Что именно предлагает Google? Подробности - под катом.

+15

@PatientZero 12 фев 2024 в 07:53

Как языковая модель предсказывает следующий токен (часть 1)

27 мин

10K

Алгоритмы * Математика * Машинное обучение * Искусственный интеллект

Туториал

Перевод

Я обучил небольшой (порядка 10 миллионов параметров) трансформер по превосходному туториалу Let’s build GPT: from scratch, in code, spelled out Андрея Карпати. После того, как он заработал, я захотел максимально глубоко понять, как он устроен внутри и как создаёт свои результаты.

В исходной научной статье, как и во всех туториалах по трансформерам упор в основном делается на многоголовом самовнимании, — механизме, при помощи которого трансформеры обучаются множественным взаимосвязям между токенами, не используя рекурретности или свёртку. Ни в одной из этих статей или туториалов я не нашёл удовлетворительного объяснения того, что происходит после внимания: как конкретно результаты вычисления внимания превращаются в точные прогнозы следующего токена?

Я подумал, что могу пропустить несколько примеров промтов через обученный мной небольшой, но работающий трансформер, изучить внутренние состояния и разобраться в них. То, что казалось мне быстрым исследованием, оказалось полугодовым погружением, но дало результаты, которыми стоит поделиться. В частности, у меня появилась рабочая теория, объясняющая, как трансформер создаёт свои прогнозы, и эмпирические свидетельства того, что это объяснение, по крайней мере, правдоподобно.

Если вы знакомы с трансформерами и хотите сразу узнать вывод, то он таков: каждый блок трансформера (содержащий слой многоголового внимания и сеть с прямой связью) изучает веса, связывающие конкретный промт с классом строк, найденных в обучающем корпусе. Распределение токенов, соответствующее этим строкам в обучающем корпусе, и есть приблизительно то, что блок выводит как прогноз для следующего токена. Каждый блок может ассоциировать один и тот же промт со своим классом строк обучающего корпуса, что приводит к другому распределению следующих токенов, а значит, и к другим прогнозам. Окончательный результат работы трансформера — это линейное сочетание прогнозов каждого блока.

+23

@anikengur 11 фев 2024 в 20:23

Шпаргалка по рекомендательным системам

Средний

7 мин

14K

Машинное обучение * Искусственный интеллект

Рекомендательные системы стали неотъемлемой частью нашей жизни, помогая нам легко находить новые фильмы, музыку, книги, товары и многое другое. Цель этой шпаргалки - дать краткий обзор основных методов: коллаборативная фильтрация, матричная факторизация и некоторые нейросетевые методы.

Надеюсь, что эта шпаргалка станет полезным ресурсом для вас, помогая разобраться в мире рекомендательных систем и использовать их потенциал для улучшения пользовательского опыта.

@pin_code 11 фев 2024 в 17:08

Как студенты участвовали в огромной IT выставке со своим стендом

Простой

5 мин

1.6K

Веб-разработка * Accessibility * Машинное обучение * Развитие стартапа

Кейс

Всем привет, на связи Максим Рожков, frontend разработчик команды "ПИН-КОД".
Наша студенческая команда смогла поучаствовать в выставке с демонстрационным вариантом нашего сервиса "Изучение русского жестового языка".

В этой статье вы узнаете, как обычные студенты поучаствовали в масштабной IT выставке в Екатеринбурге.

@veseluha 11 фев 2024 в 16:46

K8sGPT: Революция в управлении кластерами Kubernetes

Простой

8 мин

15K

Блог компании BotHubМашинное обучение * Искусственный интеллектKubernetes *

Обзор

Стремительно растущая конфигурация K8s с современными трендовыми технологиями AI продолжает видоизменять трансформацию способов управления инфраструктурой и приложениями. В этой статье мы более детально обратимся к платформе K8sGPT, которая занимает центральное место в перевороте работы контейнерных приложений, начавшемся в 2023 году.

Хотя это и не новинка технологий, это не отменяет того факта, что она остается интересной темой для обсуждения.

В этой статье я хотела бы дать небольшое руководство по работе с cli, рассмотреть интересные фичи, а также представить возможные точки роста.

Приятного прочтения!

@nepexom 11 фев 2024 в 12:25

Детекция объектов. YOLO. Часть 2

Средний

9 мин

19K

Алгоритмы * Big Data * Машинное обучение * Искусственный интеллект

Ретроспектива

Кто такой YOLO? 🤔

Когда пытаешься разобраться в работе YOLO по статьям в интернете, постоянно натыкаешься на примерно такое объяснение: «Алгоритм делит изображение сеткой SxS, где каждому элементу этой сетки соответствует N ббоксов с координатами, предсказаниями классов и тд...». Но лично мне становилось только непонятнее от такого высокоуровнего описания.. Ведь в исследованиях часто всё происходит примерно так: перебирают гипотезы, пока не получат приемлемый результат, а потом уже придумывают красивое описание. Поэтому для ясности хочется в данной статье рассказать, как вообще приходили к идеям, которые ложились в основу YOLOv1 и последующих версий.

@goo-goo-goo-joob 9 фев 2024 в 13:25

Почему нельзя сделать прогноз CLTV с помощью одной модели

Средний

17 мин

6.3K

Блог компании Альфа-БанкМашинное обучение * Статистика в ITФинансы в ITData Engineering *

Кейс

Или как превратить набор продуктовых моделей склонности и оттоков в полноценный инструмент прогнозирования продуктового состояния клиента.

В чём специфика задачи оценки СLTV в банке? К каким математическим задачам она сводится? Как их решить и почему стандартные способы, например, модель регрессии, не работает? И чем здесь поможет комплексный подход?

Привет, меня зовут Мария Самоделкина, я senior Data Scientist в Хабе Юридических Лиц Альфа-Банка — лидирую расчет CLTV в нашей команде. В статье расскажу что это за задача CLTV и для чего ее нужно решать банкам.

+15

@Beeline_tech 9 фев 2024 в 12:09

Как мы считали экономику продукта «Семья» через uplift CLTV

Средний

10 мин

3.2K

Блог компании билайнСтатистика в ITУправление продажами * Машинное обучение * Математика *

Туториал

Всем привет! Меня зовут Владлен Севернов. Я работаю ML-инженером в команде CLTV билайна. В этой статье я поделюсь с вами моим опытом решения задачи uplift-моделирования для оценки экономики продукта «Семья» с точки зрения CLTV.

Что мы подразумеваем под CLTV

Подробнее про CLTV в билайне вы можете почитать в наших предыдущих статьях:

- Что такое CLTV и как мы в билайне с ним работаем
- Использование ML для прогнозирования CLTV

С использованием CLTV билайн может сосредоточиться на удержании наиболее ценных клиентов, повышении их удовлетворенности и лояльности, а также оценивать эффективность маркетинговых и рекламных кампаний.

Немного про продукт «Семья»

Семейные тарифы — это возможность создать общую группу (семью) с другими людьми и добавить в нее до пяти абонентов (в зависимости от тарифа). После объединения в семью платящим остается только один абонент, называемый «донором», а другие члены группы, которые пользуются общими пакетами минут, SMS и трафика и не платят, называются «реципиентами».

Почему для семейных тарифов необходимо считать именно CLTV?

+12

@Ilya12c 9 фев 2024 в 09:31

Роман Тезиков про СV-проекты и промт-инжиниринг как базовый навык каждого человека

7 мин

3.6K

Блог компании Magnus TechМашинное обучение * Искусственный интеллект

Интервью

К нам ~~на огонек~~ в подкаст заглянул Роман Тезиков — senior-разработчик и DL-engineer. Эксперт рассказал много интересного о своем опыте реализации ML-проектов. А «на десерт» Роман поделился тем, как он применяет промт-инжиниринг в работе и личной жизни и каких впечатляющих результатов ему удалось добиться с помощью подобных технологий.

+12

@gataAmarilla 9 фев 2024 в 09:30

Делаем intent classifier для службы поддержки без доменного датасета на русском

Средний

8 мин

4.2K

Разработка под e-commerce * Машинное обучение * Python * Natural Language Processing *

Из песочницы

В этой статье я продемонстрирую, как без собственного датасета сделать классификатор намерений пользователя для службы поддержки в сфере e-commerce. И более того, я расскажу, как у меня получилось сделать классификатор для русского языка без датасета на русском языке.

Меня зовут Елизавета Колмакова, я Data Scientist в компании, которая разрабатывает айти-решения для крупного ритейла.

@Dmytro_Kikot 9 фев 2024 в 08:00

Без остановок: определение гипогликемии прямо за рулем

8 мин

2.2K

Блог компании ua-hosting.companyЗдоровьеМашинное обучение * Научно-популярное

Физиологические и психические состояния человека очень часто отражаются в его поведении, движениях и даже в особенностях его взгляда. И речь идет не о случаях, когда человек хватается за голову и жалуется на боль, а о случаях, когда физиологические состояния проявляются в малозаметных физических изменениях. Невооруженным взглядом это можно не заметить, потому нужен инструмент фиксации и анализа подобных эпизодов. Ученые из Мюнхенского университета (Германия) создали модель ИИ, которая использует поведение человека за рулем в качестве маркеров определения низкого содержания сахара. Как эта модель работает, и насколько ее предсказания точны? Ответы на эти вопросы мы найдем в докладе ученых.

Читать дальше →

+12

@Cerberg 9 фев 2024 в 06:59

Как приручить нейросеть: практический опыт

5 мин

66K

Блог компании ReksoftМашинное обучение *

Итак, в прошлой статье я уже немного рассказывал о том, что с LLM можно работать и даже построить определенный RAG. Как и обещал, перейдем к практике! :)

Сегодня мы будем делать простейший локальный и приватный RAG для работы с базой знаний. Все это будет проходить без погружения в сложные дебри, чтобы извлечь основную суть и уже иметь представление о том, как компоненты связаны между собой, и за что они отвечают.

+26

1 2 ...

165 166

167

168 169 ...

476 477

Машинное обучение *

Можно ли научить чат-бота всегда говорить правду

Распознавание и перевод жестовых языков: обзор подходов

Помощь с текстом, перевод видео с японского и корейского, распознавание QR-кодов — что умеет обновлённый Яндекс Браузер

Как самостоятельно запустить персонализированные чат-боты на базе Chat GPT? Собираем бота на noCode платформе

Космос будущего: о чём говорят патенты игроков мирового аэрокосмического сектора

Лапочки с характером: Как машинное обучение помогает определить тип личности ваших пёсиков

Язык твой — друг твой. Дообучаем языковые модели, собираем корпуса, делаем книги на малоресурсных языках

Использование Jupyter Notebook для разведочного анализа данных ⬝ Методические рекомендации

Нужно больше нейросетей: корпорация Google открыла общий доступ к старшей модели. Как это работает?

Как языковая модель предсказывает следующий токен (часть 1)

Шпаргалка по рекомендательным системам

Как студенты участвовали в огромной IT выставке со своим стендом

K8sGPT: Революция в управлении кластерами Kubernetes

Ближайшие события

Детекция объектов. YOLO. Часть 2

Почему нельзя сделать прогноз CLTV с помощью одной модели

Как мы считали экономику продукта «Семья» через uplift CLTV

Роман Тезиков про СV-проекты и промт-инжиниринг как базовый навык каждого человека

Делаем intent classifier для службы поддержки без доменного датасета на русском

Без остановок: определение гипогликемии прямо за рулем

Как приручить нейросеть: практический опыт

Вклад авторов