Статьи / Закладки / Профиль Gers1972 / Хабр

Как стать автором

Владислав @Gers1972

Аналитик данных

Профиль Публикации 4Комментарии 16Закладки 1.1K

gofat 10 июл в 11:35

Prompt engineering 101

Простой

26 мин

5.4K

Python*Машинное обучение*Искусственный интеллектNatural Language Processing*Блог компании X5 Tech

Из песочницы

Привет!

Использование LLM все больше проникает в бизнес. И ритейл — не исключение. В X5 мы решили сделать небольшую методичку по prompt engineering для обычного бизнес‑пользователя. Мы посмотрели на получившийся результат и решили поделиться этой методичкой с сообществом, чтобы как можно больше людей смогли овладеть разными техниками, позволяющими работать с LLM эффективнее.

Для этого нам сначала придется разобраться с тем, как вообще устроены LLM, затем поговорим о промптах: общие принципы построения, техники оптимизации и промпты для изображений. А на десерт предложим вам продвинутые техники работы с LLM: автоматизированные подходы по улучшению промптов, Retrieval‑Augmented Generation и разметка данных для ML с помощью LLM.

Читать далее

+11

rmndrnts 12 дек 2023 в 11:19

Phoenix: разбираемся со сбоями ML системы прямо в вашем ноутбуке

Средний

6 мин

2.3K

Python*Анализ и проектирование систем*Data Mining*Визуализация данных*Машинное обучение*

Из песочницы

Нам до сих пор не до конца понятны некоторые возможности больших языковых моделей. Приложения с большими языковыми моделями должны быть оснащены необходимыми инструментами и оставлять данные о событиях, произошедших в процессе работы. Более того, когда данные собраны, их необходимо оценить на предмет критических ошибок, таких как галлюцинации и токсичность.

В статье рассматривается open-source библиотека Phoenix, основная цель которой — помочь специалистам по данным понять и оценить сложные LLM-приложения, чтобы они могли узнать больше о внутренней работе системы.

Читать далее

+6

veseluha 2 июл в 17:00

17 продвинутых RAG-техник: как превратить прототип LLM-приложения в готовое решение

18 мин

4.8K

Машинное обучение*Искусственный интеллектБлог компании BotHub

Перевод

GenAI стремительно ворвался в нашу жизнь. Ещё вчера мы с опаской смотрели на него, а сегодня уже вовсю используем в работе. Многие эксперты пророчат GenAI большое будущее, считая его предвестником новой промышленной революции.

И ведь действительно, LLM и мультимодальные модели уже сейчас демонстрируют впечатляющие возможности и при этом относительно просты во внедрении. Создать простое приложение на их основе - дело нескольких строк кода. Однако переход от эксперимента к стабильному и надежному решению — задача посложнее.

Как метко подметил Мэтт Тёрк: если в 2023 году мы боялись, что GenAI нас погубит, то в 2024-м мечтаем хоть как-то приручить его и запустить в "мелкосерийное производство".

Если вы уже успели создать свои первые LLM-приложения и готовы вывести их на новый уровень, эта статья для вас. Мы рассмотрим 17 продвинутых RAG-техник, которые помогут избежать типичных ошибок и превратить ваш прототип в мощное и стабильное решение.

Пристегните ремни, мы отправляемся в увлекательное путешествие по миру AGI! Вместе мы:

Поймем, как система отличает ценную информацию от информационного шума;

Разберемся, как правильно подготовить данные для LLM;

Выясним, можно ли строить цепочки из нескольких LLM;

Поймем, как направлять запросы через разные компоненты системы.

Приятного прочтения(:

Читать далее

+17

btseytlin 21 июн в 16:49

Он победил LLM RAG: реализуем BM25+ с самых азов

Простой

18 мин

13K

Поисковые технологии*Python*Алгоритмы*Машинное обучение*Искусственный интеллект

Туториал

Привет, меня зовут Борис. Я автор телеграм канала Борис опять. Периодически мне на глаза попадается что-то интересное и я глубоко в этом закапываюсь. В данном случае это алгоритм поиска BM25+, который победил продвинутые методы векторного поиска на LLM.

Разберемся, что это за зверь и почему он так хорошо работает. В этой статье мы реализуем его на Python с нуля. Начнем с самого простого поиска, перейдем к TF-IDF, а затем выведем из него BM25+.

Статья подойдет тем, кто вообще ничего не знает о поиске, а более опытные ребята могут пролистать до реализации алгоритма.

Код доступен в Google Collab.

Читать далее

+39

Squirrelfm 2 фев в 19:29

Архитектура RAG: полный гайд

Сложный

13 мин

15K

Машинное обучение*Искусственный интеллектБлог компании Raft

Туториал

Если, открывая холодильник вы еще не слышали из него про RAG, то наверняка скоро услышите. Однако, в сети на удивление мало полных гайдов, учитывающих все тонкости (оценка релевантности, борьба с галлюцинациями и т.д.) а не обрывочных кусков. Базируясь на опыте нашей работы, я составил гайд который покрывает эту тему наиболее полно.

Итак зачем нужен RAG?

Читать далее

+28

Favicon88 18 фев 2023 в 23:07

Пишем Телеграм бота на Python c использованием API ChatGPT

Простой

4 мин

53K

Туториал

Recovery Mode

Перевод

Данная статья является вольным переводом статьи на medium.com, плюсом от себя реализация API ChatGPT в Телеграм боте.

Тема как написать телеграм бота уже довольно тривиальная, статей в интернете полно, поэтому тут я затронул это дело не так глубоко, ниже выложу ссылки на исходный код, разобраться будет не сложно. Основным мотивом написания статьи послужил тот факт, что ChatGPT не доступен в ряде стран, в том числе в России, и хотелось сделать его по настоящему общедоступным.

Готовый/работающий телеграм бот ChatGPT доступен тут.

На вопрос "Кто ты?" сама нейросеть отвечает примерно следующее "Я - ChatGPT, крупнейшая языковая модель, созданная OpenAI. Я разработана для обработки естественного языка и могу помочь вам ответить на вопросы, обсудить темы или предоставить информацию на различные темы".

Другими словами, по моему субъективному мнению нейросеть затачивается в первую очередь для поддержки разговора, в идеале показать, что там сидит живой человек, а не обученная AI модель. Поэтому когда будете играть с чатом не забывайте об этом, не следует ожидать от чата достоверных и точных данных, или глубокого смысла, сейчас она не об этом, пока еще не об этом.

Итак, как получить доступ к сервису ChatGPT из запрещенных стран написано в статье на хабре, хочу обратить ваше внимание, что будет необходимо сперва создать gmail почту с подтверждением по СМС на иностранный номер телефона, затем при регистрации на сайте ChatGPT также подтвердить номер телефона по СМС, и эти два номера телефона совсем не обязательно должны быть одинаковыми, поэтому сервисы по продаже номеров мобильных телефонов на одну смс вполне годятся.

Читать далее

-3

EddyLan 15 мая в 11:09

ChatGPT + YandexGPT API = ЛЮБОФ. Часть 1

Средний

17 мин

15K

Python*Программирование*Управление разработкой*Блог компании Open Data ScienceИскусственный интеллект

Туториал

Сказ о том, как мы, дата-сайентист и аналитик данных, на троих с ChatGPT, без программиста и девопса, создали сервис пересказа новостей TechMix с текстом и озвучкой. ChatGPT писал код, а мы ему только поддакивали.

Авторы: Эдуард Ланчев, Илья Кузнецов, ChatGPT

Читать далее

+16

allseeteam 8 мая в 11:00

YandexGPT API быстро и без труда с Python SDK. Делимся опытом интеграции

Средний

25 мин

9.3K

Open source*Python*API*Яндекс API*Машинное обучение*

Кейс

YandexGPT API — сервис для доступа к генеративным языковым моделям, хоть и является мощным инструментом во многих задачах, однако может озадачить разработчика, решившего внедрить его в свои проекты отсутствием официального SDK, разнообразием способов авторизации, видов моделей и эндпоинтов API. В данной статье я рассказываю, как мы внедряли YandexGPT в свои проекты, а в конце делюсь всеми наработками.

Читать далее

+10

Lithium_vn 6 мая в 18:28

Как пользоваться Claude: знакомство с главным конкурентом ChatGPT и базовые правила его использования

Простой

14 мин

18K

Машинное обучение*Искусственный интеллектБлог компании BotHub

Обзор

В последние годы мы стали свидетелями стремительного развития и роста популярности чат-ботов на базе искусственного интеллекта. Одним из наиболее известных и широко используемых чат-ботов стал ChatGPT от компании OpenAI, который продемонстрировал впечатляющие возможности в общении и решении разнообразных задач.

Однако ChatGPT - далеко не единственный продвинутый чат-бот, доступный сегодня. Не так давно компания Anthropic представила миру Claude v.3 Opus - ИИ-ассистента нового поколения, который во многом превосходит возможности ChatGPT и имеет ряд значимых отличий. И хотя на первый взгляд Claude может показаться похожим на своего более известного "коллегу", при ближайшем рассмотрении становятся видны существенные различия в архитектуре, возможностях и особенностях взаимодействия с пользователем.

В этой статье мы рассмотрим ключевые отличия Claude от ChatGPT, дадим практические рекомендации по эффективной работе с этим ИИ-помощником и обсудим перспективы дальнейшего развития подобных систем. Наша цель - предоставить полезное руководство, которое поможет вам в полной мере освоить и применять Claude, избегая распространенных ошибок и открывая новые горизонты в решении задач с помощью ИИ. Конечно, в этой статье не получится рассказать все, но самое основное - однозначно.

Приятного прочтения!:)

Читать далее

+15

Mark_K 15 фев в 17:57

GPT или GigaChat — ответит RAGAS

8 мин

4.1K

Машинное обучение*

В предыдущей статье мы разбирались с тем, как RAGAS помогает оценить работу ретриверов в RAG-системах. Продолжая наше исследование, теперь мы переключаемся на другой важный аспект - качество языковых моделей, или LLM. Эти модели играют центральную роль в создании тех ответов, которые мы видим при общении с чат-ботами. Понять, насколько эффективны они в своей задаче, крайне важно, так как именно от их работы зависит успешное взаимодействие пользователей с системой.

Читать далее

+5

Mark_K 22 янв в 09:15

Как сделать чат-бота лучше, нужен всего лишь простой советский… RAGAS

8 мин

6K

Машинное обучение*

Туториал

В вводной части обзора мы познакомились с концепцией Retrieval Augmented Generation (RAG) и её расширением через методологию RAGAS (Retrieval Augmented Generation Automated Scoring). Мы разобрались, как RAGAS подходит к процессу оценки эффективности и точности RAG-систем.

В этой части мы более подробно рассмотрим техническую сторону RAGAS. Как обычно, начнем с более простых и интуитивно понятных примеров, потом перейдем к более сложным сценариям.

Читать далее

+13

Mark_K 3 дек 2023 в 17:01

Оцениваем RAG-пайплайны

4 мин

5.9K

Машинное обучение*

RAG (Retrieval Augmented Generation) - это популярный подход, объединяющий извлечение данных из баз и генерацию текста, позволяя моделям AI давать ответы на вопросы, основанные на информации, которую они не видели в процессе обучения. Важным этапом в развитии RAG является его эффективная оценка, и именно здесь на сцену выходит RAGAS (Retrieval Augmented Generation Automated Scoring) - метод автоматизированной оценки, который позволяет не только оценить качество ответов, но и анализировать процесс генерации в деталях.

Читать далее

+6

DataSecrets 3 мая в 18:14

На практике пробуем KAN – принципиально новую архитектуру нейросетей

Средний

5 мин

32K

Python*Big Data*Машинное обучение*Искусственный интеллект

Обзор

На днях ученые из MIT показали альтернативу многослойному перцептрону (MLP). MLP с самого момента изобретения глубокого обучения лежит в основе всех нейросетей, какими мы их знаем сегодня. На его идее в том числе построены большие языковые модели и системы компьютерного зрения.

Однако теперь все может измениться. В KAN (Kolmogorov-Arnold Networks) исследователи реализовали перемещение функций активации с нейронов на ребра нейросети, и такой подход показал блестящие результаты.

Читать далее

+76

slivka_83 29 апр в 18:34

Подбор гиперпараметров RAG-системы с помощью Optuna

Средний

16 мин

4.1K

Python*Data Mining*Машинное обучение*Искусственный интеллектNatural Language Processing*

Туториал

Сказ о том, как с помощью Opuna’ы сделать вашу RAG-систему чуточку (а может и не чуточку) эффективнее :)

Читать далее

+14

vladislav_shevchenko 17 апр в 16:57

SPARK для «малышей»

Простой

14 мин

6.9K

Блог компании Альфа-БанкHadoop*Data Engineering*

Туториал

Примеры кода на Python для работы с Apache Spark для «самых маленьких» (и немного «картинок»).

Данная статья представляет собой обзор основных функций Apache Spark и рассматривает способы их применения в реальных задачах обработки данных. Apache Spark — это мощная и гибкая система для обработки больших объёмов данных, предлагающая широкий спектр возможностей для аналитики и машинного обучения. В нашем обзоре мы сфокусируемся на ключевых функциях чтения, обработки и сохранения данных, демонстрируя примеры кода, которые помогут новичкам быстро включиться в работу и начать использовать эти возможности в своих проектах.

Читать далее

+26

alexwortega 23 янв в 08:43

Вихрь — семейство переведенных русскоязычных LLM

Средний

5 мин

19K

Natural Language Processing*

Кейс

Мы русифицировали Mistral и он работает лучше(по бенчмаркам) чем закрытые русскоязычные LLM. Как мы это сделали, ссылки на модели и бенчмарки - в статье.

Читать далее

+36

Chetter2 2 окт 2017 в 15:44

Методы приближенного поиска ближайших соседей

11 мин

52K

Блог компании VKАлгоритмы*Машинное обучение*

Довольно часто программисты и специалисты из области data science сталкиваются с задачей поиска похожих профилей пользователей или подбора схожей музыки. Решения могут сводиться к преобразованию объектов в векторную форму и поиску ближайших.

Мы тоже столкнулись с необходимостью поиска ближайших соседей в задаче распознавания лиц. Там мы формируем векторные представления лиц при помощи нейросети и ищем ближайшие векторы уже известных людей. Изначально для поиска мы выбрали Annoy, как хорошо известный и проверенный алгоритм, используемый в том числе в Spotify. Но быстро поняли, что с его аппетитами по памяти мы либо не вмещаемся в RAM, либо сильно теряем в точности. Это привело к небольшому исследованию. О результатах которого пойдет речь ниже.

Читать дальше →

+53

Ohh_my_natalie 9 авг 2023 в 13:16

Каннибализация – риск или возможность? Взгляд бизнес-аналитика

Простой

9 мин

3.2K

Управление продуктом*Управление продажами*Блог компании GlowByte

Мнение

В ходе работы над проектами бизнес-аналитик сталкивается с различными маркетинговыми явлениями. Часть из них воспринимается однозначно или достаточно близко друг к другу даже в разных предметных областях, однако есть и такие, подход к анализу которых отличается от отрасли к отрасли. Эффект каннибализации – одно из таких многогранных явлений. О нем и пойдет речь в статье. Сразу оговорюсь, что материал в большей степени будет интересен начинающим аналитикам в сфере банковского маркетинга и информационных технологий ввиду специфики данных отраслей. Тем не менее описанный взгляд на эффект каннибализации может быть полезен и для специалистов других сфер деятельности.

Эффект каннибализации, на первый взгляд, в различных источниках определяется однозначно: как сокращение объема продаж одного продукта компании за счет вывода на рынок другого продукта. Однако, изучая причины возникновения и отношение компаний к данному процессу, становится очевидно, что в практической деятельности присутствуют расхождения в его понимании и, как следствие, методологии анализа.

В статье я попробую агрегировать имеющуюся на текущий момент теоретическую информацию об эффекте каннибализации с целью формирования у читателя, неравнодушного к теме, комплексного понимания данного явления. Но сначала представлюсь: меня зовут Наталья Столбецова, работаю старшим бизнес-аналитиком в GlowByte. Основная моя специализация – автоматизация задач целевого маркетинга. В моем портфолио есть опыт работы как на проектах банковского маркетинга, так и ритейла. И я сама не раз на проектах сталкивалась с тем, что при проведении исследований существует конфликт терминологий и понимания бизнес-процессов, в том числе эффекта каннибализации.

Читать далее

+16

Dreamastiy 27 сен 2018 в 12:00

Оптимизация цен в оффлайн ритейле

8 мин

9.3K

Машинное обучение*Бизнес-модели*Блог компании SAS

Данная статья открывает цикл, посвященный розничной торговле. Идею использования аналитики в ритейле можно изобразить в виде вот такого маркетингового круга:

Основная идея, на первый взгляд, бесполезной картинки – показать, что аналитика позволяет предсказать последствия принятия тех или иных бизнес решений, основываясь на последующем изменении покупательского спроса. И чем лучше мы понимаем спрос, агрегируя информацию из разных каналов, тем лучше мы будем предсказывать результат. Короче говоря, картинка идеального мира, и каждый идет к этому миру своим путем.

Сегодня речь пойдет об аналитике ценообразования в офлайн ритейле.

Читать дальше →

+11

NikitaMartynov 11 апр в 11:02

SAGE v1.1.0: как мы учили генеративный корректор орфографии ошибаться реже, думать быстрее и исправлять пунктуацию

Средний

15 мин

1.9K

Машинное обучение*Искусственный интеллектNatural Language Processing*Блог компании SberDevices

В октябре прошлого года мы выпустили SAGE — библиотеку для генеративной коррекции орфографии, которая включает в себя семейство предобученных трансформерных моделей, хаб с параллельными вручную размеченными датасетами и два алгоритма текстовой аугментации на основе намеренного искажения правописания.

С момента прошлого релиза мы улучшили качество наших моделей более чем на 10%, добавили правку знаков пунктуации и регистра, провели эксперименты по сжатию и ускорению полученных решений, добавили разметку пунктуации в датасеты и новые метрики в библиотеку, а нашу статью взяли на EACL 2024 в Мальте.

Читать далее

+18

1

2 3 ...