Articles / Bookmarks / Profile of GefKelly / Habr

@GefKelly

User

Profile Publications Comments 9Bookmarks 12

smysloteka Mar 19 at 06:52

Интерактивные PROMPTы извлекают максимум пользы из GPT

Easy

10 min

12K

Artificial IntelligenceThe future is here

Retrospective

GPT стремительно ворвался в нашу жизнь и разделил аудиторию на две неравные части: технооптимистов и технопессимистов. Как ни странно, технопессимисты — это преимущественно профессионалы, способные трезво оценить результат, который демонстрирует GPT. А технооптимисты — люди, не достигшие вершин профессионализма. Их завораживает та лёгкость, с которой GPT генерирует тексты, картинки и видео на самые разные темы.

Споры относительно пользы или вреда от использования GPT не утихают. Я же хочу предложить вашему вниманию альтернативный взгляд: дело не в самом инструменте, а в способах его использования.

В этой статье я расскажу, как профессионалы усиливают свою мощь, задействуя интерактивные возможности GPT.

Mark_K Feb 15 at 17:57

GPT или GigaChat — ответит RAGAS

8 min

4.3K

Machine learning*

В предыдущей статье мы разбирались с тем, как RAGAS помогает оценить работу ретриверов в RAG-системах. Продолжая наше исследование, теперь мы переключаемся на другой важный аспект - качество языковых моделей, или LLM. Эти модели играют центральную роль в создании тех ответов, которые мы видим при общении с чат-ботами. Понять, насколько эффективны они в своей задаче, крайне важно, так как именно от их работы зависит успешное взаимодействие пользователей с системой.

m1shail Feb 2 at 12:48

GigaChat обогнал по качеству ChatGPT и расширил контекст до 32 тысяч токенов

Medium

7 min

44K

Machine learning*Artificial IntelligenceNatural Language Processing*SberDevices corporate blog

Analytics

Салют! Уже ни для кого не секрет, что GigaChat активно развивается, и обновление моделей не заставляет себя долго ждать. Рады сообщить вам, что новые версии GigaChat Lite и GigaChat Pro получили мощный апгрейд и стали еще более креативными, умными и точными в исполнении инструкций, а также получили более высокую оценку, чем ChatGPT (gpt-3.5-turbo-0613) на бенчмарке MMLU. На сегодняшний день GigaChat используют уже более 2,5 миллионов человек.

В новом обновлении GigaChat Lite получил расширение максимального контекста до 32768 токенов (GigaChat Lite+), а GigaChat Pro — до 8192 токенов. Вместе с контекстом мы улучшили качество ответов, превзойдя ChatGPT на русском SBS и английском MMLU, а также сделали апдейт датасетов по экономике, медицине и праву, добавили экспертные и редакторские данные, а также прокачали функции (улучшили работу запросов).

Узнать, как попробовать самую сильную версию GigaChat бесплатно, можно в конце статьи.

+30

153

Fir3wall1 Jan 18 at 14:52

Как ломать сайты на «1С-Битрикс»

4 min

20K

Information Security*1С-Bitrix*Bug hunters*

FAQ

Привет! Вероятно, тебе когда-нибудь попадались веб-приложения, построенные на «1С-Битрикс: Управление сайтом», и ты задавался вопросом: как это ломать? Вроде бы прошелся по всем известной методичке, но все равно пусто. На прошлой работе я намучился ломать такие сайты, и вследствие выживания в дикой природе «Битрикса» у меня появились свои векторы атак. Я с тобой ими поделюсь — let’s go!

perevalov_a Sep 10 2022 at 18:01

Financial News Sentiment Dataset: определяем точку входа в акции по настроению новостей

5 min

6.3K

Python*Finance in ITNatural Language Processing*

Набор данных Financial News Sentiment Dataset (FiNeS) содержит в себе заголовки финансовых новостей о компаниях, торгующихся на Московской и СПб биржах. Целевой переменной датасета является оценка тональности новостных заголовков в виде вещественного числа. Идеи для использования датасета: Создание трейдинговых стратегий на основе анализа тональности новостей "на лету"; Анализ новостного фона в разрезе времени (день/неделя) или в разрезе компании.

+12

Number571 Aug 11 2023 at 22:47

Можно ли оставаться анонимным внутри государства, которое закрыло весь внешний Интернет?

Medium

42 min

38K

Decentralized networks*Information Security*Cryptography*

Analytics

Существующие популярные анонимные сети, подобия Tor или I2P, хороши своим прикладным использованием, а также относительно хорошей скоростью и лёгкостью настройки. Они также хороши и непосредственно в анонимизации трафика, когда нам необходимо скрыть истинную связь между отправителем и получателем, основываясь на принципе федеративности, то есть на свойстве, при котором узлы сети расположены в разных государствах, а сама цепочка маршрутизации проходит сквозь множество несвязанных между собой узлов. Но что делать, если государство единственно, как выстраивать маршруты в целях анонимизации, если нет никакого сетевого доступа в другие государства? Что делать, если все доступные государства находятся в своеобразном картеле, где сам принцип федеративности теряет свой основной замысел?

+35

ru_vds Mar 28 2023 at 16:00

Всё, что вам нужно — это внимание (часть 1)

Hard

14 min

23K

Machine learning*RUVDS.com corporate blogArtificial IntelligenceNatural Language Processing*

Translation

Источник

Примечание переводчика: Недавно на Хабре мы рассказывали о статьях, которые нужно прочитать, если вы хотите заниматься искусственным интеллектом. Среди них была культовая статья Attention is all you need, выпущенная в 2017 году. С неё началось развитие больших языковых моделей, в том числе всем известного чат-бота ChatGPT. Оказалось, что у такой важной статьи нет перевода на русский язык. Мы решили исправить это. Ниже вы найдёте перевод первой части статьи, вторая часть доступна по ссылке.

Краткое содержание

Наиболее распространённые модели преобразования последовательностей основаны на сложных рекуррентных или свёрточных нейронных сетях, которые включают энкодер и декодер. В самых успешных моделях энкодер и декодер соединяются с помощью механизма внимания. В статье авторы предлагают новую простую архитектуру нейронных сетей — Трансформер. Он основан исключительно на механизмах внимания, без рекуррентности или свёрток. Эксперименты на двух задачах машинного перевода показали лучшее качество, а также больше возможностей к распараллеливанию и меньшие временные затраты на обучение. Модель достигает 28.4 по метрике BLEU на задаче перевода с английского на немецкий на данных WMT 2014, что превосходит предыдущий лучший результат на 2 пункта. На задаче перевода с английского на французский на данных WMT 2014 модель достигла наилучшего результата для решения, основанного на одной модели — 41.8 по метрике BLEU — после всего 3.5 дней обучения на 8 GPU, что составляет совсем небольшую часть тех вычислительных мощностей, которые были затрачены на обучение лучшей модели, известной из имеющихся публикаций. Авторы показывают, что Трансформер может также успешно применяться и в других задачах, таких как, например, синтаксический разбор предложений на английском языке с использованием как больших, так и весьма ограниченных наборов данных для обучения.

Читать дальше →

+59

Kouki_RUS Apr 20 2020 at 15:04

GPT-2 в картинках (визуализация языковых моделей Трансформера)

18 min

31K

Machine learning*

Translation

openAI-GPT-2-3

В 2019 году мы стали свидетелями блистательного использования машинного обучения. Модель GPT-2 от OpenAI продемонстрировала впечатляющую способность писать связные и эмоциональные тексты, превосходящие наши представления о том, что могут генерировать современные языковые модели. GPT-2 не является какой-то особенно новой архитектурой – она очень напоминает Трансформер-Декодер (decoder-only Transformer). Отличие GPT-2 в том, что это поистине громадная языковая модель на основе Трансформера, обученная на внушительном наборе данных. В этой статье мы посмотрим на архитектуру модели, позволяющую добиться таких результатов: подробно рассмотрим слой внутреннего внимания (self-attention layer) и применение декодирующего Трансформера для задач, выходящих за рамки языкового моделирования.

Читать дальше →

pcdesign Apr 3 2023 at 15:05

Обучаем с помощью LlamaIndex и OpenAI GPT-3 отвечать по вашей базе знаний

Easy

7 min

20K

Python*Artificial IntelligenceFlask*

Tutorial

Translation

От переводчика.

У меня накопилось куча всяких там данных, документов, pdf, doc, видосов на ютюбе, которые я бы хотел проиндексировать, и чтобы можно было по этой базе знаний у нейронки что-нибудь спрашивать.

Так же статья может пригодиться, если вы хотите собрать базу знаний по какой-то компании и затем заставить нейронку отвечать на вопросы пользователей. Например, чтобы ИИ прочитала кучу скучной документации, регламентов работы и прочего.

Пока выбираю, на чем это лучше сделать. Вот наткнулся на нижеследующий вариант, который решил попробовать.

Cloud4Y Mar 9 2023 at 11:42

Как сделать поисковую систему с ИИ, используя FastAPI, Qdrant и ChatGPT

Medium

11 min

7.6K

Search engines*Cloud4Y corporate blogMachine learning*SoftwareArtificial Intelligence

Tutorial

Translation

Как сделать свои мини-поисковик, который будет прикидываться великим деятелем прошлого и сыпать умными цитатами? Рассказываем.

Roosh Feb 10 2023 at 16:04

Что под капотом «ответов на вопросы» Маруси?

16 min

4.1K

VK corporate blogMachine learning*Voice user interfaces*

Привет, это команда ответов на вопросы Маруси.

Этот материал состоит из двух частей. Это вторая часть (первая часть). В ней мы чуть глубже копнём технический аспект того, как устроены ответы на вопросы Маруси.

В первой части мы поверхностно рассмотрели механизм, позволяющий нашему голосовому помощнику понимать вопросы и реагировать на них. Теперь поговорим о том, как мы некоторое время назад создавали систему ответов на вопросы, и с помощью каких решений достигался результат, соответствующий как требованиям пользователей, так и техническим ограничениям.

Материал может быть интересен тем, кто только начинает свой путь в NLP или разрабатывает аналогичные решения, но не обладает несколькими стойками c DGX.

+33

cointegrated Oct 10 2021 at 15:35

Нейросети для Natural Language Inference (NLI): логические умозаключения на русском языке

9 min

18K

Python*Semantics*Programming*Machine learning*Natural Language Processing*

NLI (natural language inference) – это задача автоматического определения логической связи между текстами. Обычно она формулируется так: для двух утверждений A и B надо выяснить, следует ли B из A. Эта задача сложная, потому что она требует хорошо понимать смысл текстов. Эта задача полезная, потому что "понимательную" способность модели можно эксплуатировать для прикладных задач типа классификации текстов. Иногда такая классификация неплохо работает даже без обучающей выборки!

До сих пор в открытом доступе не было нейросетей, специализированных на задаче NLI для русского языка, но теперь я обучил целых три: tiny, twoway и threeway. Зачем эти модели нужны, как они обучались, и в чём между ними разница – под катом.

+24