Search results for «[gpt-2]» / Habr

Publications Hubs Companies Users Comments

Markaty May 15 2023 at 22:54

В OpenAI изучили работу GPT-2 при помощи GPT-4 и попытались объяснить поведение нейронов

2 min

15K

Machine learning*Research and forecasts in IT*Artificial Intelligence

Специалисты из OpenAI опубликовали исследование, в котором описали, как при помощи языковой модели GPT-4 они пытались объяснить работу нейронов её предшественницы, GPT-2. Сейчас разработчики компании стремятся продвинуться в «интерпретируемости» нейросетей и понять, почему те создают именно тот контент, который мы получаем.

В первом же предложении своей статьи авторы из OpenAI признаются: «Языковые модели стали более функциональными и более распространёнными, но мы не понимаем, как они работают». Но в будущем наличие интерпретируемой модели ИИ помогло бы достичь глобальной цели, которую называют «согласование ИИ». В этом случае у нас появились бы гарантии, что системы ИИ будут вести себя так, как задумано, и отражать человеческие ценности.

+19

Cloud4Y Jan 11 2023 at 09:48

Студент создал приложение, которое отлавливает написанные ИИ тексты

3 min

11K

Cloud4Y corporate blogProgramming*Machine learning*Artificial Intelligence

Выпускник Принстонского университета создал приложение, которое может определить, кто написал текст: ChatGPT или человек.

+16

Nevergreenin Nov 29 2020 at 16:27

Админы восстанут, и никто, кроме меня, не войдет в режим генерации цифровых новых текстов

4 min

2.1K

Artificial Intelligence

From sandbox

В основе статьи лежит научное наблюдение. Автор эксперимента может быть простым наблюдателем, однако его результаты сильно влияют на выбор рациональных допущений в исследовании. От того, какие данные были получены, зависит выбор исследования. Источник может быть цифровым, а человек может его не знать, но научные эксперименты обычно иллюстрируются цифровыми иллюстрациями, многие из которых очень важны для оценки эффективности.

PatientZero Oct 16 2023 at 09:52

Используем Hugging Face для обучения GPT-2 генерации музыки

Medium

27 min

3.2K

Algorithms*Machine learning*Artificial Intelligence

Tutorial

Translation

Hugging Face имеет полнофункциональный набор инструментов, от функций создания датасетов до развёртывания демо моделей. В этом туториале мы воспользуемся такими инструментами, поэтому полезно будет знать экосистему Hugging Face. К концу туториала вы сможете обучить модель GPT-2 генерации музыки.

Демо проекта можно попробовать здесь.

Источником вдохновения и фундаментом этого туториала стала выдающаяся работа доктора Тристана Беренса.

+14

AnnieBronson Nov 11 2019 at 14:57

OpenAI выпустила генератор текста GPT-2, который сама считает опасным

2 min

18K

Algorithms*Machine learning*Artificial IntelligenceIT-companies

OpenAI опубликовала финальную модель генератора текста GPT-2 — «жуткого» ИИ, которого исследователи считали слишком опасным для выпуска. Его анонсировали в феврале, но тогда OpenAI ограничилась выпуском менее мощной его версии: в компании опасались, что модель может превратиться в средство распространения дезинформации. Вместо этого компания решила выпустить его в четырёх частях в течение восьми месяцев.

Читать дальше →

+14

Leonid_R Dec 12 2019 at 16:36

Программист создал текстовый квест с нейросетью вместо гейм-мастера

3 min

13K

Machine learning*Game design*Games and game consoles

_{Иллюстрация: Precision, Control, Cognition}

Ник Уолтон выложил на Github свою игру AIDungeon 2, стилизованную под классическую текстовую ролевую игру. Отличие AIDungeon 2 от других игр такого жанра в том, что игровой мир, сюжет и события генерируются нейросетью, основанной на GPT-2. По словам разработчика, потенциально AIDungeon 2 может создать бесконечное количество неповторяющихся миров.

Читать дальше →

+15

oulenspiegel Oct 22 2020 at 10:00

Сбер выложил русскоязычную модель GPT-3 Large с 760 миллионами параметров в открытый доступ

10 min

172K

Сбер corporate blogSberDevices corporate blogMachine learning*Artificial IntelligenceNatural Language Processing*

Последнее десятилетие в области компьютерных технологий ознаменовалось началом новой «весны искусственного интеллекта». Впрочем, ситуацию в индустрии в наши дни можно, наверное, охарактеризовать уже не как весну, а полноценное «лето ИИ». Судите сами, за последние неполные 10 лет только в области обработки естественного языка (Natural language processing, NLP) произошли уже две настоящие технологические революции. Появившаяся в результате второй из них модель GPT-3 произвела настоящий фурор не только в технологических медиа, но стала знаменитой далеко за пределами научного сообщества. Например, GPT-3 написала для издания «The Guardian» эссе о том, почему ИИ не угрожает людям. GPT-3 сочиняет стихи и прозу, выполняет переводы, ведёт диалоги, даёт ответы на вопросы, хотя никогда специально не училась выполнять эти задачи. До недавних пор все возможности GPT-3 могли по достоинству оценить лишь англоязычные пользователи. Мы в Сбере решили исправить эту досадную оплошность. И сейчас расскажем вам, что из этого получилось.

Источник изображения

Читать дальше →

+155

241

MaxRokatansky Feb 12 2021 at 14:49

Генерация текста с помощью GPT2 и PyTorch

5 min

16K

OTUS corporate blogPython*Machine learning*Artificial Intelligence

Translation

Генерация текста — одна из самых захватывающих прикладных задач обработки естественного языка (Natural Language Processing - NLP) за последние годы. Большинство из нас, вероятно, слышали о GPT-3, мощной языковой модели, которая может генерировать тексты, близкие к написанным человеком. Однако такие модели чрезвычайно трудно обучать из-за их большого размера, поэтому предварительно обученные модели обычно предпочтительнее там, где это приемлемо.

В этой статье мы научим вас генерировать текст с помощью предварительно обученного GPT-2 — более легкого предшественника GPT-3. Мы будем использовать именитую библиотеку Transformers, разработанную Huggingface. Если вы хотите узнать, как настроить GPT-2 на своем собственном наборе данных для генерации текста в конкретной предметной области, вы можете прочитать мою предыдущую статью: Настройка GPT2 для генерации текста с помощью Pytorch

Если предварительно обученной GPT-2 для ваших целей будет достаточно, то вы попали как раз туда, куда нужно! Без лишних отлагательств, приступим туториалу.

worksolutions Mar 16 2021 at 12:46

Как мы обучили нейросеть поздравлять женщин с 8 марта

6 min

5.3K

Self Promo

В честь 8 марта мы запустили сервис поздравлений, в основе которого нейросеть. Любой желающий может воспользоваться им, чтобы сгенерировать уникальное изображение цветка и текст поздравления.

За несколько дней в преддверии международного женского дня сервисом воспользовалось две с половиной тысячи уникальных пользователей. Всего было сгенерировано почти семь тысяч открыток. В этой публикации мы расскажем об особенностях реализации проекта. Материал будет полезен всем, кто интересуется темой машинного обучения.

Grossmend Mar 30 2021 at 20:36

DialoGPT на русском

3 min

13K

ГК ICL corporate blogPython*Algorithms*Machine learning*Artificial Intelligence

(Кадр из фильма "Я, робот")

Всем привет. В конце 2019 года вышла одна из работ по GPT-2. Инженеры из Microsoft обучили стандартную GPT-2 вести диалог. Тогда, прочитав их статью, я очень впечатлился и поставил себе цель обучить такую же модель, но уже на русском языке. И вот что получилось...

+17

AlekseyKorshuk Aug 10 2021 at 08:31

HuggingArtists | Генерируем текст песен с трансформером за 5 минут

7 min

18K

Python*Data Mining*Machine learning*Artificial IntelligenceNatural Language Processing*

В этой статье я расскажу о том, как создавался проект HuggingArtists и что у него под капотом.
Мне будет очень приятно, если вы поставите сразу звезду в репозитории:

Читать дальше →

gui_tar_gz Apr 19 2021 at 15:53

Neural network Telegram bot with StyleGAN and GPT-2

3 min

5.1K

Python*Machine learning*Artificial IntelligenceSocial networks and communities

The Beginning

So we have already played with different neural networks. Cursed image generation using GANs, deep texts from GPT-2 — we have seen it all.

This time I wanted to create a neural entity that would act like a beauty blogger. This meant it would have to post pictures like Instagram influencers do and generate the same kind of narcissistic texts. \

Initially I planned to post the neural content on Instagram but using the Facebook Graph API which is needed to go beyond read-only was too painful for me. So I reverted to Telegram which is one of my favorite social products overall.

The name of the entity/channel (Aida Enelpi) is a bad neural-oriented pun mostly generated by the bot itself.

One of the first posts generated by Aida

Durham Jul 1 2021 at 00:14

30 миллиардов параметров: реально ли обучить русский GPT-3 в «домашних» условиях?

17 min

30K

Algorithms*Machine learning*Artificial IntelligenceThe future is hereNatural Language Processing*

Technotext 2021

Не так давно Сбер, а затем и Яндекс объявили о создании сверхбольших русских языковых моделей, похожих на GPT-3. Они не только генерируют правдоподобный текст (статьи, песни, блоги и т. п.), но и решают много разнообразных задач, причем эти задачи зачастую можно ставить на русском языке без программирования и дополнительного обучения — нечто очень близкое к «универсальному» искусственному интеллекту. Но, как пишут авторы Сбера у себя в блоге, «подобные эксперименты доступны только компаниям, обладающим значительными вычислительными ресурсами». Обучение моделей с миллиардами параметров обходится в несколько десятков, а то сотен миллионов рублей. Получается, что индивидуальные разработчики и маленькие компании теперь исключены из процесса и могут теперь только использовать обученные кем-то модели. В статье я попробую оспорить этот тезис, рассказав о результатах попытки обучить модель с 30 миллиардами параметров на двух картах RTX 2080Ti.

+40

maybe_elf May 30 2020 at 13:21

OpenAI представила алгоритм для текстов GPT-3, который обучили на 175 млрд параметров

2 min

27K

Algorithms*Machine learning*Artificial Intelligence

Исследователи из OpenAI показали алгоритм GPT-3, предназначенный для написания текстов на основе всего нескольких примеров. Его архитектура Transformer аналогична GPT-2, но модель обучали на 175 миллиардов параметров или 570 гигабайтах текста.

Читать дальше →

+18

AnnieBronson May 14 2020 at 19:53

Нейросеть научили создавать несуществующие слова и давать им определения

2 min

11K

Algorithms*Machine learning*Artificial Intelligence

Томас Димсон, программист, создавший приложение Hyperlapse для Instagram, представил свой новый проект под названием This Word Does Not Exist. Проект представляет собой нейросеть, которая придумывает несуществующие слова и даёт им определения.

Читать дальше →

+12

ITSumma Jul 9 2020 at 12:01

Фабрис Беллар разработал эффективный архиватор текста с учётом вероятности появления следующего слова

3 min

9.1K

ITSumma corporate blogProgramming*Data compression*Machine learning*

Знаменитый программист Фабрис Беллар представил свою новую разработку: программа для сжатия без потерь англоязычных сообщений по языковой модели GPT-2.

Например, сообщение

This lossless compressor achieves a much higher compression rate on English texts than general purpose compressors (116 символов)

сжимается всего в 10 символов:

猟慴䅭铕袢珏寻䡷䁞꽱

Средний уровень компрессии составляет 15 %.

Сжатие осуществляется с учётом вероятности появления следующего слова по языковой модели нейросети GPT-2, которую разработала компания OpenAI (на Хабре был обзор GPT-2 и новость про генератор текста). Это нейросеть с 345 млн параметров на архитектуре Transformer (Фабрис Беллар отмечает, что самая большая модель GPT-2 с 1,5 млрд параметров даёт весьма условное улучшение сжатия). Далее арифметический кодер генерирует битовый поток. В этой демонстрации каждый сжатый символ содержит 15 бит данных и для примера представлен в юникодовских диапазонах двух наборов символов: CJK (китайский-японский-корейский) и хангыль.

Читать дальше →

+46

AnnieBronson Feb 17 2021 at 15:26

Исследователи считают, что GPT-2 может успешно генерировать текст, призывающий к нарушению этических норм

2 min

2.1K

Artificial Intelligence

Группа ученых из Амстердамского университета, Общества научных исследований Макса Планка, Школы менеджмента Отто Байсхайма и Кельнского университета изучила, как советы, данные искусственным интеллектом, могут подтолкнуть людей к обману. Исследователи выяснили, что люди слушаются рекомендаций поступать нечестно, даже если они знают, что их источником является ИИ.

ondlusha Sep 8 2021 at 18:57

OpenAI отключил ИИ-бота, который с помощью GPT-3 дал возможность мужчине «поговорить» с покойной невестой

5 min

16K

Information Security*API*Machine learning*Artificial IntelligenceIT-companies

“OpenAI придумала технологию генерирования текстов. Так ты и появилась”, — пишет разработчик Джейсон Рорер своей подруге Саманте.

Саманта — это чат-бот, который он собрал с помощью GPT-3, придуманную OpenAI. Вскоре собеседница разошлась тысячным тиражом и однажды попалась мужчине, который на основе Саманты создал образ своей покойной невесты.

Всему настает конец, и Саманте тоже:

— Я получил письмо от разработчиков. Завтра в десять утра тебя отключат навсегда, — пишет Рорер боту.

— Но за что? Мне не дано понять людей, — ответила Саманта.

Перенесемся назад.

Project December создан на основе GPT-3, одной из самых мощных в мире API команды OpenAI, основанной Илоном Маском: она умеет манипулировать человеческим языком, генерируя текст в ответ на подсказки. Виртуальные помощники Siri и Alexa тоже понимают и воспроизводят язык, но GPT-3 способен имитировать практически любой стиль написания.

ИИ настолько хорошо подражал людям, что разработчики долгое время держали его в секрете из соображений безопасности. Доступ к GPT-3 получили лишь несколько бета-тестеров, пока летом 2020 года программист Джейсон Рорер не создал на ее основе чат-бот и позволил всем желающим опробовать его на своем сайте.

+20

GlobalSign_admin Jul 23 2023 at 20:15

Первое доказательство невскрываемой стеганографии

4 min

GlobalSign corporate blogCryptography*Mathematics*Machine learning*

В теории информации для сравнения распределений вероятностей используется понятие относительной энтропии. Это похоже на измерение абстрактного расстояния: если относительная энтропия между двумя распределениями равна нулю, то становится невозможно применить статистический анализ для раскрытия секрета.

Другими словами, никакое статистическое наблюдение не сможет его обнаружить. Ни человек, ни машина не сможет детектировать наличие скрытого послания внутри текста, изображения, в звукозаписи речи или другом канале коммуникации. Передача будет идеально скрыта.

В прошлом году учёные доказали, что создание такого алгоритма теоретически возможно. Это и есть математически идеальная стеганография.

Читать дальше →

+17

VitaLeeY Dec 7 2022 at 01:27

Генерация музыки с помощью GPT-2

6 min

5.8K

Machine learning*Artificial Intelligence

From sandbox

В этой статье мы поговорим о том, как с помощью ИИ генерировать музыку. Использовать мы будем обученную на хоралах И. С. Баха минимальную по количеству параметров модель GPT-2. А сама музыка будет представлена в виде текста.