Pull to refresh

Comments 42

Вообще на русском уже есть сервис, который копирайтит тексты автоматом — smartwriter.io.
Вот бред, который я придумал на ходу и закинул туда:
Солевые шахты в Усть-Илимске были незамедлительно захвачены революционно настроенным временным правительством. С помощью радиоустройств были вычисленны и обезврежены ключевые узлы связи, находившиеся в радиусе 20-30 километров.

И вот, что я смог составить из предложеных правок:
Революционное правительство, захватившее соляные шахты в Усть-Илимске и объявившее их собственностью Временного правительства, немедленно приступило к их использованию. Благодаря использованию специальных радиоустройств была выявлена и обезврежена ключевая система связи, находящаяся в радиусе 20-30 километров от места обнаружения объекта.

Оно не только исправляет ошибки («солевые» — «соляные») но и делает смысловую замену.
С технической точки зрения впечатляет. С практической, конечно, в лучшем случае подручное средство для переписывания плагиата.
Только что попробовал.
Это совсем не то, что нужно. Смартрайтер — это платформа для третьесортного рерайта.
Хотя прикольно то, что машина может сделать такое.
Пока не внедрена подписка, вряд ли кто-то будет выкатывать более сложные фичи. Сервис то бесплатный сейчас для любых объемов. Фактически, это та же генерация текста, только под задачу перефраза. Думаю, они могут и больше, но какой смысл катить это просто так? Ресурсы для такой штуки нужны не малые.
Скришоты для GTP-3 Вы сделали крайне неудачно. У меня с 22'' экраном приходится чуть ли не через лупу рассматривать, что там насочинял искусственный разум. А те кто читает Хабр с планшета, наверное, Вашу статью вообще дочитывать не стали.

Чтобы показать интерфейс сайта, достаточно было бы только на первом скриншоте фотографировать весь экран. А на следующих захватывать только окошко со сгенерированным текстом — тогда буквы были бы крупнее и можно было бы комфортно читать, не увеличивая масштаб просмотра.

Может дело в софте… Какую утилиту вы используете для скриншотов?

Lightshot. Сразу позволяет выделить нужную часть экрана, а не «фотографировать» всё. Да и любой скриншот всегда можно обрезать в Фотошопе.

В десятой винде тоже можно фотографировать сразу нужный кусок через Win+Shift+S. На маке — Cmd-Shift-4, опционально добавить Ctrl для сохранения в буфер вместо файла.

А качество скриншота будет нормальным?

Не хуже и не лучше, чем обычный Print Screen/Cmd-Shift-3 :-)

Я думаю GTP-3 нужно давать больше исходного материала, тогда текст получиться лучше. По меньшей мере, когда я давал 2-3 абзаца, алгоритм дописывал свои 2-3 и они были осмысленными, с ними вполне можно было дальше работать, например через главред.
Я не пойму, как можно во всей статье некорректно назвать сеть, если даже на вложенных скриншотах написано правильно.
что ж… буду внимательнее впредь.
Бизнес сразу поймет, что нейросеть не генерирует нормальные тексты — и призовет на помощь копирайтеров. То есть ситуация в мире останется без изменений.

А вот и неправильно. Оно просто слишком хорошо подстраивается под стиль затравки. Хочешь получить нормальный текст — нужно на вход что-то приблизительно нормальное написать.


И ситуация в мире как раз изменится. Потому что существующие сети очень увеличивают производительность (да и качество, в общем, тоже) писателя, которому хочется красивой воды. Растянуть дюжину осмысленных высказываний раз в пять при помощи 'высокохудожественного' украшательства — при помощи этого инструмента легко и быстро делается.


Можно поискать в ютубе/Twitch как в Ai Dungeon играют. И посмотреть, как оно тот совершенны бред, что ей на вход подают, в что-то читабельное превращает. Ну или вот тут(Youtube playlist) писатель пытается этот инструмент использовать (смотреть надо где-то с третьего эпизода — она там на платную версию переключилась, которая значительно лучше)

ну… я ж написал, что я не футуролог :)
Можно поискать в ютубе/Twitch как в Ai Dungeon играют. И посмотреть, как оно тот совершенны бред, что ей на вход подают, в что-то читабельное превращает.

Это все либо черрипикинг, либо заслуга самого человека, который благодаря большому опыту в результате тренировки учится управлять сетью и добиваться от нее осмысленного результата. Без подготовки получить сколько-нибудь вменяемый результат — очень сложная задача, в 9 случаев из 10 получается бред.
Я бы сказал, что написать самому — намного проще.
И это речь о платной версии, если юзать классическую gpt-2, то там вообще швах.

Это все либо черрипикинг,
Именно поэтому и нужно смотреть ютуб — там видно без черрипкинга.
И оно нужно не для осмысленного результата (т.е. где сеть смысл придумывает) — этого как раз в этих 'прохождениях' маловато, а для наливания воды. И да, нужно уметь пользоваться.


Скажем, берем подходящий сценарий и что-нибудь простое вида 'you should buy this washing machine' и получаем


This washing machine has saved my life, it can save yours too! It is a gleaming silver beacon of hope in a dark tunnel of despair. If you buy this product you will be enveloped by its luminescent aura of safety and warmth. This product is not a resource hog like other machines and will bestow upon you the gift of time. Purchase this product for your own sake, purchase this product for the sake of your children! Be free from the chains of drudgery, order this product today. This offer is good for one week only! Place your order now!

И это просто из нескольких попыток выбрано, без попутного редактирования, чтобы сеть в нужную сторону писала.

Именно поэтому и нужно смотреть ютуб — там видно без черрипкинга.

Это вы с чего взяли?

Нет, конечно, может некоторые из показывающих и заморачиваются с редактированием видео и аудио ряда с целью выкинуть лишнее и сделать связный текст. Но что-то я в это не верю. Слишком сложно выглядит как-то — они же там непрерывно что-то говорят и читают написанное. Совсем не синхронно с тем, как оно на экране появляется.


Допускаю, что такое возможно у популярных и специально нанятых стримеров. А у тех, что находятся просто по сортировке 'самые новые ролики' и у которых просмотров меньше сотни — большая часть просто прямая копия трансляции с twitch.


И практически у всех цель у них совсем не показать, какой AI умный, а наоборот 'а давайте ему чего-нибудь такое странное на вход подадим и посмеемся над тем, что оно на выходе выдало'.

Поэтому российские умельцы разработали аналогичный алгоритм ruGPT-3 Large. Видимо, они просто взяли GPT-3 — и натянули на нее русскоязычный интерфейс.

Статья о том, как её делали. Это не чистая GPT-3, а немного переделанная сбером gpt-3.


Мне кажется, что ваши результаты были плохими из-за плохой затравки, как в моем первом примере. Всё таки чтобы получить что-то отличное от бессмысленного диалога надо делать её чуть больше. И пробовать несколько раз, потому что не всегда получается чистый текст, а не диалоговый мусор.


Мои результаты

Попробовал на заголовках Хабра
Желтым — вывод нейросети



Если задать слишком маленькую затравку, получается какой-то диалог.





По итогу из попыток из шести попыток информативными были только 3


Всё, что делает нейросеть — это подгоняет свои данные к вашему предложению так, чтобы это было похоже на те данные, на которых её обучали. Нельзя ожидать, что взяв пару слов, получится связанный текст на ту тему, которую вы хотите.

Да, надо было информации побольше ей скормить — это точно
Спасибо, за статью. Недавно оставлял похожий комментарий, но и здесь он к месту будет как дополнение. Уже есть удачный кейс применения GPT-3 в продакшене. Платформа для A/B-тестирования VMO провела эксперимент — дала своим пользователям возможность генерировать в визуальном редакторе тексты с помощью GPT-3. Можно было создавать заголовки, описания товаров и CTA. Так вот контент от GPT-3 показал более высокую конверсию, чем тексты профессиональных копирайтеров.
описания товаров

Так вот контент от GPT-3 показал более высокую конверсию

А насколько правдивыми получились эти описания товаров?
Если это всего лишь красивое вранье, то за высокой конверсией последуют жалобы и возвраты.
тут можно посмотреть примеры — vwo.com/ab-testing-openai-gpt-3/results Самый интересный кейс у Clark Germany GmbH, там модель не просто слова местами поменяла, а реально разные варианты заголовков придумала. Прирост конверсии — 15.77%, при статистической значимости >90%.

Пофантазируем. В будущем будет появляться всё больше текстов, сгенерированных нейронками и обучаться они будут уже на своих же текстах. В итоге произойдёт мутация языка и мы постепенно и сами станем выдавать такие вот корявые тексты с оттенком автоматизации. И это не совсем пустые фантазии. Посмотрите как быстро люди адаптируются к неправильному использованию, особенно дети. Как-то видел, как они спокойно общаются терминами коряво переведённой автотранслейтом игры или дизайна сайта. Ничуть их это не смущает. Точно так же эмигранты перестают замечать свои кальки с английского, всякие "если" вместо "есть ли" и т.д.

Для начала я прогнозирую исчезновение местечковых языков.
По мере развития систем обработки текста отставание носителей разной языковой экзотики от англоязычных везунчиков будет нарастать просто с катастрофической скоростью. Сейчас даже для русского хрен что найдёшь в плане обработки текстов, а что имеется — оно всё кривое и сильно отстаёт от аналогичных англоязычных инструментов.
А ведь у нас тут свыше 140 млн носителей! Что уж говорить про языки, на которых говорит меньше 50 млн человек… Они либо исчезнут, либо станут тяжеленными гирями, которые поставят крест на развитии соответствующих народов.
… то есть не выйдет еще более усовершенствованная сеть GPT-4...

Июнь 2018 — релиз GPT
Февраль 2019 — анонс GPT-2
Поэтапный релиз GPT-2:
  • Август 2019 — релиз GPT-2, версия с 774 миллионами параметров
  • Ноябрь 2019 — релиз GPT-2, версия с 1.5 миллиардами параметров

Июнь 2020 — релиз GPT-3, 175 миллиардов параметров

Вы, действительно считаете, что GPT-4, имея на борту более триллиона параметров не выйдет?
Или это шутка?
Я думаю выйдет и судя по всему выйдет в этом году.

Важный момент, который Вы проигнорировали: Copy.ai это вспомогательный иструмент для написания рекламных объявлений для Google Ads, Facebook ads и т.д.
То есть Copy.ai заранее говорит: «Мы помогаем писать короткие объявления».

AI article writer (в числе прочих моделей использует и GPT-3) помощник в написании более длинных текстов. Которые потом тоже надо редактировать :)

Надеюсь, Сбер все же натренирует полноценную русскоязычную модель GPT-3.
Очень хочется поиграться с такой моделью на родном языке.

Еще есть надежда на проект GPT-Neo.
У них в планах релиз мультиязычной версии обученной на 10 TiB текста.

Конечно появление русскоязычной модели с 175 миллиардами в этом году маловероятна, но возможна. Тренировка подобной сети стоит в районе 0.5-1 млн. долларов.

Компания OpenAI, имея $1 млрд. инвестиций от Microsoft, не шутит когда говорит, что намерена создать общий, или сильный, искусственный интеллект (Artificial General Intelligence, AGI).

Статья Сэма Альтмана, главы OpenAI, о его видении развития ИИ — Moore's Law for Everything (англ.)
Перевод статьи на русский "Закон Мура для всего" на Хабре.
мне кажется, она что-то подозревает...
image
Все это подводит меня к печальной мысли о том, какими все-таки неисчерпаемыми гигатоннами шаблонизированного текста завален интернет.

Я не сомневаюсь, что рано или поздно крупные издательства создадут сервис где ты сможешь получить книгу на любую заданную тему. «Хочу смешную приключенческую историю про вурдалака и двух поросят на воздушном шаре»… брррр-ррр-трынц! Готово! И ты уже по дороге в метро читаешь это уникальное произведение у себя на Kindle.
Потом ты ставишь там лайки в тексте, они отправляются в облако и сеть становится еще лучше.

Спасибо Стас за интересный обзор!

Отличный обзор, тема очень интересная, пиши еще )
Благодарю за статью. Потестировал сервисы, о которых пишет автор и сделал ля себя вывод, до живого копирайтера искусственному интеллекту еще очень далеко. Так что в ближайшем обозримом будущем, заказываю статьи у копирайтеров-людей, а не у роботов.
Тут ситуация ровно такая же как с роботическим решением в любой сфере: робот построгает за тебя овощи, но не приготовит офигенный рататуй. Но плюс есть — робот освободил тебя от рутины — овощей.
И в копирайтинге подобные решения стоит применять на простых рутинных задачах: сделать описания стандартных товарных позиций в интернет-магазине и пр. Правда, моя фантазия быстро заканчивается на этих рутинных задачах. Куда ни плюнь, а креатив, эмоции или нестандартный подход в тексте сработают лучше))
Многие копирайтеры пишут хуже чем плохонькая нейросеть
Это не точно (потому что не доказано).

Наверное, нейросеть можно сравнить с авторами, которые работают на бирже. Владельцу бизнеса нужны будут недорогие тексты, например, для заполнения карточек товара, он обратиться к нейросети. Она выдаст приемлемый результат, за который не нужно платить. И, кстати, перепроверять на очепятки не нужно. Робот наверняка пишет грамотно.

Sign up to leave a comment.

Articles