Как стать автором
Обновить

Как автоматически переписать текст другими словами, сохранив смысл? Рассказываем про рерайт-сервис

Время на прочтение8 мин
Количество просмотров17K
Всего голосов 13: ↑9 и ↓4+7
Комментарии22

Комментарии 22

Весь интернет уже убит этими вашими рерайтами. Давайте теперь Достоевского туда загрузим.

С появлением генеративных моделей действительно выходит множество решений для задач копирайта и различной работы над текстами, в том числе потому, что на сервисы есть спрос, они облегчают жизнь людям, работающих с текстами.
Со своей стороны, как авторы опенсорсных моделей ruGPT3, мы разумеется также развиваем данное направление и прототипы в области NLP. Внутри нашей компании есть запрос от коллег на такие сервисы, но мы рады поделиться с комьюнити нашими наработками. Сервисы Рерайта и Суммаризатора доступны сейчас в бета версии бесплатно, и комьюнити может тестировать их. Мы открыты к вашим идеям и будем рады вашему фидбеку. В том числе, например мыслям, как можно было бы улучшить обработку домена классических художественных текстов

в том числе потому, что на сервисы есть спрос, они облегчают жизнь людям, работающих с текстами.

на оборудование для угонов автомобилей тоже есть спрос, и оно тоже облегчает жизнь некоторым людям

А кому это помогает, были бы интересны примеры.

А то моему больному воображению ничего кроме борьбы с диссернетом не приходит в голову. Но надеюсь есть и полезное применение.

Но надеюсь есть и полезное применение.

копирайтинг же. миллион статей в интернете от авторов, не представляющих о чём они пишут.
и на хабре есть примеры.


самое неприятное в этом (на пару с seo), что в потоке копирайтерского… гхм… продукта теряется стоящая информация.

Есть спрос от редакторов, копирайтеров, кто работает с текстами и у кого много однотипного monkey job
Есть множество применений научных, ведь не секрет, что данные в наше время это золотая жила и основа всех ml систем. На чем обучали, то и выходит. С этой точки зрения рерайтеры и парафразеры очень помогают для аугментации данных или их также используют для различных трансформаций и адверсариальных атак на большие языковые модели, чтобы проверить их робастность

НЛО прилетело и опубликовало эту надпись здесь

Есть множество метрик оценки сходства смысла пар текстов, например мерить через косинусную близость их эмбеддингов LaBSE https://huggingface.co/cointegrated/LaBSE-en-ru. В том числе в нашем сервисе есть классификатор, который также мерит сходство текстов, после чего выдает вариант наиболее приближенный к оригиналу.
Подходить к задаче можно с разных сторон, но это естественное продолжение исследований в области автоматического парафраза и рерайта текста, а как следствие - развитие индустрии и бизнеса

Другими словами, Сбер предоставляет платный сервис для SEO-спамеров.

Полезная штука для борьбы с тупостью программы Антиплагиат, которая ссылку на самого себя считает плагиатом. А еще мне нравится фича, когда Антиплагиат указывает "неизвестный источник", при этом снижая процентность оригинала.

Эта же мысль возникла еще после прочтения заголовка статьи, а уж когда саму статью прочёл...

Рерайт-сервис это золотая жила при правильном использовании. Большинство не усваивает информацию только из-за того, что она написана "неправильными" словами. Мозг отказывается воспринимать информацию, где над каждым словом надо думать что оно означает. Это одна из основных причин прокрастинации. Адаптирование информации можно использовать везде. В высокоразвитом обществе, к которому люди стремятся, это будет незаменимом помощником для быстрого восприятия информации. А чем личность больше "вооружена" информации, тем успешнее она в обществе. Следовательно и более эффективно общество.
Счастье - это когда тебя понимают(с).

Прям с ваших слов волшебная пилюля. Был оригинальный текст, смысл сложно понять, много слов неизвестно человеку, а тут раз и простыми словами якобы доступно изложит и суть не потеряет. :-D

Вместо изучения значений новых, непонятных слов и саморазвития, проще объявить эти слова "неправильными" (где-то уже видел подобное), Эллочка-людоедка была всё-таки гением, человек-рерайт-сервис потенциальный прям))) про причину прокрастинации тоже весёлый вывод получается.

Плюс мало иметь много информации, необходимо её ещё уметь понимать/осмысливать и уметь правильно применять, придётся и для этого сервисы придумывать? Может пора списывать человека уже тогда, зачем он в таких цепочках? :-D

"Следовательно и более эффективно общество." цели рерайта весьма прозаичней всё-таки...

Прям с ваших слов волшебная пилюля. Был оригинальный текст, смысл сложно понять, много слов неизвестно человеку, а тут раз и простыми словами якобы доступно изложит и суть не потеряет. :-D

Проведите эксперимент. Найдите глубоко профильную книгу по любой специальности с большим изобилием терминов. Откройте где нибудь в середине. Почитайте минут 10. Попробуйте "переварить" прочитанное.
В принципе рерайт-сервис не что то нечто новое. Есть серии книжек "для дураков" "за 24 часа" и т.д которые использовали подобные трюки. Здесь разговор о том, что АИ это будет делать по индивидуальному заказу из любого текста. При чём его можно будет профилировать на объём знаний слов индивидуума. На что натренирована его внутренняя мозговая сетка.

Вместо изучения значений новых, непонятных слов и саморазвития, проще объявить эти слова "неправильными" (где-то уже видел подобное), Эллочка-людоедка была всё-таки гением, человек-рерайт-сервис потенциальный прям))) про причину прокрастинации тоже весёлый вывод получается.

Любой выход из зоны комфорта вызывает негативные чувства. Что является одной из причин прокрастинации. На изучение новых терминов требуется мозговая активность. Надо потратить ресурсы. Если термины не в обиходе человека, то новость пройдёт мимо ушей. Рекламщики и пиарщики хорошо об этом знают. Обьём используемых слов у человека ограничен.

Плюс мало иметь много информации, необходимо её ещё уметь понимать/осмысливать и уметь правильно применять, придётся и для этого сервисы придумывать?

Смысл даже не том, что Вы перечислили. Важна скорость восприятия информации. Чем быстрее она будет воспринята, тем больше возможностей. В одной части мира это деньги. Время - деньги (с). В другой - положение в иерархии с получением привилегий. Кто раньше встаёт - того и тапки(с).

Может пора списывать человека уже тогда, зачем он в таких цепочках? :-D

Человечество давно использует механизмы для передвижения на большие расстояния. Никто человека на механизмы пока не заменил.

"Следовательно и более эффективно общество." цели рерайта весьма прозаичней всё-таки...

Отличная черта успешных людей заключается в том, что они видят возможности там где никто об этом даже и не думал. Наверное это из-за того, что они когда то не пропустили полезную информацию мимо своих ушей.

Проведите эксперимент. Найдите глубоко профильную книгу по любой
специальности с большим изобилием терминов. Откройте где нибудь в
середине. Почитайте минут 10. Попробуйте "переварить" прочитанное.

И часто в жизни возникает такая потребность?

Простите, но теряем логическую цепочку. В статье явно прописаны цели данного сервиса, "Рерайтинг используется, чтобы избежать обвинений в нарушении авторского права. Услуга востребована в связи с лавинообразным ростом в интернете числа
новых сайтов и потребностью в наполнении контентом уже имеющихся.", Википедия. Это не про высокие цели или обучение людей, это просто для быстрого и безопасного извлечения прибыли, где качество явно не на первых местах. Вряд ли в сегодняшнем виде его получится так использовать как Вы предлагаете. Ещё более непонятным станет текст, так как подбор синонимов для сложных слов будет менее эффективным, значит и качество ниже, исходя из приведённых в статье примеров. Скорость восприятия информации и рерайтинг-сервис думаю из разных сфер. Много сайтов, лишь бы наполнить, не просто найти оригинальный и адекватный контент. А донесение информации в доступном виде, больше про преподавателей, которые получают сразу обратную связь от обучаемого.

Любой выход из зоны комфорта вызывает негативные чувства. Что является
одной из причин прокрастинации. На изучение новых терминов требуется
мозговая активность. Надо потратить ресурсы. Если термины не в обиходе
человека, то новость пройдёт мимо ушей. Рекламщики и пиарщики хорошо об
этом знают. Обьём используемых слов у человека ограничен.

Про выход из зоны комфорта, наверное стоит добавить мотивации и дело пойдёт веселее. Устранить все негативные чувства разве возможно/нужно? А рекламщики явно не прогоняют в эфире огромные тексты или сложные термины. Зачем они массам и за цену эфирного времени?

Человечество давно использует механизмы для передвижения на большие расстояния. Никто человека на механизмы пока не заменил.

Лошадь заменена была более современными транспортными средствами, инструментами скажем так для передвижения. Вот если человек сам не может принять и освоить информацию, то наверное его как лошадей в определённой сфере стоит заменить на сервис вымышленный пока вами, который будет это делать намного эффективней.

Отличная черта успешных людей заключается в том, что они видят
возможности там где никто об этом даже и не думал. Наверное это из-за
того, что они когда то не пропустили полезную информацию мимо своих
ушей.

А не пропустили и увидели возможность, так как имели интерес/мотив ранее, что и помогло им путём постоянных размышлений на эту тему осваивать материал самостоятельно с помощью имеющихся инструментов. Рерайт-сервис явно пока не про это.

Простите, но теряем логическую цепочку. В статье явно прописаны цели данного сервиса, "Рерайтинг используется, чтобы избежать обвинений в нарушении авторского права. Услуга востребована в связи с лавинообразным ростом в интернете числа новых сайтов и потребностью в наполнении контентом уже имеющихся.", Википедия. Это не про высокие цели или обучение людей, это просто для быстрого и безопасного извлечения прибыли, где качество явно не на первых местах.

В принципе это небольшое лукавство. Это так видят авторы статьи или журналисты у которых были позаимствованы эти мысли. Рерайт сервис это новая технология соизмеримая с распознаванием изображений с помощью глубокого обучения. Эта технология приносит деньги за счёт большого спроса. К примеру если динамическая реклама принесёт рост прибыли на 10% больше других, то она обязательно будет проплачена. Если политик получит из-за этого сервиса перевес в те же 10% голосов, он обязательно заплатит. И так далее. Конечно появятся и "пустые" интернет страницы и сервис по обману индивидуальности дипломных и научных работ. Если это приносит легальные деньги, почему бы и нет?

И часто в жизни возникает такая потребность?

Всё зависит чем человек занимается. По моему у программистов это чуть ли не каждый день.

Про выход из зоны комфорта, наверное стоит добавить мотивации и дело пойдёт веселее. Устранить все негативные чувства разве возможно/нужно?

В нашем мире всё стоит денег или ресурсов. Тут уж что дороже мотивация или проплаченый сервис.

А рекламщики явно не прогоняют в эфире огромные тексты или сложные термины. Зачем они массам и за цену эфирного времени?

Не задумывались почему? Дело даже не в эфирном времени. Есть реклама созданная бездарными компаниями, которая не "цепляет". Оторванная от контекста потребителя. Рерайт сервис как раз сможет исправить эту проблему. А с учётом форумов, чатов и соц, сетей - это золотое дно.

Вот если человек сам не может принять и освоить информацию, то наверное его как лошадей в определённой сфере стоит заменить на сервис вымышленный пока вами, который будет это делать намного эффективней.

Именно полезная информация. Читая новости на телефоне никто же не думает в это время о том как он работает, как происходит связь между телефоном и провайдером. Какая частота и какой протокол используется, и т.д и т.п. Это всё информация. Человечество давно эволюционировало от пещерного общинного строя до сложного профлированого общества. Соответственно для донесения информации до более широкого круга требуется информационные агентства переводящие профильный язык от одной группы лиц к другой. К примеру научно-популярные журналы. Сеть журналистов, переводящие научный язык в обиходный для широких масс. Сейчас АИ будет делать тоже самое, но в более близкой форме к каждому индивидууму.

А не пропустили и увидели возможность, так как имели интерес/мотив ранее, что и помогло им путём постоянных размышлений на эту тему осваивать материал самостоятельно с помощью имеющихся инструментов. Рерайт-сервис явно пока не про это.

С Ваших слов получается Цукерберг, Брин, Бейзос, Маск ещё в утробе матери думали как бизнес получше состряпать, который они выстроили сейчас. Похоже на конспирологию. Думаю, они в своём понимании идеи видели более грандиозную картину, чем другие. И воплощали её в жизнь как художник рисующий картину на холсте. А чтобы представить такую картину, требуется информация полученная от других источников. И самое главное воспринятая. Рерайт сервис как раз упрощает этот процесс.

......

Рерайт сервис будет не только упрощать усвоение информации но и воспитывать с определённым видением мира. Так как у некоторых обязательно появится соблазн использовать его в политике. А там где политика, т.е установление своих правил - там и деньги.

В данной статье у технологии явно другие цели, возможности и вероятные перспективы в обозримом будущем, сейчас результат явно не тот. Помочь лучше понять вряд ли получится с помощью рерайт-сервиса или проще будет вникать самому. А упрощение (сокращение?) вроде к суммаризатору.

Используется рекуррентная сетка. Написать которую сможет любой мидл программист знакомый с АИ фреймворком. Тем более уже не с нуля, так как на гитхабе уже есть исходники. Скорее всего бум таких сервисов не за горами. Менее пары лет. Главное чтобы не тормозили эту идею как дипфейк.

Для упрощения текстов есть инструменты симплификации! Суммаризатор выделяет главное в тексте, а симплификатор упрощает текст, делает его более читаемым, повышает так называемые метрики readability.
Можно почитать например, вот тут https://www.dialog-21.ru/evaluation/2021/rusimplesenteval/ для русского языка было даже соревнование таких систем

Найдите глубоко профильную книгу по любой специальности с большим изобилием терминов. Откройте где нибудь в середине. Почитайте минут 10. Попробуйте «переварить» прочитанное.
Профильная книга по специальности предполагает, что человек ее изучающий имеет определенную базу в этой специальности, которая позволяет понимать написанное. И эта база не только знание терминологии, но и понимание того, что она описывает.
Заменив терминологию простыми словами при таком рерайте можно получить совершенно не верный смысл, или в теории верный, но все равно не понятный, так как без базы в специальности не понятна сама суть описываемого.
Есть серии книжек «для дураков» «за 24 часа» и т.д которые использовали подобные трюки.
Эти книги изначально пишутся для аудитории начинающих, и основная их задача не термины перефразировать, а кратко объяснить суть от самых основ. И умение объяснять просто сложные вещи — это отдельный педагогический навык, который рерайтом не заменишь.

Ну для второстепенных задач точно подойдет. Опять же, нужно смотреть на реакцию ПС, как выше было сказано.

Раз в полгода (или чаще, если требуется по работе) забиваю в гугле "синонимайзер", открываю пяток сервисов, заливаю туда один текст, потом смотрю - во что его превратили алгоритмы. Закуриваю, выпиваю кофе и с удовольствием осознаю, что роботы-редакторы не скоро заменят кожаных мешков. Ибо обработанный текст вообще ни на что-то вменяемое не похож, и даже творения школоло-копирайтеров по сравнению с ним - шедевр.

Вышесказанное не относится к описаным в статьям алгоритмам и моделям. Возможно, Сбер придумал что-то более совершенное и я скоро лишусь работы... :)

Зарегистрируйтесь на Хабре, чтобы оставить комментарий