Как стать автором
Обновить

Комментарии 15

«Осталось подправить фамилию, пару слов и копирайтер может уже заработать от 30 рублей за текст, не прикладывая усилий»

Лучший пример работы боты — когда он напишет о себе статью для публикации на «Хабр». А пока это сделал человек и будет делать дальше.

А про «не прикладывая усилия» — то есть настройка бота силой мысли? И «от 30 рублей за текст» — ни один серьёзный проект не будет такие тексты использовать.

PS. с глаголом совершенного вида «приложить» в значении «направить действие чего-л. на что-л., применить» соотносится глагол несовершенного вида «прилагать», то есть правильно будет как раз не «не прикладывая усилия», а «не прилагая усилия»

Да, вы правы. Под "не прикладывая усилия" скорее имеется в виду, что на бирже часть текстов можно продавать сразу без дополнительной редакции.

НЛО прилетело и опубликовало эту надпись здесь

Рутинную работу с текстами уже давно стоит передать в руки нейросетям. Человек способен на большее, чем просто придумывать рерайты к текстам, создавать заголовки к статьям или описания к товарам в маркетплейсах.

НЛО прилетело и опубликовало эту надпись здесь

Если вы будете обучать нейросеть обманывать, то она научится обманывать. Мы же идём другой дорогой и перед обучением проводится подробный анализ данных. Например, при обучении нейросети для генерации заголовка мы выбирали самые кликабельные варианты. Эти данные брались на поведении миллионов пользователей на протяжении нескольких лет.

Если думаете, что миллионы занимались враньём и пытались как-то повлиять на метрики, то да, наша нейросеть тоже обманывает. Но она будет полезна тем миллионам, которые читают контент в интернете.

НЛО прилетело и опубликовало эту надпись здесь

Представим, что вы автор статей в каком-то интернет-издании. Вы пишете новостные тексты. Как создать заголовок так, чтобы он был в ТОП-е поисковой выдачи Яндекс и Google и относился к тексту, но на создание не тратить более 5 секунд? Достаточно вставить текст и за 1 секунду получите к нему заголовок, который получит высокий CTR.

Другой сценарий - работаете копирайтером или рерайтером. Произошло громкое событие, например, выход нового iPhone. Конкуренты вас опередили и уже опубликовали статьи. Но как создать свой уникальный текст на эту же тему, которая подходит тематике интернет-издания? Достаточно просто вставить исходный текст и бот придумает рерайт к нему всего за 3-10 секунд. Сможет ли человек за это время написать текст на 1000+ символов? Нет, а нейросеть сможет.

Экономит время? Экономит... Подчеркну, что речь не идёт о замене людей. Это лишь помощник, как стиральная машина, посудомойка, пылесос дома.

НЛО прилетело и опубликовало эту надпись здесь

Пылесос? Нет, это скорее громкий клаксон, который "перекричит" соседнюю машину на перекрестке. И включают такой клаксон все кому ни попадя в любое время суток. :-(

а можно подробнее про архитектуру и то, с чем пришлось столкнуться при сборе датасетов, ну и прочие технические интересности?

Подробно не могу из-за соглашения NDA, но вот список используемых предобученных моделей:  ruGPT-3, ruT5, BERT, ROBERT, CLIP. Все можно найти в HuggingFace и зафайнтюнить на своих данных, предварительно написав код для файн-тюнинга.

Проблемы при сборе датасетов - это отсутствие датасетов. Например, для обучения модели рерайтов текста не просто по предложениям, а по всему тексту, пришлось заморочиться и создать десятки тысяч пар текстов, а это финансово и времязатратно. Иногда на сбор датасетов уходило больше времени, чем на сам код и обучение моделей. Второй проблемой в датасетах является типичная задача определения качественных данных. Для этого разработаны собственные метрики для фильтрации текстовых данных по признаку "плохой" и "хороший" под конкретную задачу.

Ряд технических деталей из-за того же NDA не могу раскрыть, но на курсах Python-разработки о некоторых часто упоминается.

лично для меня "архитектурная" и "кодовая" часть статьи (пусть даже и с белыми пятнами NDA) вызывает гораздо более сильный интерес. Интересны были ваши подходы. Кстати, а сколько в итоге стоил весь фестиваль с созданием даатсетов и обучением моделей (я так понимаю, арендовывались aws или что-то такое?)

То, что это "можно найти на HF" - ну тут, как известно, надо знать, что искать ))

Поскажите. Допустим у меня есть заголовок, заголовки второго уровня (собрал через вордстат, например).
хочу целую статью? можно ли реализовать этот через бота? и как

Создать текст внутри бота можно тремя способами:
- "Продолжить текст" - вставить начало текста и бот продолжит его.
- "Текст по описанию" - вводите заголовок, краткое описание, ключевые слова и бот сгенерирует целый текст
- "Рерайт текста" - вводите текст и бот перепишет его своими словами.

Из ваших вводных данных подходит режим "Текст по описанию". Т.е. достаточно ввести заголовок, описание и пару ключевых слов.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации