Pull to refresh
5
0
Олег @mochila007

User

Send message

да, если не присматриваться, то нормально выглядит) но даже при детальном рассмотрении дефектов 1-2 заметил только

Давайте без клеветы... Где обнаружили обман потребителей? Если вы снова про генерацию отзывов по фото, то давайте поразмышляем: в чём разница, если заказчик возьмёт отзыв от исполнителя на бирже копирайтинга или у нейросети? Никакой, просто дешевле у нейросети. Или другой сценарий: сам маркетплейс за отзыв к товару платит. Покупатель товара не может придумать годный отзыв и создаёт его с помощью нейросети.

Аналогичное касается нейросети по созданию описаний к товарам по фото.

По-вашему, обман заключается в том, что нейросеть научилась по одной фотографии определять товар и генерировать к нему описание и отзывы? Какая будет разница для покупателя, напишет этот отзыв человек через биржу копирайтинга или же получит от нейросети? Разочарованием может быть лишь то, что большинство отзывов к товарам пишутся не настоящими покупателями, но если маркетплейс не вводит таких ограничений, то ему выгодно это т.к. показывает активность.

скорее всего, пользователю не хочется заморачиваться дообучением, а хочется сразу получать нужный результат без ресурсо и времязатрат

Изменение запроса приводит к замене весов при генерации и если нейросеть определит, что в связке "кот и мышь" она может сгенерировать синего кота и коричневую мышь, а "кот, мышь и мячик" уже цвета у животных могут быть другие.

Но эту задачу можно решить, взяв результат запроса "кот и мышь" и прокинув в другую задачу, где дорисуется новый элемент, не создавая новое полотно с нуля.

Именно! Как раз по причине шаблонности большинства заголовков и лид-абзацев мы внедрили генерацию варианта со стандартным подходом (Кто? Что сделал?) и в том же ответе бот создаёт второй вариант с двойным заголовком, который имеет свободную структуру. Поэтому пользователю, особенно новичку, не надо заморачиваться и достаточно просто вставить текст новости.

С рерайтами ситуация сложнее, особенно в русском языке, потому что перефразировать с добавлением новой информации удаётся не каждому человеку, а ещё и уникальность контента до сих пор является важным для СМИ, чтобы поисковые агрегаторы не забанили сайт.

Но тенденция такая, что короткие новостные тексты всё чаще создают нейросети, а аналитические статьи - люди.

Да, об этом в статье и речь, что не заменят, но помощником в ряде ситуаций станут. Так, в Adobe Photoshop уже можно выделять фрагменты на картинке и текстом задавать, что хочешь дорисовать (например: попугая на плече пирата или шапку на голове). Речь на данном этапе развития нейросетей об ускорении рабочего процесса путём взаимодействия между человеком и технологиями.

Абстрактные идеи человека формируются за счёт использования рецепторов. Единственное, что никогда нейросеть, без использования робототехнических приспособлений, не поймёт - это насколько солёный борщик приготовили, потому что вкусовые рецепторы, как и обоняние, осязание и терморецепторы человека, не впихнуть в нейронку без тела.

Но когда-то аудио, текст и фото информацию удастся впихнуть в один слой нейросетей и они смогут в Х3 раза лучше выдавать абстрактную идею. На данном этапе это бесчувственная груда алгоритмов.

Но далеко ходить не надо - буквально 10 лет назад многие говорили, что невозможно будет по фото определять рак у человека или же назначать курс лечения, как и говорили про невозможность создания фильмов по текстовому описанию. А сейчас видео с аудио по тексту создаются.

Да, вы тоже правы) Приведу недавний пример с американского конкурса:

"Американец выиграл конкурс рисунков с работой, сгенерированной нейросетью.

Парень создал 100 изображений с помощью нейросети Midjourney, выбрал из них три лучших и наложил друг на друга. В итоге он занял первое место в категории «цифрового искусства», а получившуюся картину выставили на продажу за 750 долларов (45 тысяч рублей)"

Начиная с 19 века как раз в разных странах происходили свои индустриальные эпохи. Все они сопровождались недовольством, страхом, восстаниями людей и человеческими жертвами. Отличием от того времени является то, что ранее была автоматизация физического труда, а сейчас - умственного.

Да, на данном этапе развития так и есть. Но человек формирует своё мировоззрение на основе информации от других людей тоже. Так что в некотором плане мы с алгоритмами машинного обучения похожи) Пока что все архитектуры работают в одном направлении (текст, аудио, изображения). На этапе объединения всех в одно (не просто ансамбли 3 направлений, а именной слой, в котором это обрабатывается) уже можно будет оспорить этот тезис.

Однозначно, что нейросети будут только помощниками и никогда не займут нишу экспертов, которые творят новое. Но улучшить качество "ширпотреба" и ускорить процесс работы уже сейчас они могут, что и хотел показать в этой статье.

Создать текст внутри бота можно тремя способами:
- "Продолжить текст" - вставить начало текста и бот продолжит его.
- "Текст по описанию" - вводите заголовок, краткое описание, ключевые слова и бот сгенерирует целый текст
- "Рерайт текста" - вводите текст и бот перепишет его своими словами.

Из ваших вводных данных подходит режим "Текст по описанию". Т.е. достаточно ввести заголовок, описание и пару ключевых слов.

Подробно не могу из-за соглашения NDA, но вот список используемых предобученных моделей:  ruGPT-3, ruT5, BERT, ROBERT, CLIP. Все можно найти в HuggingFace и зафайнтюнить на своих данных, предварительно написав код для файн-тюнинга.

Проблемы при сборе датасетов - это отсутствие датасетов. Например, для обучения модели рерайтов текста не просто по предложениям, а по всему тексту, пришлось заморочиться и создать десятки тысяч пар текстов, а это финансово и времязатратно. Иногда на сбор датасетов уходило больше времени, чем на сам код и обучение моделей. Второй проблемой в датасетах является типичная задача определения качественных данных. Для этого разработаны собственные метрики для фильтрации текстовых данных по признаку "плохой" и "хороший" под конкретную задачу.

Ряд технических деталей из-за того же NDA не могу раскрыть, но на курсах Python-разработки о некоторых часто упоминается.

Представим, что вы автор статей в каком-то интернет-издании. Вы пишете новостные тексты. Как создать заголовок так, чтобы он был в ТОП-е поисковой выдачи Яндекс и Google и относился к тексту, но на создание не тратить более 5 секунд? Достаточно вставить текст и за 1 секунду получите к нему заголовок, который получит высокий CTR.

Другой сценарий - работаете копирайтером или рерайтером. Произошло громкое событие, например, выход нового iPhone. Конкуренты вас опередили и уже опубликовали статьи. Но как создать свой уникальный текст на эту же тему, которая подходит тематике интернет-издания? Достаточно просто вставить исходный текст и бот придумает рерайт к нему всего за 3-10 секунд. Сможет ли человек за это время написать текст на 1000+ символов? Нет, а нейросеть сможет.

Экономит время? Экономит... Подчеркну, что речь не идёт о замене людей. Это лишь помощник, как стиральная машина, посудомойка, пылесос дома.

Если вы будете обучать нейросеть обманывать, то она научится обманывать. Мы же идём другой дорогой и перед обучением проводится подробный анализ данных. Например, при обучении нейросети для генерации заголовка мы выбирали самые кликабельные варианты. Эти данные брались на поведении миллионов пользователей на протяжении нескольких лет.

Если думаете, что миллионы занимались враньём и пытались как-то повлиять на метрики, то да, наша нейросеть тоже обманывает. Но она будет полезна тем миллионам, которые читают контент в интернете.

Рутинную работу с текстами уже давно стоит передать в руки нейросетям. Человек способен на большее, чем просто придумывать рерайты к текстам, создавать заголовки к статьям или описания к товарам в маркетплейсах.

Да, вы правы. Под "не прикладывая усилия" скорее имеется в виду, что на бирже часть текстов можно продавать сразу без дополнительной редакции.

2

Information

Rating
Does not participate
Location
Харьков, Харьковская обл., Украина
Date of birth
Registered
Activity

Specialization

Data Science
Git
Docker
Python
Database
SQL