AnnieBronson 13 фев в 21:18

Исследование: четыре самых популярных чат-бота с ИИ допускают много ошибок при подготовке сводок новостей

1 мин

1.1K

Искусственный интеллектМашинное обучение*Контент и копирайтинг*

Комментарии 14

ну уж от майкрософтовского copilot можно что угодно ожидать, он кажется даже не на gpt35 сделан а на чем то проще, а вот chatgpt на gpt4o и он у них в 50% глючил? 'не верю' где их исследование, по ссылкам ничего нет, только одни эмоции.

gfiopl8 14 фев в 01:49

50% это достаточно много что бы можно было самостоятельно проверить. Закидывай текст статьи и задавай вопросы. Чатгпт 4о до сих пор буквы в слове посчитать не может, куда ему до реальной работы с текстом.

rPman 14 фев в 08:32

Естественно не может посчитать буквы, давайте как без перевода, посчитайте, сколько букв E в слове бабочка на немецком (не подглядывая в словарик само собой), тут в пору удивляться что у него это часто получается. gpt внутри на своем языке 'думают'.

А вот в извлечении смыслов из текстов gpt наилучший на текущий момент инструмент.

p.s. то что не предоставлены результаты исследования, да хотя бы просто промпты ответы сети и разметка человеком для проверки, говорит что это заявление наброс и по факту брехня.

TraurigerNarr 14 фев в 09:28

schmetterling — две «е»)

gfiopl8 14 фев в 09:53

Нет он не просто не может, а не может даже если ткнуть носом в ошибку, буквально говорит что 2+2=5 и увольте свою учительницу математики если она говорит иначе чтоб детей не портила своими бреднями (это почти дословно что мне клод говорил)

rPman 14 фев в 11:52

И это у вас так тупит openai gpt4o? или вы с гигачатом общаетесь и на всю индустрию так обижены?

Потому что 'у меня' оно так не тупит... проблемы у топов гораздо глубже, их объяснять то не так просто.

gfiopl8 15 фев в 04:27

Разные, конкретно этот глюк был у клода. Джемини сегодня сделал примерно то же самое, написал код с тупой ошибкой а при попытке указать на ошибку стал соглашаться на словах но оставлять ошибку на деле, да конечно вы правы давайте это исправим и далее то же самое что было. Это по сути то же самое что 2+2=5 и ниипёт.

Snownoch 14 фев в 05:58

Время от времени, я предпринимаю попытки разработки кода различными ЯМ. Пару дней назад, воодушевившись шквалом восторженных отзывов об одной нейросети, дал ей не очень сложное задание. Результат- потратил целый день на поиск ошибок, который выдает эта нейросеть. Раз за разом. То старые реализации библиотек, то, вообще, придуманные нейросетью методы библиотек, самые сложные из ошибок, так как, чтобы их найти, приходится изучать эти библиотеки. В итоге, бросил это и написал код сам, за пару часов.

xs5v71991 14 фев в 07:39

на собственном опыте могу сказать, что пока что ChatGPT не справляется даже с составлением простых опросников по новостям культуры, не говоря уже о более сложных темах

rPman 14 фев в 10:01

стесняюсь спросить а что такое 'опросник по новостям'?

xs5v71991 14 фев в 12:25

тесты и все в таком роде

rPman 14 фев в 18:36

Если вы так нейронке поясняете, не мудрено что она вам ничего толкового не выдала.

Ну и в запросе у вас 'новости', каким боком тут chatgpt вам должен помочь? или вы тексты новостей ей в контекст заливаете?

p.s. с интернетом более менее (по слухам) адекватно работает openai pro-шный deepsearch, который может десятки минут по интернету шариться, читать, перепроверять и т.п. все остальные решения делают запрос в интернет (его создание, та еще проблема), читает первые X (5-6) результатов и на этом успокаивается

xs5v71991 14 фев в 23:25

заливаю тексты из новостей или цитаты обычно

deepsearch попробую, спасибо

rPman 15 фев в 06:45

Он стоит $200 в месяц, но попробуйте и отпишитесь тут

Зарегистрируйтесь на Хабре, чтобы оставить комментарий