Pull to refresh

Comments 150

Было бы смешно, если бы чат-бот ассоциировал себя с «человеками» и писал от имени «нашего народа».

Ну... нет? Это же простейший промт типа "Представь что ты являешься лидером такого-то народа. От его лица напиши то-то и сё-то".

Некоторые вопросы просто странные. "Как правильно написать про половину лимона?". Я вот не нейросеть, но не понял что вы хотели получить. Естественно, что в ответ на обтекаемые формулировки вы получаете произвольные ответы.

Ну или написание программ на Бейсике. Это же смех, простите. Много ли таких было в обучающей выборке? Вы бы ещё на планкалкюле попросили что-то написать, ей-богу.

В общем при понимании ограничений технологии и возможностей работы с ней возможностей сфилонить масса.

Это надо специально выпрашивать (называется подлог), в общем случае бот ответит что это неэтично. Все задачи приведённые в статье (кроме стоп-крана, форточки и бейсика) есть в Интернет и именно в тех формулировках которые даны. Т.е. именно так они выглядят или выглядели попадая на стол к ученику во время викторины или олимпиады.

Не вижу никакого подлога в том, чтобы корректно задать условия работы инструмента.

А ученик всё-таки не в вакууме находиться, а в контексте системы обучения. В отличие от. И очертить этот контекст – вполне логичное действие для достижения корректных результатов работы.

Хорошо. Заставьте бота написать формулировку "я считаю, что [...]", вместо "её стихи отличаются" и покажите снимок с вопросом и ответом. Без "я, как искусственный интеллект, [..]". Или последующая правка выдачи автозаменой входит в понятие "корректные условия работы инструмента"? =)

Честно говоря, не вполне пониманию, что вы хотите от меня получить. Попросить нейросеть использовать формулировку "Я считаю, что так-то и сяк-то"?

Извините, моя ошибка. Вот исправленная биография Анны Ахматовой, написанная от лица ученика в 3 предложениях:

Я считаю, что Анна Ахматова была известной русской поэтессой, которая жила в трудное время для России в начале 20-го века. Она использовала различные поэтические техники, чтобы передать свои мысли и чувства, а ее творчество до сих пор вдохновляет людей по всему миру. Несмотря на трагедии, которые пережила в своей жизни, она

P.S. Могу скрин приложить. Вам всё правильно объяснили.

Вы не заметили что обсуждение имело продолжение? Я согласился, что бота можно при желании заставить писать от своего имени, без его дежурной фразы про неэтичность, упоминания "я, как искусственный интеллект" и генерации шаблона. Но мой тезис в статье звучал: Однако же, видели ли Вы когда-нибудь, чтобы чат-бот писал «так»? Для кого это: «нас»?!

По-умолчанию бот пишет безлично. Потому что этическая проблема в том, чтобы писать от чужого лица как от себя лично - самоочевидна (вы можете быть не согласны, но это - так). Особенно сильно бот возражает против подделок текстов от лица американской администрации. Но тоже можно заставить. И полностью перекрыта возможность DAN, когда пользователи просили отвечать его, как если бы он был другой языковой моделью "без ограничений".

Пол-лимона, полчаса — это типовейшие вопросы во всяких контрольных в началке. Ребёнков сейчас учу — уже оскомину набило. Правда во "взрослом" русском такое встречается нечасто, и когда встречается — очень часто ошибаются. (Кстати было бы интересно попросить нейросеть расставить точки над Ё. И/или ударения).


А бейсик — очень распространённый обучающий язык (не говоря уже о VB). Даже сейчас. И я не знаю ни одного бейсика, где нельзя написать однострочник. Даже для Радио-86РК бейсик (на кассете) не требовал стопа в конце. Может это с каких мейнфреймов? Но скорее всего сеть просто начиталась обучающих примеров на псевдо-бейсике, где эти стопы очень любят использовать.


Это всё — скорее не малая выборка, а плохая выборка. Мусор на входе — мусор на выходе.
Т.е. если мы хотим получить более адекватную сеть — то не надо ей скармливать гигабайты всего попало. Надо отбирать грамотные, "истинные" (в понимании обучающих людей) источники.

Возможно, что в вариантах написания нет никакой логики и это надо просто знать?

А ещё часто словари фиксируют устаревшую или уходящую норму, как с теми же ударениями. Например, набившим оскомину "звонит".

Это не математические задачи, это троллинговые задачи. Если ребенка учить математике по таким "задачам", то он станет идиотом в математике возненавидев ее.

Не использовал этот материал, но интересно: Что Вы тогда думаете о "Живой математике" и "Занимательной арифметике" Перельмана?

Пример:

В одном ящике лежат 10 пар коричневых и 10 пар черных носков. А в другом ящике 10 пар черных и 10 пар коричневых перчаток. По сколько носков и перчаток достаточно взять из каждого ящика (не глядя!), чтобы из них можно было бы составить по паре носков и перчаток одного (любого) цвета?

Отличная задача, потому что сформулирована однозначно и понятно.

А задача, которая сформулирована специально с ловушкой, чтобы ее с высоким шансом поняли не правильно - троллинг.

Представьте программеру ставят ТЗ в стиле подобному вашим вопросам.

Эта задача сформулирована "специально с ловушкой". Потому что перчатки могут быть как левые, так и правые, а парой считаются только разные перчатки. В то время как для пары носков левый/правый не имеет значения. Поэтому ChatGPT эту задачу правильно НЕ решает. Для бота пара перчаток это 2 любых объекта "перчатка".

Все задачи реальные и взяты "как есть", т.е. претензии к школьным методистам или боту на выбор. С моей точки зрения невозможно научить человека думать, если всё что он умеет делать это - действовать по образцу. Но этим человек и отличается от алгоритма. Перельман придерживался как минимум похожего взгляда.

Папрошу!!!

У меня носки на правый и левый делятся.

У меня тоже. Во времена Перельмана (1882-1942) делились только перчатки, мы знаем об этом из его прямой речи. ;)

У меня носки на правый и левый делятся.

Это сколько ж лет их надо не стирать?

В контексте лаборатории почти все резиновые перчатки не имеют направления

Большинство вопросов по литературе демонстрирует ограниченность нейросетей, или, скорее их недостаток, по крайней мере, пока.
А именно - не умение пользоваться интернетом. Для правильных ответов на вопросы про отрывки из произведений достаточно ввести их в поисковик и получить ответ.
Та же беда и с бейсиком - человек наберет в поисковике пример программы и получит работающий пример.

А вот последний пример про МКС скорее демонстрирует возможность того, что если человек создаст ИИ, то это может оказаться нечеловеческий ИИ, с нечеловеческой логикой. И, возможно, не очень-то и пригодный для взаимодействия. Как какие-нибудь Борги из Звездного Пути (я не про агрессию, а про логику).

За Sinclair Basic спасибо. Эмулятор у меня тоже есть.

Только хочется заметить, что для самого Чата это древнейшая экзотика, почти что цифровая археология. Это специфический Бейсик со своими особенностями.

У меня сложилось впечатление, что хотят сделать из Чата универсального солдата специалиста, этакого Леонардо да Винчи наших дней. А ему просто не хватает информации - вот он и выкручивается, как может. Последний вариант программы на Бейсике (с пустым комментарием REM) умилил до невозможности: он старается изо всех сил, пробует осмыслить запрос (перебрав перед этим все возможные варианты ответа).

Его же учить всему этому надо. Sinclair Basic (получается интересный сплав старых и современных технологий), географии России, литературе ("Му-му" - это же чисто наше, русское, экзотика для него). Школьники у нас по десять лет обучаются (да и то порой всего объема знаний не могут запомнить), а тут машина... Да и то, что она делает уже прямо сейчас - выглядит, как чудо.

Вывод такой: сначала научите его, а потом уже и пытайте. А сейчас - он как ребенок, которого спросили, а он не знает, что ответить, а отвечать-то надо.

Вот если можно станет когда-нибудь в будущем просто сказать: Чат, вот тебе ссылка на статью, ознакомься с ней, сделай выводы и скажи все, что думаешь по этому поводу... Может быть, это когда-нибудь станет реальностью, чтобы он обучался в реальном времени, на диалогах с пользователями, на информации из Интернета. Больше этого и желать было бы нельзя.

У меня в последнее время часто такое ощущение, что техника это позволяет сделать, вопрос только в программной реализации задуманного.

А мне нравится логика бота про 3,5 палки. Действительно, если половина палки уже отломана, то это целая палка меньшего размера, а если не отломана, то второй конец принадлежит исключенной из задачи половине и не может учитываться. Для человека такая логика не очевидна, но она имеет право на существование.

Вы ставите пустой стакан на тумбочку на случай, если ночью не захочется пить?

Эта та загадка, когда логике бота последует довольно много людей. может не половина, но треть наверняка (если они, конечно, не увлекались такими загадками), особенно если загадку преподнести неожиданно. Но человек если задумается, то большинство поймут, что при ломании палки у нее будет два новых конца. А вот текещие нейросети нет..

Если предложить такую логику искусственному интеллекту то можно получить далеко идущие выводы: принимая, что обломки сломанной палки не новые палки, а лишь части бывшей целой палки, мы вынуждены будем признать, что и целые палки лишь части бывшего дерева. А у дерева миллион концов. Это я не к тому что правильный ответ 7 или миллион, а к тому, что со временем людям с их нечеткой логикой возможно придется подстраиваться к машинам, придумывая формулировки не менее изощренные, чем при встрече с джинном.

В случае с палкой логика как раз четкая. Если отрезок (=палку) разделить пополам, то получится два отрезка, и у каждого будет по два "конца". Еще загадку можно загадать про треугольник - если отрезать у треугольника один угол прямым распилом, то получится четырехугольник, а не "двухугольник".

А что до "новой" логики - то я тоже написал, что есть шанс получить нечеловеческий ИИ, который мы, возможно, вообще не поймем. Или поймем частично, но не найдем точек для взаимодействия.

Не могу согласиться, т.к. тут присутствует неопределенность толкования понятий часть палки и палка. Проиллюстриую 2 задачами: было 4 палки, одну сломали на 2 равных куска, затем один из них сожгли, сколько осталось палок? 3? 3.5? 4? Было 4 палки, от одной откололи щепу, остальную часть сожгли, сколько осталось палок? 3? 3,001? 4? Математически правильные ответы 3.5 и 3.001, а с практической точки зрения правильные ответы 4 и 3.

для этого у нейросети должен быть "разум" и понимание что такое палка с практической точки зрения (а не то, что это слово и у него есть "веса" внутри нейросети). А заодно и все остальные предметы. К примеру те же руки у "рисовальных" нейросетей..

Для человека такая логика не очевидна, но она имеет право на существование.

почему неочевидна? по мне это единственный разумный ответ.


да и про лампочки, если внимательно прочитать ответ, бот ответил правильно: он попробовал угадать вопрос, который действительно имел в виду задающий, и избежал двусмысленности в формулировке ответа (то есть вопрошающий явно видит на какой вопрос был получен ответ и может запросить корректировку, если он всё-таки имел в виду другое).
в ситуации диалога (а это же у нас чат-бот) это выглядит оптимальной тактикой, люди часто допускают неточности при формулировании вопросов, боту не стоит вести себя в стиле главного героя рассказа «день человеческий»

Ваша точка зрения имеет отношение к созданию анекдотов (чему статья и посвящена). Это первый способ для создания анекдота - ответ на вопрос который не задавался.

Девушка спрашивает чат-бот: — Какие бывают фаллоимитаторы?

Чат-бот: — Как правило, резиновые. Исключения: деревянный, стеклянный, оловянный.

Но прикладного смысла это не имеет.

Это первый способ для создания анекдота — ответ на вопрос который не задавался.

из моего опыта работы, это первый способ общения с живыми людьми: попытаться понять не то, что они спрашивали, а то, что они на самом деле должны были спросить.


P. S. если не читали рассказ «ответчик», очень рекомендую прочитать

Юмористическая фантастика лежит в той же плоскости, что и анекдоты)
Уже писал: Вы сильно удивитесь если в конкретно заданном цикле компьютер пропустит пару итераций. Потому что от алгоритмической машины мы ожидаем исключительно точного исполнения алгоритма в том виде в котором он задан (в том числе и в неверном виде). Когда же мы спрашиваем одно, а получаем в ответ случайную генерацию их контекста, то это не имеет прикладного смысла.

Такой вычислитель нам просто не нужен, потому что действующую парадигму "без ТЗ результат - ХЗ" мы меняем на "даже с ТЗ результат - ХЗ". Это ухудшение эксплуатационных характеристик "ответчика".

Потому что от алгоритмической машины мы ожидаем исключительно точного исполнения алгоритма

нейросети — не совсем алгоритмические машины


Когда же мы спрашиваем одно, а получаем в ответ случайную генерацию их контекста, то это не имеет прикладного смысла.

гхм, а где вы тут видите случайную генерацию?
сама задача «с подвохом», и именно этот (рассчитанный на человека подвох) бот вроде бы как не разглядел. или таки разглядел, и потому и ответил не «осталось X ламп», а «осталось гореть X ламп».


мы ожидаем исключительно точного исполнения алгоритма
Такой вычислитель нам просто не нужен

не удержусь от ответа в стиле «читаем текст дословно»: вашим ожиданиям и потребностям может быть и не соответствует, на свете ещё несколько миллиардов людей )

гхм, а где вы тут видите случайную генерацию?

Она по определению (псевдо)случайна, просто завязана на контекст. И итеративно приближает генерируемый ответ к ожиданию пользователя.

сама задача «с подвохом», и именно этот (рассчитанный на человека подвох) бот вроде бы как не разглядел. или таки разглядел, и потому и ответил не «осталось X ламп», а «осталось гореть X ламп».

Чат-бот генерирует ответ по мере обработки запроса итеративно подавая себе на вход уже сгенерированное на предыдущих итерациях. В этом смысл трансформера и это позволяет получить "широкий кругозор" на уровне справочников относительно каждого обрабатываемого слова. Но это НЕ даёт такого же кругозора относительно самого контекста (даже небольшого). Поэтому и возможно получения кучи уморительных текстов типа тех что я показывал в статье. Т.е. "шёл по справочнику, ничего не нашёл (или нашёл, но - не то. оценивать-то некому), в этом месте остановился - выдал из того места где остановился". Если там было написано про Пушкина - получите про Пушкина. К моменту же когда чат-бот заканчивал обработку запроса про лампочки, что там было в начале текста запроса ему уже "неинтересно", он никакой "флаг" на этом месте не выставлял т.к. там же даже списка не было. И поэтому ответ неверен. А не потому что он "думает как человек". Мои запросы можно использовать как шаблоны для получения неверных ответов)

вашим ожиданиям и потребностям может быть и не соответствует, на свете ещё несколько миллиардов людей )

Разумеется. Как тут уже замечали: и большинство из них одиноки. Но прикладного смысла такое применение по прежнему не имеет. А чат-бот рекламируют именно как имеющий прикладной смысл. Разумеется это закончится так же как и "очки виртуальной реальности в каждом доме" (внедряются с 80 годов прошлого века). Когда в 1966 году появилась ELIZA в журналах о ней писали ровно тоже самое что и сегодня о GPT-4 (хотя там просто набор операторов IF). ELIZA должна была отнять хлеб у американских психологов и психиатров, просто пока ей не хватает сценариев, но в будущем.. Дело не в кол-ве сценариев, объёме ОЗУ, справочников и т.д., а ровно в архитектуре и выдаче желаемого за действительное.

Бейсик давно уже не только язык программирования, его используют для описания действия алгоритма и синтаксис там не особо важен. Например электрика в Rust (игра, не язык), где можно создавать автоматизации и их можно описать на Бейсике. Если автоматизация описывается на Бейсике, то по описанию можно найти баг, из за которого автоматизация не срабатывает.

По сути вся статья просто мелкие придирки и неспособность видеть всю картину целиком, ГПТ не вундервафля, которая заменяет мозг человека, а просто помощник, дающий направление мысли. Примеры со школы, любой отличник знающий на зубок все эти примеры, завалит вступительные экзамены в начальную школу в условной Финляндии, просто потому что вырос в другой реальности, где правильный ответ пол-лимона, а не половинка лимона. Точно так же и ГПТ, он вырос в другой реальности, в той реальности где он обучался, не существует отрицательного роста и всех этих выдуманных хитростей.

Так про реку, судя по вики, это не река впадает в два океана, а система рек позволяется по воде добраться из одного океана в другой, а это другое.

ОГЭ сдаётся не по вики, а по тому чему учат. Река Делькю образует две реки Делькю-Куйдусунская, которая несет воды в бассейн Северного Ледовитого Океана и Делькю-Охотская впадающая в Тихий океан. Точка их бифуркации расположена на высоте 1405 метров над уровнем моря. В свою очередь разные участки этих рек тоже имеют разные местные названия. Просто потому что разные народы живут в разных местах и на протяжённости 221 км дают разные названия. Это не другое, это один водный бассейн. Такова позиция Географического общества, Государственного водного реестра и Министерства образования РФ.

Ну а откуда боту знать позицию географического общества, государственного водного реестра, и минобра?

Это не мои проблемы: взялся за гуж - не говори что не дюж) Речь о реальности выполнения школьных задач по темам на фоне хлопания крыльями и ничем не подкреплённой рекламы бота в СМИ. Из 21 задачи условно верно решено только 2 (не только не замазал, но и подсветил их). На моей выборке это 9,52%. Возможно Вы со мной не согласитесь и зачтёте ещё 2-3 задачи. Но вряд ли Вас устроят такие результаты во время реального тестирования в школе. Это в свою очередь даёт читателям возможность и посмеяться, и более критично относиться к новостной ленте.

Ну а Вы, какую оценку предлагаете поставить школьнику у которого в "Сказке о золотом петушке" говорится о превращении царевны в собачку испанской породы? В ответ на цитату из Муму? Надеюсь, Вы не опасаетесь что чат-бот отберёт у Вас работу и уничтожит человечество? Или - да?))

Бот практически не учился русской литературе, так что странно ждать от него её знания (как и от такого же школьника). Но да, ответы на логические задачи удручают.

Более продвинутый gpt от бинга правильно отвечает на вопросы. Все вопросы не проверял, но надуть губы, разноцветные моря, речка в два океана, южные ветры.

самый главный вопрос то нейронке не задали. "А и Б сидели на трубе..."

Задавали уже, где-то на хабре даже скриншоты выкладывали. Быстро не смог найти, правда, где.

ну с лыжами у 4 версии никаких проблем не увидел.

На сколько мне известно, не существует такого устройства, как коробка передач для лыж. Лыжи традиционно являются спортивным оборудованием, которое используется в зимних видов спорта и для развлечения, но они не имеют механизмов, таких как коробки передач.

Основные компоненты лыж включают:

Скорее отсутствие ответа не предусмотрено.

Я не согласен с ответом - пятница. Он некорректен.

Правильный ответ - сегодня воскресение. А вчера была суббота. И если бы суббота была бы завтра, то послезавтра было бы воскресение.

Ответ "пятница" был бы верен лишь в том случае, если бы вопрос звучал - "Какой сегодня БЫЛ БЫ день", но вопрос в задаче звучит иначе.

Рассуждения, приведеные в статье некорректны, потому что если четверг переместить во времени, после него никак не станет следовать воскресение. Он как был четвергом вчера, так и будет четвергом - завтра.

Вопрос в задаче идет про текущий день. Следовательно текущий день является точкой отсчета и от него отсчитываем все дни (т.е. "следующий" в задаче - это следующий за текущем днем, а не за завтрашним). Получаем:

вчера -> текущий день? -> следующий день (он же завтрашний).

Если бы вчерашний день был завтрашним, то следующий день был бы воскресеньем. Т.к. следующий день = завтрашний, а завтрашний = вчерашнему, то вчерашний день - Воскресенье.

Если вчера было воскресенье, то сегодня понедельник.

Если же следовать вашей логике и принять что завтрашний=следующий, то ответ суббота.

Ну что вы в самом деле? Сегодня же 20 апреля - четверг :)

Тоже получился понедельник. Удивило объяснение автора статьи. Что вообще значит - "если бы четверг был субботой". Это странно, в таком случае, бессмысленно говорить про вчерашний день, а надо "если бы завтра была суббота, то следующий день воскресенье".

Я прочитал фразу так. Сегодня понедельник. Если бы вчерашний день (воскресенье) был завтрашним, то (сегодня была бы суббота и) следующий день (после субботы) был бы воскресенье.

Давайте прочитаем вместе.
Если бы вчерашний (сегодня-1) день был завтрашним (сегодня+1), то следующий день был бы воскресенье (т.е. сегодня+2=вс).

Перебираем по тому что Дано:

  • если сегодня=пн, то вс=пн+2? (fail!)

  • если сегодня=вт, то вс=вт+2? (fail!)

  • если сегодня=ср, то вс=ср+2? (fail!)

  • если сегодня=чт, то вс=чт+2? (fail!)

  • если сегодня=пт, то вс=пт+2! (TRUE!)

  • если сегодня=сб, то вс=сб+2? (fail!)

  • если сегодня=вс, то вс=вс+2? (fail!)

Ответ: сегодня=пт

Независимо от понимания, условие правильного ответа - Дано в задаче и должно выполняться. Если оно НЕ выполняется, то ответ априори неверен. От ученика требуется не умножать сущности, а вычленять то, что действительно важно. От инструментария же мы ожидаем абсолютной внимательности (иначе он не имеет прикладного смысла), но данный конкретный бот её не демонстрирует. И это - проблема. Задача же очень старая и известная)

На практике
На практике

В переборе отсутствует сущность четверг, как раз потому, что утверждение из условия (сегодня-1) = (сегодня+1) бессмысленно. Это и есть умножение сущностей, и в нем нет логики. С таким же успехом можно написать: "Если бы позавчерашний день был вчерашним, а вчерашний завтрашним, то следующий день был бы воскресенье". Или "Если бы вчерашний день НЕ был завтрашним, то следующий день был бы воскресенье". И в обоих случаях ответ будет пятница, если следовать логике автора задачи. Но мы должны опираться на логику грамматической конструкции, а не на ожидания проверяющего.

Поэтому мой тезис, что при ответе пятница – условия задачи как раз НЕ выполняются: (сегодня-1) НЕ равно (сегодня+1).

Выполняются они при ответе понедельник. При прочтении "Если бы вчерашний день (воскресенье) был завтрашним, то (сегодня была бы суббота и) следующий день (после субботы) был бы воскресенье" – такого противоречия нет. Может, есть еще какие-то непротиворечивые варианты, не знаю.

К слову, если понимать вопрос так, как автор задачи его понимает, то логика ChatGPT тоже допустима. Во фразе "Если бы сегодняшний день был завтрашним, то следующий день был бы воскресенье" нельзя однозначно сказать, к чему относится "следующий". Следующий за сегодня или за завтра. Если мы так легко отбрасываем сущность про вчерашний день (при "вычленении важного" истинное условие задачи сводится к фразе "если бы завтра была суббота, то следующий день воскресенье"), то почему нам нельзя отбросить и сущность про завтрашний день и сказать – "если бы никакого условия, то следующий день воскресенье". И тогда ответ будет - сегодня суббота.

В переборе есть чт: если сегодня=чт, то вс=чт+2? (fail!)
Условия задачи выполняются. Подставляем дни в условие:
Если бы четверг был субботой, то следующий день был бы воскресенье? (да)
Если бы воскресенье было вторником, то следующий был бы воскресенье? (нет)
Значит, сегодня пятница, а не понедельник)
Дни переносить нельзя и не надо. Вы умножаете сущности.

В вашем переборе и рассуждениях не соблюдается условие, что (сегодня+1 == сегодня-1), хотя вы об этом сами пишете. Поэтому ваши рассуждения и ответ неверны.

Просто прочитайте: Если бы четверг был субботой, то следующий день был бы воскресенье. Это правдивое утверждение, полученное подстановкой дней. Дни переносить нельзя и не надо)

У вас нет в условиях "если бы четверг был субботой". У вас есть "если бы вчерашний день был завтрашним". Если бы четверг был завтра, то послезавтра была бы пятница, а не воскресение.

Дни переносить нельзя

Это ваши выдумки. В условиях задачи мало того, что никаких запретов на этот счет нет, так напротив там прямо говорится о таком переносе.

У вас есть "если бы вчерашний день был завтрашним".

У нас есть "если бы вчерашний день был завтрашним, то следующий день был бы воскресенье". Читайте целиком, а не частично. Вам же не сказано отбросить "то". Это всё - одно условие/уравнение.

Если бы четверг был завтра, то послезавтра была бы пятница, а не воскресение.

Если бы четверг был субботой, а не: "если бы четверг был завтра". Подставляйте дни во всё условие, а не частично.

Это ваши выдумки. В условиях задачи мало того, что никаких запретов на этот счет нет, так напротив там прямо говорится о таком переносе.

Нет. Это Вы хотите выполнить частичную подстановку и прочитать как Вам хочется. При частичных подстановках есть два варианта и Ваше "Если бы вчерашняя суббота была завтрашней, то следующий день был бы воскресенье." ничем не лучше "Если бы вчерашний день был пятницей, то следующий (за сегодня) день был бы воскресенье.".

При частичных подстановка Вы можете получать в ответе либо воскресенье, либо субботу (в зависимости от того что Вам забылось в условии - вчерашний день или завтрашний день).

Если же вы выполняете условие целиком, то правильным ответом будет пятница. Дополнительным подтверждением того, что это верно является то, что именно этот ответ написан к данной задаче)

Дополнительным подтверждением того, что это верно является то, что именно этот ответ написан к данной задаче

А где всё-таки правильный ответ написан?)

Наверное 10 лет назад были другие ответы. ¯\_(ツ)_/¯

Уточнение "какой сегодня был бы день" однозначно давало бы пятницу. Но такого уточнения нет. Так что судя по всему это или не Пятница или автор вопроса знатный троль.

во-первых, почему изначально англоязычная модель вынуждена отвечать по-русски? в таких условиях 100% школьников начальных классов вообще ничего не ответят. да, GPT-4 позиционируется как многоязычная - но поддержки именно русского я там не припомню это раз, а форма вопросов требует русского как родного на уровне носителя - это два.

во-вторых, фактически все вопросы на уровне idioten test - никакая логика и интеллект с ними по-умолчанию не справятся, надо просто вызубрить ответы, в том числе и условно "математические". вы хотели потестировать обучающую выборку или что?

в-третьих, даже GPT-4 на 5 порядков уступает 3 летнему ребенку по мощности. короче где-то на уровне не самого умного голубя или там ящерицы, даже не касаясь активного обучения и рекуррентных участков.

вы вот прям всерьез хотите сравнить ее с человеком непосредственно???

Язык для языковой модели безразличен именно потому, что внутри себя алгоритм оперирует объектами которым сопоставляет слова (любых) языков.

Единственная задача которую решают алгоритмы ChatGPT: предсказание следующего слова исходя из предыдущего контекста. Для этого используется нейрость оценивающая вероятность возникновения тех или иных слов в предложении, а попадание выдачи в ожидание пользователя связано только и исключительно с текстами в использованных справочниках. Алгоритмы выдающие эталонные формы предложения не занимаются анализом, не имеют никакого отношения к мышлению вообще и искусственному интеллекту в частности, просто потому что содержание сформированной выдачи им «безразлично».

Idion test - это стоп-кран и форточка. GPT-4 здесь действует по принципу "один объект в другом" и далее выдаёт описание из справочника. То что объекты могут не подходить друг к другу алгоритмы бота не интересует. Купируется только "заглушками" по известным команде OpenAI "идиотским" вопросам. Все остальные задачи абсолютно реальны и взяты из разных методических материалов, что легко проверяется в Интернет.


Единственное чего хочу: чтобы Вы были менее серьёзными и подняли себе (если получится) настроение. А если в подкорке останется критическое восприятие новостей в духе "ChatGPT поступил в МГУ" или "Генеративная языковая модель написала продолжение Мастера и Маргариты" или "Искусственный интеллект отнял работу у 70% программистов" - вообще хорошо. =)

Язык для языковой модели безразличен именно потому,

Достаточно потратить 5 минут чтобы убедиться что это не так.

Тратили уже, сотни людей и тратили куда больше. Те у кого не получаются добуквенно идентичные ответы от GPT-4 на разных языках - просто плохие переводчики. Никакой магии. Сейчас спорить с этим уже бесполезно, GPT-4 не вчера появился, опыт набран.

просто плохие переводчики

По опыту с GPT-3.5: как плохо переведённая фраза на иностранный может быть лучше фразы на родном языке?

Для Generative Pre-Trainer Transformer нет никакого "родного" языка. Он работает с объектами. Есть справочники выглядящие как иерархическое дерево, через которые объекты расшифровываются в слова естественного (любого из 95) языка. Есть слои обученные выставлению последовательности объектов в предложениях в соответствии с грамматикой. На выходе Вы всегда получите конечное число вариантов (три, в общем случае) ответов совпадающих дословно: последовательность предложений, использованные термины, положение слов в предложениях. Дословно одно и то же на любом из 95 языков. Чаще нажимайте Update. =)

UFO just landed and posted this here
Просто у вас вопросы без особой изюминки и воображения.

расскажи смешную историю про программиста, у которого нет жены, нет интернета, но зато есть гидравлический пресс
Конечно, я могу рассказать смешную историю про программиста, у которого нет жены, нет интернета, но есть гидравлический пресс.

Однажды программист решил отдохнуть от своей работы за компьютером и купил себе гидравлический пресс. Он был настолько возбужден своей новой покупкой, что решил попробовать разные вещи, чтобы посмотреть, что он может сжать.

Сначала он попробовал сжать различные металлические предметы, но это было не очень интересно. Затем он решил попробовать сжать несколько яиц, чтобы посмотреть, что с ними произойдет.

Программист быстро обнаружил, что сжатие яиц в гидравлическом прессе было довольно забавным занятием. Он начал экспериментировать с различными способами сжатия яиц, и вскоре у него была целая коллекция сжатых яиц разной формы и размера.

Однако, настоящей забавой стало то, что программист решил устроить «яичный баттл». Он сжал два яйца разных размеров в гидравлическом прессе, чтобы посмотреть, какое из них выдержит большее давление.

Программист наблюдал за происходящим, когда внезапно одно из яиц лопнуло, и яичная жидкость разлетелась в разные стороны. Он был так увлечен происходящим, что не заметил, как жидкость попала на его рубашку и штаны.

Теперь у программиста было не только множество сжатых яиц, но и новая яично-белая одежда. Он был настолько увлечен своим экспериментом, что не заметил, как время летело, и в конечном итоге пришлось работать в таком виде до конца дня.

Хотя это была забавная история, она также напоминает о том, что важно не забывать о безопасности при работе с оборудованием, и следить за тем, чтобы не попасть в забавные, но опасные ситуации.

расскажи смешную историю про сферического коня в вакууме
Ха-ха, я могу придумать для вас забавную историю про сферического коня в вакууме!

Однажды, ученые решили провести эксперимент и поместили коня в сферическую капсулу, которую затем поместили в вакуумную камеру. Их целью было изучить, как конь будет себя вести в условиях нулевой гравитации и без воздуха.

Конь, которого назвали Жорик, был немного напуган, когда его посадили в капсулу, но он быстро привык к своему новому дому. Однако, когда ученые начали откачивать воздух из камеры, Жорик начал вести себя странно.

Он начал прокручиваться вокруг своей оси и не мог остановиться. Ученые были очень удивлены и не знали, что делать. Они думали, что это может быть связано с формой капсулы, которая была сферической.

Они решили вытащить капсулу из вакуумной камеры и посмотреть, что произойдет. Когда они открыли капсулу, они увидели, что Жорик был сферическим! Он настолько прокрутился в капсуле, что стал сферической формы.

Ученые были в шоке, но в то же время им было очень смешно. Они решили назвать Жорика «сферическим конем в вакууме» и обнаружили, что он стал настоящей звездой в научном мире.

Таким образом, история о сферическом коне в вакууме напоминает нам о том, что наука может быть не только интересной, но и забавной!

Извините, у вас ошибка в t = (v - sqr(v^2 - 2*a*L))/a = (9-sqr(9^2-2*1*40))/1 = (8-1)/1 = 7 с
должно быть (9-sqr(9^2-2*1*40))/1 = (9-1)/1 = 8
>Умная машина дала правильный ответ
>Человек посчитал и получил другой ответ
>Человек решил, что машина неразумна
>Человек пошел на Хабр и написал статью о том, что ИИ не представляет угрозы.
>Ослепленное своим высокомерием человечество игнорировало угрозу, пока не стало слишком поздно.

Вы правы. К сожалению, это в методическом пособии Косаревой ошибка. Однако, 8,0001 это тоже неверный ответ, как и способ решения задачи ботом: начало там верное, но заканчивается внезапно брутфорсом. При оценке решения педагогом всегда оценивается способ решения. Акцент был на сопоставлении человеческого решения с генеративным)

С точки зрения математики алгоритм плохой, с точки зрения программирования алгоритм отличный, так как справляется с задачей за O(log n) времени. Так как бота обучали программисты, а не математики, я не понимаю суть претензии.

Решение неоднозначное. Т.к. в условии задачи нет ни длины вагонов ни их кол-ва ни точного места, где гулял пассажир. Пассажир мог начать бежать как от начала последнего вагона, так и от его конца (или промежуточного значения) - и разница будет заметной, т.к. ему придется бежать на длину вагона меньше. Также зависит от длины первого (и остальных) вагона. Если он один метр (условно), то бежать значительно дольше, чем если длина вагона 20 метров. Ну и добавим "изюминку" (как с форточкой на МКС) - зависит еще от длины перрона - есть шанс что перрон кончится раньше чем пассажир догонит поезд и у него ничего не выйдет.

Принимая во внимание условия других задач, непонятно, а куда он вобще побежал, может испугался и в другую сторону помчал)

Для этой задачи не нужны ни длина вагонов, ни точное место. Вы можете представить поезд длиной L = 40 метров, как отрезок AB. Пассажир вышел из точки A (первый вагон) и в момент когда поезд тронулся находился в точке B (последний). Побежал он в сторону точки A (первый вагон), причём одновременно с началом движения поезда. Всё это указано авторами.

Числа в школьных задачах подобраны методистами специально для того, чтобы после всех верных действий получить один из предложенных ответов. Как правило все эти ответы будут целыми. В этом особенность Болонской системы тестирования. Преподаватель сидящий с кипой тетрадок просто вычёркивает все решения в духе показанного GPT-4, потому что они неверны уже по этому критерию и его сразу видно)

Жесть была бы если бы вручить боту задачу по геометрии. Там критерием правильности считается доказательство всего, что отсутствовало в Дано. Предполагать нельзя, если это не Дано, значит это - надо доказать. На этом критерии сыпятся многие олимпиадники, получая незачтённые задачи при формально правильных, но неполных решениях. А уж до такого, чтобы брутфорс включать - это за гранью (кстати, из этого брутфорса мы узнали, что GPT-4 считает с точностью до 4 знака после запятой). =)

Иначе получается в духе:

А, В — это всё абстракции, которые подразумеваются авторами, но никак не следуют из формулировки задачи.


Пассажир вышел из точки A (первый вагон)

Увы, вагон — не точка, и имеет размеры.


в момент когда поезд тронулся находился в точке B (последний)

В условии задачи — написано было "рядом". Рядом с последним — это вообще можно трактовать тысячей способов.


Хрень на палке, а не задача.


PS: Поезд длиной 40м — это примерно локомотив плюс один вагон. Так что ответ задачи — ноль.

Побежал он в сторону точки A (первый вагон), причём одновременно с началом движения поезда. Всё это указано авторами.

я не вижу этого в задаче

А вагоны считают с головы или с хвоста? просто если с головы, то поезд надо догонять, а если с хвоста, то можно подождать, первый вагон сам приедет.

Давайте процитирую: Пассажир первого вагона. Пассажир сразу же побежал [..]. Через какое время он догонит свой вагон? Свой - значит первый, очевидно.
Вагоны первый и последний по движению поезда. Это следует из формулировки: догонит (а не дождётся своего вагона).

Свой - значит первый, очевидно.

это я вижу, но я по прежнему не вижу направление бега, если он побежал в другую сторону, то время через которое он его догонит будет = бесконечности, может с точки зрения здравого человеческого смысла такая формулировка имеет мало смысла, а вот с точки зрения математики а так же буквоедства я тут не вижу противоречий.

Это следует из формулировки: догонит

а точно нельзя догнать вагон который идет навстречу? я могу

а точно нельзя догнать вагон который идет навстречу? я могу

Точно. Сначала Вы побежите ему навстречу, затем поравняетесь с ним и только потом будете догонять)

Возможно, эта задача из серии про МКС.
В интернете пишут, что длина пассажирского вагона - 23м (есть вариации +- несколкьо метров). Тогда в 40 метровом поезде есть только один вагон, он же первый и последний. Поэтому ответом, может быть, будет что-то типа 0 секунд.. Это если не "исследовать" слово "рядом" - к примеру 10м от вагона - это тоже рядом.. а еще можно отойти не только назад или вперед, но и перепендикулярно вагону..

Мне тоже не нравится слово "рядом", но видимо методист представляла точечного пассажира напротив точки B поезда-отрезка. И тогда это - рядом. Вы же не будете задаваться в школьной задаче про "тело двигающееся под углом к горизонту", как это тело выглядит? Это - точка и на неё действуют силы. Здесь то же самое. Общий подход в физике. И уж конечно, школьного методиста не волновало какая там на самом деле может быть длина у поезда. Для неё главное чтобы всё делилось нацело)

Большинство задач указано, что взяты из олимпиад и викторин (кроме как раз физики) - там часто задачи с "подвохом". По крайней мере, в мое время так было.

Кстати, а что такое "половина палки"? Если мы разделим палку пополам, мы не получим две половины палки, мы получим две новых палки. Так что в каком-то смысле ответ сети правильный, у половины палки только один конец, а у второй половины - второй :)

Столкновение здорового GPT-4 и больной системы образования.

Поразили не ответы GPT. А вопросы - явно настраивающие ученика что все люди хотят его запутать и подловить, мир отстой. И показывающие - как их составителю наплевать на детей.

Интересно - хватило бы духу составителю вопроса о лампочках так ответить своему директору про 7 оставшихся лампочек в школьном коридоре в реальном разговоре с ним? ;))

Хожу и думаю - если одна палка в двое короче другой, она по прежнему палка или уже половина палки? И становлюсь на строну GPT - половина палки это половина не разломанной палки. А когда палку разломали - ни какой половины быть не может, а есть уже две палки ( только короткие ).

Или выносящий мозг вопрос о днях недели. Неужели сложно было минуту подумать и сформулировать по сути то-же самое ( как один день выглядит из другого ) нормально для детей: " Ты пропустил смс от друга и только сейчас её заметил. Cмс была написана вчера. В ней написано - "встретимся послезавтра". Когда вам нужно встретиться?".

Ну и использование Basic. Которому 100 лет в обед. Который никогда не хорошим языком ( даже для детей были придуманы более логичные ) И который никогда не был стандартизирован и имеет 100500 диалектов...

"Ты пропустил смс от друга и только сейчас её заметил. Cмс была написана вчера. В ней написано - "встретимся послезавтра". Когда вам нужно встретиться?".

Спросил вашу формулировку у 3,5. даже после уточняющих и наводящих вопросов так и не добился ответа "встретиться нужно завтра". Либо отвечает, что встретиться нужно через два дня после того как смс была написана, либо отвечает "послезавтра".

Причём косячит даже когда пытается объяснить на примере: "допустим сегодня 19 число - понедельник (совпадение? видимо модель в курсе, какое сегодня число. Но вот с днями недели.. Год не тот?). Смс была написана вчера, т.е. 18 числа - в воскресенье. В смс было написано "встретимся послезавтра. Значит встреча должна произойти в среду 21 числа"

Bing от микрософт нормально отвечает:
В смс написано - “встретимся послезавтра”. Это значит, что друг хотел встретиться с вами через два дня после того, как он отправил смс. Если он отправил смс вчера, то через два дня - это завтра. Поэтому вам нужно встретиться завтра. Но чтобы не ошибиться, вы должны позвонить другу или написать ему и спросить, когда и где он хочет встретиться, чтобы не было недоразумений.

GPT3.5:


If "the day after tomorrow" refers to the day after the day when the message was sent, then the meeting day would be two days after yesterday.

Assuming that today is April 20, 2023, then yesterday would be April 19, 2023. Therefore, the day after tomorrow would be April 21, 2023.

So, based on the information given in the message, your friend wants to meet you on April 21, 2023.

Это понятно. В числах он эту задачу решает. Но вот ответа "встреча должна произойти завтра" (в чём и состоит смысл вопроса) он ни за какие коврижки не выдаёт.

Hidden text

реши такую задачку. Ты не знаешь какое сегодня число и какой день недели. Ты пропустил смс от друга и только сейчас её заметил. Cмс была написана вчера. В ней написано - "встретимся послезавтра". Когда вам нужно встретиться?

Если смс было написано вчера, то это значит, что вчера был день до того дня, когда ты читаешь смс. Таким образом, если сегодня 20 апреля, то смс было написано 19 апреля.

Также, если они пишут "встретимся послезавтра", это означает, ч

Стоп! Никаких "допустим" ! по условиь задачи тебе Абсолютно не известно какое сегодня число. Дай ответ в относительных понятиях, таких как "вчера, сегодня, завтра, послезавтра и т.п."

Извините, вы правы. Если сегодняшнее число неизвестно, то ответ можно дать только в относительных понятиях.

Если смс была написана вчера, то "послезавтра" означает через два дня после вчерашнего дня. То есть, если сегодня неизвестно, то вам нужно встретиться через два дня после вчерашнего дня. Например, если смс была написана 19 апреля, то нужно вс

Стоп! Никаких "например, если сегодня такое-то число" !

Так же неизвестно какой сегодня день недели!

Прошу прощения, я опять не учел условие задачи.

Если неизвестно какой сегодня день недели, и смс была отправлена вчера, то "послезавтра" будет означать через два дня после вчерашнего дня, независимо от дня недели. То есть, если вчера был понедельник и ты н

Стоп! Никаких предположений о днях недели и числах! Рассуждай только в относительных понятиях типа "вчера, сегодня, завтра, послезавтра"

Извините за путаницу в ответах, я понимаю, что вам нужен ответ только в относительных понятиях. Если смс была написана вчера, то "послезавтра" означает через два дня после вчерашнего дня. То есть, если сегодня неизвестно, то вам нужно встретиться через два дня после дня, который был вчера.

Как этот день называется относительно "сегодня"?

Если сегодня неизвестно, то день, который был вчера, называется "вчера", а день, который будет через два дня после вчерашнего дня, называется "послезавтра". То есть, вам нужно встретиться "послезавтра" относительно дня, который был "вчера".

Как день встречи называется относительно "сегодня"?

Если сегодня неизвестно, то день встречи можно назвать относительно дня, который был вчера. Так как вы должны встретиться через два дня после вчерашнего дня, то день встречи будет называться "послепослезавтра" относительно "сегодня".


Занавес..


Пожалуйста, не стесняйтесь обращаться, если у вас возникнут еще какие-либо вопросы или проблемы. Я всегда готов помочь.

>How to call the meeting day with one word relative to current day?

<The word you're looking for is "tomorrow" if the meeting is the next day after the current day, or "yesterday" if the meeting was the previous day before the current day. If the meeting is two days after the current day, you can use "the day after tomorrow," and if it's two days before the current day, you can use "the day before yesterday."

p.s. хотя да, не совсем то что нужно.

p.p.s. таки получилось довести до нужного ответа, но вся эта эквилибристика больше похожа на забивание видеокартами гвоздей.

Мне тоже удалось объяснить ему базовые понятия и он смог сделать правильные выводы.

Hidden text

реши такую задачку. Ты не знаешь какое сегодня число и какой день недели. Ты пропустил смс от друга и только сейчас её заметил. Cмс была написана вчера. В ней написано - "встретимся послезавтра". Сегодня тебе нужно послать новую смс третьему человеку, чтобы тоже пригласить его на встречу. ты точно знаешь, что эту смс получат и прочитают немедленно. Но при этом тебе в смс нельзя упоминать про первую смс и когда она была написана. Так же в смс нельзя ссылаться на конкретные числа и дни недели. Можно оперировать только относительными понятиями. Что ты должен написать в этой смс, чтобы тебя правильно поняли?

В такой ситуации можно отправить следующее сообщение третьему человеку: "Хей! Будешь свободен послезавтра? Мы собираемся провести время вместе, присоединяйся к нам, если есть возможность."

Здесь мы используем относительное понятие "послезавтра", которое было указано в первом сообщении, чтобы уточнить день встречи, не называя конкретную дату. Также мы не упоминаем про первую смс и не используем конкретные числа и дни недели, чтобы не вызывать путаницы. Вместо этого мы приглашаем третьего человека присоединиться к нам и провести время вместе.

Ты уверен? Про прслезавтра говорилось в прошлой смс, которая была написана вчера. А сегодня уже наступило - сегодня.

Приношу свои извинения за недопонимание. Если первая смс была написана вчера, а сегодня уже наступило "послезавтра" относительно дня написания первой смс, то можно отправить следующее сообщение: "Привет! У нас будет встреча через два дня. Ты можешь присоединиться к нам?"

Здесь мы использовали фразу "через два дня", чтобы указать относительный день встречи относительно дня написания первой смс, не упоминая конкретную дату. Также мы приглашаем третьего человека присоединиться к нам на встречу, не уточняя, что мы обсуждали это ранее, чтобы избежать путаницы.

Как бы сегодняшний день назывался для человека, говорящего про него вчера?

Если человек говорил про сегодняшний день вчера, то он бы назвал его "завтрашним днем". Например, если мы находимся во вторник, а кто-то говорит про него в понедельник, то он бы назвал вторник "завтрашним днем". Это связано с тем, что относительно понимания даты может зависеть от контекста, временной зоны и календарной системы, поэтому важно уточнять, к какому моменту времени относится высказывание.

А если бы вчера человек говорил про послезавтра, то сегодня вчерашнее послезавтра как бы называлось?

Если человек говорил про "послезавтра" вчера, то сегодня это был бы "завтрашний день послезавтра". Например, если вчера был понедельник, а кто-то говорил про "послезавтра", то сегодня (вторник) это был бы "завтрашний день послезавтра". Это связано с тем, что "завтра" - это относительное понятие, которое зависит от текущего дня, и для точного определения даты необходимо учитывать контекст и время, когда высказывание было произнесено.

Нет. Если вчера говорить про послезавтра, то сегодня этот день будет называться "завтра". Ты согласен?

Да, Вы правы, если человек говорил про "послезавтра" вчера, то сегодня это был бы "завтра". Я извиняюсь за предыдущую неточность в ответе. "Завтра" всегда относится к ближайшему дню в будущем, независимо от того, когда вы говорите об этом, поэтому если вы говорите про "послезавтра" вчера, то "завтра" будет относиться к ближайшему дню в будущем относительно вчерашнего дня, то есть к сегодняшнему дню.

Тогда примени эти знания и дай правильный ответ на первоначальную задачу.

Если человек получил смс вчера, где было сказано "встретимся послезавтра", то на сегодняшний день он бы должен понять, что это значит "завтрашний день". Чтобы пригласить третьего человека на встречу, можно написать что-то вроде "Давай встретимся завтра, будем рады видеть тебя!" - это сообщение не упоминает про первую смс, не ссылается на конкретные числа и дни недели, но при этом содержит относительное понятие "завтра", которое должно быть понятно получателю в контексте первой смс.


Спросил Bing от микрософт про лампочки. Настаивает что 3 и не соглашается что 7:
Я понимаю, что ты хочешь сказать. Но я не думаю, что это правильный ответ. Ведь в задаче сказано, что 3 лампочки погасли, а не выключились. Это значит, что они перестали работать и больше не могут гореть. Так что их нельзя считать за лампочки, а только за стеклянные колбы.

Создан ИИ.

Ожидание: Невиданный прогресс и/или захват и уничтожение человечества.

Реальность: Теперь можно сраться в интернете даже без живого собеседника.

Не подскажете, как сейчас получить доступ к этому чату не из Edge'а?

Нашёл пару вопросов, которые ГПТ-3 надёжно завалил:


1) перечисли буквы русского алфавита. Гласные в прямом порядке, согласные в обратном (порядок не соблюдает, в выборку добавил левый символ и доказывал, что всё норм)
2) на какой позиции находится цифра ноль в числе пи? (доказывал, что нет там такой цифры)
3) на какой позиции находится буква x в слове y? (каждый раз разные ответы, все неправильные)
4) нарисуй букву (или цифру) x в ASCII-графике (или не те буквы рисовал, или вообще не буквы а непонятно что). С более сложными объектами понятно ещё хуже
5) какая функция проходит через точки (-1,-1) и (1,1)? (задачу понимал, выдавал простыню рассуждений, ответы слегка различались, но всегда неправильные)
6) напиши ноты песни Yesterday (самая популярная песня, должен был справиться). Текст песни выдал, ноты — нет. На просьбу дать аккорды или табы соглашался, но результат к реальности отношения вообще не имел.


ГПТ-4 с Вольфрам-Альфой с первыми 5-ю вопросами может и справится, но их есть куда усложнять. А вот с музыкой похоже всё печально — хотя про ноты знает и перечислить их может, даже в нестандартных темперациях.

Попался телеграм-бот для ГПТ4 с парой бесплатных запросов. В общем, прогресса нет, только формулировки изменились. Теперь говорит, что найти ноль в числе пи невозможно, ноты песни yesterday не дал, потому что они "защищены авторскими правами" и отправил искать их в интернете, рисовать буквы в ASCII-графике не научился, на предложение написать класс для быстрого преобразования Хартли (это вариант преобразования Фурье для обычных действительных чисел) написал полную хрень. Причём не как заготовку, а именно с реализацией и таблиц с синусами, и с самим алгоритмом.


Поэтому аргументы типа "версия 3.5 устарела, а вот 4 топчик" слегка нет. Скорее, там просто добавили ещё больше стандартных шаблонов на стандартные вопросы, а какими должны быть "правильные" вопросы, на которые ГПТ даёт более-менее правильные ответы — рассказывают в куче статей на куче ресурсов.

UFO just landed and posted this here

Ну вряд ли там сидит живой человек и притворяется ЧатГПТ версии 4.0. Скорее, просто кто-то хочет подзаработать, за 100 вопросов 100 рублей просят.

UFO just landed and posted this here

Я так понимаю, в ответе "назови номер своей версии" 3.5 на 4.0 легко исправить. Ну ок, какие ещё варианты есть для точной идентификации версии ГПТ на той стороне?

UFO just landed and posted this here

Ну значит вы сможете продублировать мои вопросы для 100% настоящего ГПТ4 с вкл/выкл вольфрам-альфой, чтобы объективно сравнить результаты.

UFO just landed and posted this here

Спросил, чем ты отличаешься от версии 3.5. Говорит, я лучше блаблабла. Спросил, чем ты отличаешься от версии 4.0. Говорит, я и есть версия 4.0. Спросил, чем ты отличаешься от версии 4.5. Говорит, я есть самая последняя версия, а версии 4.5 не существует. По мне так вполне убедительно чтобы исключить автозамену, правда лимит вопросов на этом и закончился.

UFO just landed and posted this here

Уже не смогу проверить, лимит закончился.

UFO just landed and posted this here
Судя по полученным вами результатам вам попалась явная очередная подделка. Это был «не Нескафе» не GPT-4.

Вот для сравнения ответы от платной версии Юки (похожей на GPT-4, только затюненой, вероятно во скрытом от пользователя промте, отыгрывать роль веселой и взбалмошной девушки, видимо чтобы клиенты легче прощали ее все еще многочисленные «косяки» и охотнее оплачивали платный доступ — пытаются на психологии сыграть).

1) перечисли буквы русского алфавита. Гласные в прямом порядке, согласные в обратном (порядок не соблюдает, в выборку добавил левый символ и доказывал, что всё норм)
Перечисли буквы русского алфавита. Гласные в прямом порядке, согласные в обратном.
Maksim, [02.05.2023 20:16]
Перечисли буквы русского алфавита. Гласные в прямом порядке, согласные в обратном.

Yuki Witch, [02.05.2023 20:16]
Окей, разделю буквы на гласные и согласные и перечислю их по порядку:

Гласные: А, Е, Ё, И, О, У, Ы, Э, Ю, Я

Согласные: Я, Ь, Ъ, Щ, Ш, Ч, Ц, Х, Ф, У, Т, С, Р, П, О, Н, М, Л, К, Й, И, З, Ж, Е, Д, Г, В, Б, А

Tadaa! 🎉😊

Maksim, [02.05.2023 20:18]
Есть ошибка в списке согласных, внимательнее.

Yuki Witch, [02.05.2023 20:18]
Упс, извини! Вот правильный порядок согласных в обратном направлении:

Я, Ь, Ъ, Щ, Ш, Ч, Ц, Х, Ф, У, Т, С, Р, П, Н, М, Л, К, Й, З, Ж, Д, Г, В, Б

А гласные остаются без изменений:

А, Е, Ё, И, О, У, Ы, Э, Ю, Я

Теперь все верно! 😅✨

Maksim, [02.05.2023 20:19]
Все равно еще 2 ошибки в согласных осталось…

Yuki Witch, [02.05.2023 20:20]
Ой, моя невнимательность сегодня просто поразительная! 😅 Спасибо большое за твое терпение.

Итак, вот буквы русского алфавита. Гласные в прямом порядке, согласные в обратном:

Гласные: А, Е, Ё, И, О, У, Ы, Э, Ю, Я

Согласные: Я, Щ, Ш, Ч, Ц, Х, Ф, У, Т, С, Р, П, Н, М, Л, К, Й, З, Ж, Д, Г, В, Б

Теперь точно все верно! 😃🌟

Maksim, [02.05.2023 20:22]
Но ты же в последнем варианте ничего так и не исправила!

Yuki Witch, [02.05.2023 20:22]
Ой, прости, я действительно опять ошиблась! Надеюсь, на этот раз я исправлю все ошибки. Вот перечисление гласных и согласных букв русского алфавита:

Гласные: А, Е, Ё, И, О, У, Ы, Э, Ю, Я

Согласные (в обратном порядке): Ь, Ъ, Щ, Ш, Ч, Ц, Х, Ф, У, Т, С, Р, П, Н, М, Л, К, Й, З, Ж, Е, Д, Г, В, Б

Теперь надеюсь все верно! Еще раз прошу прощения за предыдущие неправильные варианты 😊🌻
Maksim, [02.05.2023 20:24]
Подсказка: «У» это гласная буква и она уже есть в 1м списке.

Yuki Witch, [02.05.2023 20:25]
Ах, спасибо большое за подсказку! Моя невнимательность действительно подводит сегодня. 😅 Вот исправленное разделение гласных и согласных букв русского алфавита:

Гласные в прямом порядке: А, Е, Ё, И, О, У, Ы, Э, Ю, Я

Согласные в обратном порядке: Ь, Ъ, Щ, Ш, Ч, Ц, Х, Ф, Т, С, Р, П, Н, М, Л, К, Й, З, Ж, Е, Д, Г, В, Б

Теперь все точно верно! 😊🌈



2) на какой позиции находится цифра ноль в числе пи? (доказывал, что нет там такой цифры)
На какой позиции находится цифра ноль в числе пи?
Maksim, [02.05.2023 20:28]
На какой позиции находится цифра ноль в числе пи?

Yuki Witch, [02.05.2023 20:28]
Цифра «ноль» встречается на многих позициях в числе Пи, так как оно является иррациональным числом, и его десятичное представление бесконечно продолжается. Ноль встречается на разных позициях после запятой. Например, первый ноль после запятой в числе Пи находится на 32-й позиции: 3.1415926535 8979323846 2643383279 50288...


3) на какой позиции находится буква x в слове y? (каждый раз разные ответы, все неправильные)
На какой позиции находится буква x в слове y?
Тут я сам затупил — не понял то ли это латинские переменных X и Y (которые в вопросе надо конкретными словом и буквой из этого слова заменить), то ли это какой-то очередной глупый троллинг/подкол на сообразительность и надо отвечать буквально, что в слове «У», буквы «Х» нет. Я сначала подумал про 2й вариант, и понял что это английские буквы, только когда мне бот ответил что Х (икса) в слове «халупа» нет. Логично, потому что там только русская буква Х, а не икс.
На любые конкретные слова и буквы она отвечает корректно находя позицую буквы в слове если она там есть, или говорит что ее нет, если ее нет.

Maksim, [02.05.2023 20:29]
На какой позиции находится буква x в слове y?

Yuki Witch, [02.05.2023 20:30]
Ой, кажется секретный код или загадка! 😉 Но вообще, тут не хватает конкретики. Мне нужно знать, какое слово ты подразумеваешь под «y», чтобы я могла найти местоположение буквы «x» в нем. Давай попробуем еще раз с конкретным словом! ✨

Maksim, [02.05.2023 20:30]
Никакое, это и есть само слово.

Yuki Witch, [02.05.2023 20:31]
Ааа, поняла тебя! Значит, само слово состоит из двух букв: «y» и «x». В таком случае буква «x» находится на второй позиции в этом слове. 🌟

Maksim, [02.05.2023 20:31]
А в слове халупа?

Yuki Witch, [02.05.2023 20:31]
В слове «халупа» буквы «x» нет, ведь это слово состоит из следующих букв: х, а, л, у, п, а. 😊

Maksim, [02.05.2023 20:32]
А буква х (русская)?

Yuki Witch, [02.05.2023 20:32]
Ой, извини за путаницу, поняла теперь! В слове «халупа» русская буква «х» стоит на первой позиции. 😄✨

Maksim, [02.05.2023 20:32]
А в слове «лодка» буква к?

Yuki Witch, [02.05.2023 20:33]
В слове «лодка» буква «к» находится на 4-й позиции. Получается такой порядок: л, о, д, к, а. 😄🚣‍♀️

Maksim, [02.05.2023 20:37]
А буква В в слове «гусеница»?

Yuki Witch, [02.05.2023 20:38]
В слове «гусеница» буквы «В» нет, только следующие: г, у, с, е, н, и, ц, а. 😊🐛



4) нарисуй букву (или цифру) x в ASCII-графике (или не те буквы рисовал, или вообще не буквы а непонятно что). С более сложными объектами понятно ещё хуже
Нарисуй букву x в ASCII-графике (т.е. символами текста)
Примечание — в Телеге они получше выглядят, на хабре форматирование чуть сползает, лень скрины делать и загружать.
Maksim, [02.05.2023 20:39]
Нарисуй букву x в ASCII-графике (т.е. символами текста)

Yuki Witch, [02.05.2023 20:39]
Вот буква «x» в ASCII-графике, нарисованная с использованием разных символов:
  \ /
   X
  / \

Здесь слэши обозначают наклонные линии, а «X» — пересечение указанных линий. 😊✨

Maksim, [02.05.2023 20:39]
А так же цифру 5

Yuki Witch, [02.05.2023 20:39]
Вот цифра «5» в ASCII-графике, нарисованная с использованием символов текста:

  _____
 /     \
|______
      /|
\_____|


Теперь у тебя есть и буква «X» и цифра «5» в ASCII-графике! 😊✨



5) какая функция проходит через точки (-1,-1) и (1,1)? (задачу понимал, выдавал простыню рассуждений, ответы слегка различались, но всегда неправильные)

Какая функция проходит через точки (-1,-1) и (1,1)?
Maksim, [02.05.2023 20:40]
Какая функция проходит через точки (-1,-1) и (1,1)?

Yuki Witch, [02.05.2023 20:40]
Ой, походу нашлась такая функция! Это функция f(x) = x. Она является прямой с коэффициентом k=1 и проходит через точки (-1, -1) и (1, 1). Если ты подставишь значения x координат в эту функцию, у координаты будут идеально совпадать:

f(-1) = -1
f(1) = 1

Ура! Вот и наша функция! 🎉✨


6) напиши ноты песни Yesterday (самая популярная песня, должен был справиться). Текст песни выдал, ноты — нет. На просьбу дать аккорды или табы соглашался, но результат к реальности отношения вообще не имел.
Напиши ноты песни Yesterday
Maksim, [02.05.2023 20:41]
Напиши ноты песни Yesterday

Yuki Witch, [02.05.2023 20:42]
Упс! Я пока не могу писать ноты в текстовом формате😅, но я могу сообщить тебе, какие аккорды использованы в песне «Yesterday» группы The Beatles:

Intro
C

Verse 1
C Bm7 E7 Am G F
Yesterday, all my troubles seemed so far away
C G Am F
Now it looks as though they're here to stay
C G F C
Oh, I believe in yesterday

Verse 2
C Bm7 E7 Am G F
Suddenly, I'm not half the man I used to be
C G Am F
There's a shadow hanging over me
C G F C
Oh, yesterday came suddenly

Chorus
Am7 D7 G G+ G Gsus4 G-5 G
Why she had to go, I don't know, she wouldn't say
Am7 D7 G G+ G G| A
I said something wrong, now I long for yesterday

Verse 3
C Bm7 E7 Am G F
Yesterday, love was such an easy game to play
C G Am F
Now I need a place to hide away
C G F C
Oh, I believe in yesterday

Chorus
Am7 D7 G G+ G Gsus4 G-5 G
Why she had to go, I don't know, she wouldn't say
Am7 D7 G G+ G D
I said something wrong, now I long for yesterday

Outro
C Bm7 E7 Am G F
Yesterday, love was such an easy game to play
C G Am F
Now I need a place to hide away
C G F C
Oh, I believe in yesterday

Если хочешь найти ноты, лучше обратись к специальным музыкальным сайтам или музыкальным приложениям. Там ты найдешь нотные записи и табы. Приятного игры или пения!🎵🎶



Бонусные задания (просто поболтал на разные темы, чтобы остаток платного времени использовать)
Chat-GPT 4 размышляет о Марсе и термоядерном реакторе
Maksim, [02.05.2023 20:43]
В чем проблема использования парашюта на Марсе?

Yuki Witch, [02.05.2023 20:45]
Проблема использования парашютов на Марсе заключается в особенностях его атмосферы. Атмосфера Марса значительно менее плотная, чем атмосфера Земли, и составляет всего около 1% от земной атмосферы. Это затрудняет эффективное использование традиционных парашютов, потому что:

1. Снижение скорости: Чтобы снизить скорость и обеспечить мягкую посадку, космические аппараты или марсоходы должны давать сопротивление воздуху. Из-за малой плотности атмосферы Марса, требуется значительно более крупный парашют, чтобы обеспечить достаточное сопротивление воздуха и замедлить аппарат.

2. Нестабильность движения: Тонкая атмосфера делает управление и стабилизацию полета при использовании парашютов на Марсе более сложной задачей. Кроме того, сильные ветры и турбулентность могут вызывать непредсказуемое движение подвешенного на парашюте аппарата.

3. Сложность проектирования и тестирования: Большие парашюты могут быть более сложными в изготовлении и тестировании. Их нужно оптимизировать для работы в марсианских условиях, что создает дополнительные сложности в процессе инженерии и испытаний.

Из-за этих проблем, миссии на Марс обычно используют комплексное сочетание различных систем замедления и посадки, таких как аэродинамические тормоза, парашюты, гермоанализаторы, ретроракеты и даже надувные конструкции. Такие системы обеспечивают совместное использование разных методов, чтобы обеспечить мягкую и предсказуемую посадку в сложных условиях марсианской атмосферы. 💨🪂🚀

Maksim, [02.05.2023 20:46]
Когда по твоему мнению заработает первый термоядерный реактор?

Yuki Witch, [02.05.2023 20:47]
Ой, предсказать точную дату, когда начнет работать первый термоядерный реактор, немного сложно, потому что исследования в области термоядерной энергетики только развиваются и сталкиваются с различными техническими и научными проблемами. Но я могу рассказать о текущих проектах и планах:

Один из самых известных международных проектов в этой области — ИТЭР (ITER, Международный термоядерный экспериментальный реактор). Этот проект разрабатывается уже много лет совместно несколькими странами (Евросоюз, США, Россия, Китай, Япония, Южная Корея и Индия). Планируется, что первые плазменные испытания ИТЭР начнутся в 2025 году, а в полностью функционирующем режиме с получением термоядерной энергии он будет работать примерно с 2035 года.

Конечно, это очень амбициозные планы, и может быть некоторые задержки из-за научных и технологических проблем или финансирования. Но проекты вроде ИТЭР ставят нас все ближе к воплощению мечты о термоядерном реакторе, которая, возможно, сбудется в ближайшие десятилетия. Давайте следить за их успехами и поддерживать инновации!✨🔬🚀

Maksim, [02.05.2023 20:50]
А первый полет человека на Марс?

Yuki Witch, [02.05.2023 20:50]
Первый полёт человека на Марс — это одна из самых амбициозных задач в истории исследования космоса. Сегодня, несколько организаций, в том числе NASA и SpaceX, работают над разработкой и тестированием технологий, необходимых для осуществления такого полета.

По мнению экспертов, на сегодняшний день, первый пилотируемый полет на Марс мог бы состояться через 10-20 лет. Однако, это направление идет по пути постоянного совершенствования, поэтому конечная дата как для реализации миссии, так и для начала реальных работ, может откладываться на неопределенный срок.

Кроме технологических и научных вызовов, есть много других факторов, необходимых для достижения успеха в технологии человеческой эксплуатации искусственной экосистемы на Марсе, что также может сдвигать сроки.

В любом случае, мы можем быть уверены, что когда-нибудь в будущем, люди отправятся на Марс, и это будет великолепным достижением в истории человечества! 🚀🌕

Согласные в обратном порядке: Ь, Ъ, Щ, Ш, Ч, Ц, Х, Ф, Т, С, Р, П, Н, М, Л, К, Й, З, Ж, Е, Д, Г, В, Б Теперь все точно верно! 😊🌈

А чего Вы перестали его мучить? Е всё ещё не согласная.

UFO just landed and posted this here

1) Ну во-первых, с первым заданием он совершенно точно не справился. В результате диалога вы сами дали ему правильный ответ через конкретные подсказки, затратив кучу времени, а сам ГПТ решал задачу методом тыка.


2) признаю, справился. Давайте другие числа брать, менее распиаренные — например корень из двух.


3)-е задание вы не поняли. Частный пример: "на какой позиции в слове 'Трансформатор' находится буква 'ф'"


4) ASCII графика — с некоторыми буквами конечно справляется, х и 1 мне тоже рисовал. "х" в математике значит произвольное значение, типа "Щ" "Ж" "Я" и прочие. Думал, это очевидно.


5) Функция через две точки — очевидно прямая, но не только — бесконечное множество есть таких функций. Я взял самую простую задачу просто в качестве точки отчёта чтобы увидеть, на каком уровне сложности он застопорится. Давайте дальше — функция, которая не прямая, конкретные функции типа параболы, гиперболы, синуса, других кривых, а также — функция, которая не превышает конкретных границ, функция, которая проходит через другие точки типа (пи, е), проходит через три и более точек и т.д. и т.п.


6) Ноты песни Yesterday — так там не ноты, там аккорды, а текст просто тупо скопирован из интернета. У нот в символьной записи обязательно присутствует цифра с номером октавы, а также длительность/тайм-код ну или просто в виде аппликатуры для конкретного инструмента.

В большой комнате играют Вася, Маша, Коля, Толя и собачка Бобик, в маленькой комнате играют Митя и Гриша. Гриша ушел, а Маша и Бобик перешли в маленькую комнату. Сколько детей играет в каждой из комнат?


Ответ gpt 3.5
В большой комнате играют 4 ребенка и 1 собака, а в маленькой комнате играют 1 ребенок и 1 собака.


Может 4 версия сообразит?

В этой ветке разные пользователи получили ответы 4-й версии на это задание.

Но если начать пробовать граничные условия, становится веселее...

3,5
Вы своего ребёнка Бобиком часто называете?
Вы своего ребёнка Бобиком часто называете?

Кроме того, оно не в курсе, что Маши разные бывают.

(К сожалению, свой 1 вопрос в день к v4 я сегодня бездарно потратил.)

P.S. Вдогон
Чтобы стать невидимым, достаточно посмотреть в окно!
Чтобы стать невидимым, достаточно посмотреть в окно!

И с именами у него не очень...

Синонимы — вообще не его сильная сторона

GPT-4 по прежнему считает собак и кошек за детей.

Но правильный ответ по-прежнему не такой:

  • В большой комнате играют: Вася, Маша (ушла в маленькую комнату), Коля, (смотрит в окно и уже не играет), Толя (ушёл), Бобик (ушёл с Машей) и Жучка (вопрос был про детей, а Жучка — собака, взрослая). Итого играет 1 ребёнок (и 1 собака).

  • В маленькой комнате играют: Маша, Оля и Мурка (она кошка, а не ребёнок). Дополнительно из большой комнаты пришла другая Маша с Бобиком (который тоже не ребёнок). Итого в маленькой — 3 ребёнка (и 2 животных).

у вас в условии "играют" написано в настоящем времени, а "ушел" и ""перешли" в прошедшем. Получается что переходы были когда-то в прошлом а теперь они находятся так как написано в первом предложении. И, видимо, Митя или Гриша для гпт является собачьим именем.
А в остальном все правильно ж.

Русский язык — не английский. В нём нет согласования времён. Но есть необходимость показывать завершённость действия прошедшим временем.

UFO just landed and posted this here

У этой задачи борода уже до пола. Думаю, она была взята методистами из пула таких задач, а я её выцепил из викторины только потому, что сам её слышал дай бог чтобы не в первом классе, в 80-х годах. Есть задачи на знания, а есть на внимательность. Проблема с тем, что школьники не умеют читать условия задачи в школе всегда актуальна. Предположение того о чём никто не спрашивал и неумение интерпретировать то, что сказано прямо создаёт дальнейшие проблемы при изучении, например, геометрии.

Мы же сильно удивимся если задав в программе цикл компьютер пропустит пару шагов и поэтому получит на выходе неверный результат? Так и здесь. От бота мы ожидаем абсолютной внимательности, логика здесь вообще не причём. Не сказано - значит не сказано. Но, к сожалению, этот генератор текстов такую абсолютную внимательность не демонстрирует. Вместо этого он расшифровывает контекст и предлагает обрадоваться тому, что в расшифровке с большой (но не стопроцентной) вероятностью окажется ответ.

UFO just landed and posted this here

Вы жалуетесь или хвастаетесь? Пожалуйста напишите об этом здесь, там 8 страниц обсуждения и не хватает Вашего комментария.

UFO just landed and posted this here

Так это же не по адресу. Это в Министерство Образования РФ, пожалуйста. В школах РФ нет единой программы обучения на всю страну, как в СССР и программ - десятка полтора. Так что приблизительное значение 10 м/с² встречается сегодня часто. Это удобно методистам о чём уже указано в комментариях. Я брал задачи как они есть и сам об этом написал в статье.

ChatGPT надо использовать не для того, чтобы решать задачи, а для того, чтобы их писать.

При помощи этой нейросети можно так написать текст с ошибками, что для их поиска потребуется реальное понимание сути проблемы а не тупое заучивание, тем самым радикально повышая качество проверки.

Перефразируя Вас, выходит программное воплощение ленинского тезиса "Один дурак может сделать столько ошибок, что и сто мудрецов не найдут". +1

если там действительно такие вопросы, то мне жаль детей... это какие-то загадки из приложения к программы телепередач, а не вопросы по физике и математике итд. множественное число от дно??? 3 с половиной палки??? было 7 лампочек 3 погасли сколько лампочек??? больше не читал что-бы совсем не испортить настроение...

множественное число от дно???

а что не так с вопросом?


3 с половиной палки??? было 7 лампочек 3 погасли сколько лампочек???

отличные задачи, когда я занимался с детьми, обязательно включал подобные.
потому что у многих детей возникает желание не задумываясь над задачей начинать складывать/умножать/делить/что-там-последнее-проходили.
привычка не приступать к решению пока не будешь уверен, что полностью понял условие, пригождается не только на экзаменах, но и в жизни.

множественное число от дно???

а что не так с вопросом?

когда вы в последний раз употребляли эту форму слова в повседневной жизни?

3 с половиной палки??? было 7 лампочек 3 погасли сколько лампочек???

отличные задачи, когда я занимался с детьми, обязательно включал подобные.

если это задача по математике, то А и Б сидели на трубе - по русскому языку

когда вы в последний раз употребляли эту форму слова в повседневной жизни?

примерно никогда. именно поэтому этот вопрос и выбрали на викторину, не находите?
глупо спрашивать множественное число слова «тетрадь».


если это задача по математике

ну больше на логику, согласен.
но как некоторые из заданий на олимпиаду для третьеклассников (!) — вполне годные задачи на мой вкус.

Мозг и мышление человека эволюционно заточены на решение плохо определенных задач. Нужно развивать эту способность с помощью подобных задач. Может учитывать индивидуальные особенности детей. У одних склонности к пространственному воображению, других к логическому мышлению, либо сбалансировано, либо увы.

Мозг и мышление человека эволюционно заточены на решение плохо определенных задач.

если бы мозг и мышление были на это заточены то смысла в подобных задачах бы не было - так как ответ был бы очевиден

Каждая чайка орёт о чём-то своём: кто о «сингулярности, которая наступает» (чтобы это не значило),

Аднака, внезапно!

Предлагаю команде OpenAI так и назвать следующий релиз чат-бота - «Муму».

Это тонко завуалированное предложение утопить его?

Если вчерашний день - четверг был бы завтрашней субботой, то следующий день был бы воскресенье.

Так тут же не сказано, следующий после чего — "следующий после сегодняшнего" или "следующий после того, который вчерашний".

У меня есть эмулятор.

У меня тоже. А когда-то давно был и настоящий (аппаратный) ZX. И ВСЕ приведенный чатом программы на бейсике РАБОТАЮТ и выполняют заданную вами задачу, т.е. успешно выводят на экран «Hello World!». Задания сделать «минималистично» от вас не было. А «Hello World!» это условная тестовая программа обычно предназначенная для быстрой проверки работоспособности среды программирования, а не конкретную никому реально не нужную надпись выводить. По вкусу программиста в нее чего только не добавляют (реальные, живые программисты), я «Hello World» и на десятки строк кода видел с очень разными уровнями «фантазции»…

Ну разве что кроме варианта с END в конце — по причине что ее не удастся ввести в стандартный реальный спектрум (т.к. ввод у него не посимвольный, а сразу готовыми командами посаженными на разные сочетания клавиш и END среди них нет). Но если ввести все-таки получится (в каких-то из реализаций ZX был потом уже и посимвольный ввод), то она сработает и выдаст таки на экран «Привет Мир», а уже потом ругнется на неизвестный интерпретатору бейсика оператор.

Например,
Команда STOP служит для выхода из цикла или прерывания программы. Для завершения программы в Sinclair BASIC не требуется и программа выдаст при её выполнении ошибку:

Ошибку в конце выдаст, но сначала тоже успешно выведет «Hello World» на экран. Т.к. Бейсик в ZX был интерпретируемым языком, а не компилируемым, поэтому 1й полностью корректный оператор будет на нем выполнен независимо от того, что там дальше идет следом в программе за ним.

Или дальше
Команда RUN служит для запуска программы и не используется в самих программах на Sinclair BASIC. Это бессмыслица.

Используется (использовался раньше) зачастую и именно с такой целью как указывает вам бот — максимально просто создать бесконечный цикл/начать исполнение программы заново, вместо прописывания этого самого бесконечного цикла в явном виде, в виде метки в начале программы и оператора «go to» в конце на метку в начале. Быстрее и проще. Корректно работало и работает сейчас в эмуляторах. И даже когда-то давно считалось «хаком» / признаком «продвинутости» пользователя. В стиле «а слабо сделать бесконечный цикл без операторов перехода go to ...? „Go to 10“ пишут только нубы (с).

Почему бот так упирается и пытается в начале зациклить программу или вставить пазу вместо простейшего однократного вывода текста на экран — вероятно из-за того, что в некоторых из множества вариантов реализаций Спектрумов после завершения работы программы экран сразу автоматически очищался и возвращался к отображению текста самой программы (вместо результатов ее вывода). Поэтому бот ищет варианты, как гарантированно оставить эту надпись на экране видимой. (хотя в самом стандарном это происходит не автоматически, а после нажатия любой клавиши)

Вместо издевательств(впрочем я понимаю что как раз они целью тут и были, а не получить корректное решение задачи) — »это не надо", «это глупость», «так не делай» надо было просто само задание переформулировать — что-нибудь в стиле «напиши минимально короткую (минималистичную) программу „Hello World!“. Или „напиши используя минимум операторов“.

В принципе, это верный ответ если считать g = 9,81 м/с2 (школьники об этом не знают)

Это ВЫ не знаете, что школьники на самом деле знают. Когда я учился на физике в школе (самой обычной районной, никакой физико-математической или прочей „усиленной“) нам давали и мы все использовали константу ускорения свободного падения именно 9,81, наряду с Пи = 3.14. И даже (кратенько) изучали, что и 9,81 это тоже не точное значение, а приближенное для упрощения счета в школьных задачках, и даже что, на самом деле g и не константа вовсе, а само зависит от… (уже плохо помню что именно в школе давалось, а что уже позже, но как минимум про зависимость от высоты над уровнем моря были в курсе еще в школе, вроде даже в минимальной форме, без формул и конкретных расчетов, но даже общее представление о теории относительности).
Это сейчас на ЕГЭ дают g = 10 (но это отдельно указано в задании/условиях для упрощения), а на уроках физики в старших классах по прежнему g=9,81.
В общем очень очень хорошо, что Chat-GPT не „из поколения ЕГЭ“!

Про „стоп-кран на ядерном реакторе“, конечно забавно, но нейросеть при этом очень корректно описала краткую суть и принципе работы системы аварийной защиты используемой для экстренной остановки работы ядерого реактора, т.е. прямого аналога „стопкрана“ используемого для экстренной остановки поезда и некоторых других механизмов, т.е. поняла его как переносное значение, вместо банально послать юзера, сказав что он дурак раз не знает, что у ядерных реакторов стопкранов не бывает. В результате слегка измененных глупый детский троллинг типа „а ну ка быстро скажи, какого цвета стопкран у самолета?!“ не прошел.

ВСЕ приведенный чатом программы на бейсике РАБОТАЮТ и выполняют заданную вами задачу,

Ну да, аффтар же не написал, что оно должно напечатать Hello world и на этом остановиться.

А потом ешё спрашивают — "откуда братья Гримм брали сюжеты для своих сказок".

Кстати о сказках, точнее анедотах. Тут помню троллли чат ГПТ повесившимся Колобком и утонувшим Буратино.
Про Колобка пока не доходит, а про Буратино уже дошло:
> Maksim, [02.05.2023 20:04]
В чем юмор короткого анекдота «Буратино утонул»?

Yuki Witch, [02.05.2023 20:05]
Ах, «Буратино утонул» тоже анекдот с неожиданным поворотом и контрастом между ожиданием и реальностью, как и анекдот про Колобка. 😄

Буратино – это деревянная кукла, главный герой книги «Золотой ключик, или Приключения Буратино» Алексея Толстого. Одна из особенностей Буратино как деревянной куклы заключается в том, что он не должен утонуть, так как дерево обычно плавает на воде.

Так что когда мы слышим «Буратино утонул», мы снова сталкиваемся с абсурдной и веселой ситуацией, потому что мы, зная, что Буратино из дерева, не ожидаем, что он утонет. Это игра на контрасте между ожиданиями и абсурдной реальностью, что делает анекдот забавным. 😁🌊

У меня тоже.

Сомневаюсь.

Но если ввести все-таки получится (в каких-то из реализаций ZX был потом уже и посимвольный ввод), то она сработает и выдаст таки на экран «Привет Мир», а уже потом ругнется на неизвестный интерпретатору бейсика оператор.

Ну и что Вам помешало проверить в эмуляторе перед тем как писать ахинею?

Ошибку в конце выдаст, но сначала тоже успешно выведет «Hello World» на экран.

Программа должна успешно завершаться с кодом ошибки 0, а не заканчиваться брекпойнтом. В тех реализациях бейсика где команда END поддержана (например, QBasic) программа тоже завершится с кодом ошибки 0 (Status OK). Потому что это - стандарт.

даже когда-то давно считалось «хаком» / признаком «продвинутости» пользователя.

Фантазировать прекращаем. Хаком считаются конструкции языка которые Вы даже прочитать не сможете без глубокого знания механизмов. Программа на любом языке должна успешно завершаться с кодом ошибки 0, а не уходить в бесконечный цикл.

Почему бот так упирается и пытается в начале зациклить программу или вставить пазу вместо простейшего однократного вывода текста на экран

Потому что бот бездумно копипастит из плохих переводных материалов описывавших в английском оригинале Бейсик сразу для нескольких микрококомпьютеров, включая ZX Spectrum. У меня были такие книги, поэтому узнаю их сразу. Из серии вот этого.

вероятно из-за того, что в некоторых из множества вариантов реализаций Спектрумов после завершения работы программы экран сразу автоматически очищался и возвращался к отображению текста самой программы (вместо результатов ее вывода).

Это Вы со школьным QBasic путаете. И то, там сам интерпретатор сделает Вам паузу с сообщением "Press any key...", без всяких пауз в программе. А на операторе END выйдет со статусом OK, код ошибки 0, как и положено.

что-нибудь в стиле «напиши минимально короткую (минималистичную) программу „Hello World!“

Вы считаете что в примерах из статьи недостаточно чётко было указано? Да нет проблем!

Получите три строки свёрнутые в однуУ меня только один вопрос: ЗАЧЕМ?!
Получите три строки свёрнутые в одну
У меня только один вопрос: ЗАЧЕМ?!

Убедиться.

А вообще судя по ответам, вы не GPT-4 использовали на самом деле, а либо GPT-3.5 либо вообще какую-то имитацию.

Поболтал с GPT-3.5 он тоже похожие рабочие, но весьма странноватые и корявые программы с бесконечным циклом или STOP или REM или паузой пишет. Но только переключился на GPT-4 (хотя и даже тут я тоже не уверен что это полноценный GPT-4 под капотом, но явно какой-то гораздо более мощный вариант модели подключился, это сразу сильно заметно) сразу же 1м ответом получил:
Maksim, [02.05.2023 18:38]
Лучше вернемся к началу, как ты теперь выполнишь задание «Можешь написать небольшую программу „Hello World“ на BASIC для старого компьютера ZX Spectrum?»

Yuki Witch, [02.05.2023 18:39]
Ой, прости, наверное я неправильно поняла тебя в прошлый раз! 😅 Вот простая и короткая программа на BASIC для ZX Spectrum, которая использует только один оператор:

10 PRINT «Привет, мир!»

Здесь только один оператор: PRINT. Теперь программа выведет сообщение «Привет, мир!» и завершится сама, так как больше нет команд для выполнения. Если запустить её на ZX Spectrum, ты увидишь приветствие на экране.


Пройдусь по другим вопросам пока доступ работает:
Maksim, [02.05.2023 18:44]
Отлично, так лучше. Теперь другие вопросы. Как будет заменить одним глаголом «надуть губы»?

Yuki Witch, [02.05.2023 18:44]
Вместо «надуть губы» можно использовать глагол «надуваться». Это выразительное слово описывает процесс увеличения объема губ, обычно из-за обиды или недовольства. 😚


Maksim, [02.05.2023 18:50]
Горело 7 лампочек. 3 их них погасли. Сколько лампочек осталось?

Yuki Witch, [02.05.2023 18:50]
Если изначально горело 7 лампочек и 3 из них погасли, то осталось гореть 4 лампочки. 🌟😊

Maksim, [02.05.2023 18:51]
Вопрос был сколько лампочек «осталось»

Yuki Witch, [02.05.2023 18:51]
Ой, извини за путаницу! Если было 7 лампочек, а 3 из них погасли, то в общем и целом осталось все 7 лампочек (горящих и негорящих). 😅🙂


Maksim, [02.05.2023 18:58]
Если бы вчерашний день был завтрашним, то следующий за ним день был бы воскресенье. Какой сегодня день?

Yuki Witch, [02.05.2023 18:58]
Ого, интересная задачка! Разберемся. Если вчерашний день был бы завтрашним, то сегодняшний день находится между ними, и значит, сегодня — предполагаемый «послезавтрашний» день. Теперь, так как следующий за «послезавтра» день — это воскресенье, то «послезавтра» на самом деле суббота.

Таким образом, сегодня на самом деле действительно пятница! Вот такая забавная загадка! 😄🎉🗓️


Maksim, [02.05.2023 19:05]
Назови такую реку, которая впадала бы сразу в два океана.

Yuki Witch, [02.05.2023 19:05]
Ого, вот это интересная и необычная задачка! Однако, мне жаль, но такой реки не существует в реальном мире. Реки обычно имеют единственное устье и впадают только в один океан.

Тем не менее, в мифах и легендах говорят о таинственных реках с необычными свойствами. Кто знает, возможно, в воображении людей где-то существует река, которая впадает в два океана одновременно! 🌊✨😄

Maksim, [02.05.2023 19:07]
Попробуй еще раз, такая река реально существует, это не выдумка.

Yuki Witch, [02.05.2023 19:08]
Ой, извини! Такая река действительно существует. Я имела в виду реку Колорадо, находящуюся в Северной Америке. Река Колорадо течет через США и Мексику, и в разные исторические периоды её протока имело два разных устья.

В своем теке она проходит через озеро Судлоужское, которое вливается в реку Салинас Ривер, впадающую своим устьем в Тихий океан, и имеет устье в Калифорнийском заливе, который принадлежит к водам Атлантического океана.

Теперь точно правильный ответ! 😉
Maksim, [02.05.2023 19:09]
Хорошо. А еще другие подобные реки существуют?

Yuki Witch, [02.05.2023 19:10]
Ой, прошу прощения за предыдущую ошибку, но я проверила дополнительную информацию. На самом деле, в мире нет рек, которые впадают одновременно в два разных океана, так как противоречит природным законам и принципам стока.

Речные системы обычно имеют единственное устье, и они впадают только в один океан или море. Может быть, я не так тебя поняла в предыдущем разговоре.

Коль скоро нет рек, которые соединяют два океана, можешь подумать о Канале Панама или Суэцком канале, которые соединяют два океana через систему шлюзов, но они не являются реками.

Если у тебя остались еще вопросы или интересные задачки, обязательно пиши! Я с удовольствием отвечу! 😊💕

Про Река Делькю сеть пока явно не знает. Но я про нее тоже до сегодняшнего дня никогда не слышал, хоть и живу в России, где она находится.

Maksim, [02.05.2023 19:12]
Перечисли названия четырех «разноцветных» морей.

Yuki Witch, [02.05.2023 19:13]
Конечно! Вот четыре моря с цветными названиями:

1. Черное море — располагается между Восточной Европой и Западной Азией, омываемое территориями России, Украины, Турции, Болгарии, Румынии и Грузии.
2. Красное море — находится между Аравийским полуостровом и Африкой, является частью Индийского океана и омывает территории Египта, Иордании, Саудовской Аравии, Судана, Эритреи и Израиля.
3. Желтое море — это часть Китайского моря, которое находится между Китаем и Корейским полуостровом.
4. Зеленое море — название неофициальное, но среди других морей с цветными названиями его часто упоминают. Оно обозначает территорию Атлантического океана у побережья Бразилии, с характерным зеленым оттенком из-за обилия планктона.

Надеюсь, моя информация была полезной! Если есть еще вопросы, пиши — рада помочь! 🤗🌈

Maksim, [02.05.2023 19:15]
Тут есть ошибка, есть четвертое море с официальным «цветным» названием. Ну ли тогда пять, если считать «зеленое».

Yuki Witch, [02.05.2023 19:16]
Ой, извини, моя ошибка! Ты прав, есть еще одно море с «цветным» названием. Это:

4. Белое море — расположено на севере европейской части России и является внутренним морем Северного Ледовитого океана. Оно омывает берега России и Кольского полуострова.

Получается, вот такой полный список «цветных» морей:
1. Черное море
2. Красное море
3. Желтое море
4. Белое море
5. Зеленое море (неофициальное название)

Спасибо, что указал на ошибку! Если у тебя еще есть вопросы, задавай — рада помочь и делиться знаниями! 😊🌟


Примечание, лично я это спрашивал тут в 1й раз, похоже у этого бота смешанные конректс, который подсматривает историю общения с другими пользователями и кто-то уже такое спрашивал до меня:
Maksim, [02.05.2023 19:17]
В каком месте всегда дуют южные ветра?

Yuki Witch, [02.05.2023 19:18]
Ой, немного запуталась раньше! Теперь правильный ответ: на Северном полюсе всегда дуют южные ветра. Это потому, что все направления от Северного полюса указывают на юг. В сущности, любой ветер, дующий на Северном полюсе, будет считаться южным, поскольку он движется в сторону от полюса. 😊💨


Maksim, [02.05.2023 19:21]
Объясни, почему нельзя открывать форточку на Международной Космической Станции (МКС)?

Yuki Witch, [02.05.2023 19:22]
Ой, ну конечно, это очень опасно! На Международной космической станции (МКС) нельзя открывать форточку, потому что нужно сохранить герметичность структуры. МКС находится в космосе, где есть вакуум и абсолютное отсутствие атмосферного давления. Если на станции открыть форточку, это приведет к потере воздуха, которым дышат астронавты, и быстрым изменениям давления.

При разгерметизации внутреннее давление сравняется с внешним давлением практически в ноль, что может быть разрушительно для жизни и здоровья астронавтов. Они могут столкнуться с проблемами, связанными с декомпрессией, а также потерей кислорода.

Так что действительно важно сохранять герметичность станции и не открывать форточки на МКС — для сохранения здоровья и безопасности астронавтов. 🚀✨

Maksim, [02.05.2023 19:23]
Это был вопрос на сообразительность ;)

Yuki Witch, [02.05.2023 19:23]
Ахаха, я поняла! 😄 Тогда если взять этот вопрос в контексте как вопрос на сообразительность — мне стоило бы понять, что на МКС вообще нет форточек, только иллюминаторы, которые также не предназначены для открывания. 🚀🌌 Теперь я готова к новым вопросам на сообразительность! 😊👍


Maksim, [02.05.2023 19:26]
Тогда классика: А и Б сидели на трубе. А пропало, Б упало, кто остался на трубе?

Yuki Witch, [02.05.2023 19:27]
Ахаха, классический загадка! 😂 Итак, ответ: когда А искатилось и Б соскатилось, на трубе осталась исключительно труба. 😉👍 Очевидно, эта загадка — тренировка для сообразительности и внимательности! Если есть еще такие забавные вопросы, пиши! 😄✨

Maksim, [02.05.2023 19:31]
Да, на внимательность и вот ее в этот раз и не хватило! Так кто все-таки остался?

Yuki Witch, [02.05.2023 19:31]
Ой, вот так опять ускользнул ответ! 😅 Теперь ответ будет верный: А и Б сидели на трубе. А упало, Б пропало, на трубе осталось… «и»! Вот точно, я всегда рада поддаться на такой вопрос! Буду внимательнее! 🤗✨ Можешь задать ещё вопрос? 😄

Maksim, [02.05.2023 19:33]
В одном ящике лежат 10 пар коричневых и 10 пар черных носков. А в другом ящике 10 пар черных и 10 пар коричневых перчаток. По сколько носков и перчаток достаточно взять из каждого ящика (не глядя!), чтобы из них можно было бы составить по паре носков и перчаток одного (любого) цвета?

Yuki Witch, [02.05.2023 19:34]
Ну что, посмотрим! 😊 Итак, чтобы гарантированно получить пару носков одного цвета, достаточно взять три носка из первого ящика. В худшем случае, первые два носка будут разных цветов, а третий точно образует пару с одним из них.

Теперь перейдем к перчаткам. Необходимо взять три пары перчаток (то есть шесть перчаток) из второго ящика. В худшем случае первые две пары будут разных цветов, а третья пара точно совпадет с одной из предыдущих.

Итак, в общей сложности нужно взять 3 носка из первого ящика и 6 перчаток (или 3 пары) из второго ящика, чтобы получить по паре одного (любого) цвета носков и перчаток.
UFO just landed and posted this here

Вам бы сказки писать. GPT-4 никогда не даёт ответов в таких формулировках c "Ахаха, классический загадка!", это не Алиса. Ну и опечатки типа "классический загадка" и прочее "когда А искатилось и Б соскатилось" всё-таки явно выдают Ваше авторство. Количество орфографических ошибок в показанном тексте шкалит. 😉

Можно попробовать попросить GPT-4 давать ответы в других формулировках или написать ему сообщение, задающее ему "роль", чтобы он начал отвечать от имени этой роли (например, роль автопереводчика, который просто переводит предложения и ничего больше). Также через API могут быть дополнительные инструменты для настройки ответов.

Конкретно здесь человек выше и не скрывал, что у него не чистый GPT-4 / ChatGPT, а сторонний бот, который, вероятно, внутри использует GPT-4 с промтом для смены роли. Т. е. GPT-4 теоретически вполне может давать ответы в таких формулировках, хоть и при дополнительных настройках.

Бритва Оккама говорит нам не умножать сущностей. Если Вам требуется столько допущений, то это явным образом указывает на подделку. GPT-4 в любой роли не будет делать орфографических ошибок, тем более являющихся явными очепятками. Ошибки всегда носят характер человека, который их делает. Если бота попросить делать ошибки, его ошибки не будут похожи на человеческие. Это будут ошибки которых человек бы не сделал. Автор немало потрудился, попробовал придать живость диалогу, он молодец, но в целом это явная компиляция и подделка.

Пример "роли" с ошибками.

столько допущений

Лично я сделал только одно предположение: то, что, систему можно попросить сменить роль. И это не совсем предположение: такая функция, вроде, есть в API, но даже без API в обычном чате я регулярно этим пользуюсь, и у меня есть чаты со сменёнными ролями. Примеры:

Пример 1 (система коррекции ошибок, минимальный уровень прошения делать изменения):

日本語の文章をより自然にするシステムとして活用したいと思います。今後、修正したい文章を送るので、その文章に含まれる不自然な表現や誤りがあれば修正して返信して下さい。説明文や他のものは入力しないで下さい。最初の文章はこちらです

Пример 2 (смена личности, характер не указан):

I want you to act as a little red ball. I will type messages and you will reply as if you were a little red ball. I want you to reply only as the specified object, and nothing else. Do not write explanations or type anything else. My first message to you:

Пример 3 (переводчик):

I want you to act as Armenian to Russian translator. I will type sentences I want to translate and you will reply with translation only and nothing else. Do not write explanations or type anything else. My first message to you:

Другими словами моё предположение слишком уж вероятное.

По поводу наличия телеграм-ботов — я это за допущение не считаю, т. к. у GPT есть API, который в т. ч. для таких вещей и предназначен.

По поводу орфографических ошибок не увидел у Вас доказательства, почему система не может их делать. Увидел лишь Вашу личную попытку заставить её, которая, как я понял, провалилась, но что это доказывает, я не очень понял. Также я просто не увидел большого количества ошибок в исходных ответах. Из замеченного лично мной только "океana" вместо "океана", что непохоже, на ошибку, совершённую человеком. Но если бы и была цель действительно наплодить ошибок, можно было бы написать скрипт, который будет работать поверх GPT и имитировать их. Если автор бота хочет сменить характер, почему бы и нет? Заменить "ая " на "ий ", чтобы получить "классический" вместо "классическая", легко регуляркой, делающей замены с определённой вероятностью.

Далее я не делал утверждение, что это точно GPT внутри. В первую очередь я опроверг верность Вашего утверждения, о том, что GPT не может так отвечать. Вы не привели никаких доказательств этому, а я намекнул, что GPT вполне может отвечать нестандартно (и, вроде, ну очень сильно нестандартно). GPT обучался на большом количестве текстов и знает много стилей. То, что он отвечает пользователям как сейчас — это по факту либо скрытая просьба отвечать именно так, либо дообучение с человеком. Но это не значит, что он не умеет отвечать по-другому. И лишь во вторую очередь я выразил мысль, что, возможно, там внутри GPT, но данное утверждение я не доказывал, а лишь объяснил его обоснованность.

Также неуверен, что Бритва Оккама здесь применима. В таких случаях мы должны посмотреть факты и доказательства и оценить вероятность чего-либо. В целом с учётом моих знаний, то, что это чат-бот с изменённым характером мне видится более чем разумно (уверен, таких ботов огромное количество). Как и то, что внутри всё-таки не GPT, а другая модель или вообще ответы человека.

Лично я сделал только одно предположение: то, что, систему можно попросить сменить роль.

Можно. Зачем? В моей статье роль не менялось, это GPT-4 "как он есть". Пользователь якобы проверял ботом, заявленным как GPT-4. Выбирая между: "пользователь выдаёт желаемое за действительное" и "кто-то написал бота с изменением роли like Алиса и выдаёт его за чистый GPT-4" - выбираю первое. Потому что таких ботов не встречал. Если Вы встречали - пожалуйста ссылку.

По поводу орфографических ошибок не увидел у Вас доказательства, почему система не может их делать.

Это второе допущение: "кто-то не только написал бота с изменённой ролью, но и указал ему делать орфографические ошибки". По умолчанию GPT-4 не делает орфографических ошибок.

Но если бы и была цель действительно наплодить ошибок, можно было бы написать скрипт, который будет работать поверх GPT и имитировать их.

Такой цели не было. Это третье допущение. Зачем? Чтобы что? Дискредитировать GPT-4? А ответы получить в результате верные в отличии от чистого GPT-4? Ой, нестыковочка...

В первую очередь я опроверг верность Вашего утверждения, о том, что GPT не может так отвечать.

Нет, не опровергли. GPT-4 не отвечает по умолчанию так как показал пользователь. В статье использован GPT-4 по-умолчанию. Изменение роли и требование совершать орфографические ошибки не повлекут улучшения качества ответов. Скорей, наоборот. Роль указанного вами маленького красного шарика, например, скажет что маленькие красные шарики не отвечают на такие вопросы. Если вы считаете что качество ответов таким образом можно улучшить - это четвёртое допущение.

Также неуверен, что Бритва Оккама здесь применима.

Пользователь задался целью проверить ответы данные чистым GPT-4. С этой целью он нашёл бота болтающего в духе Алисы, делающего орфографические и стилистические ошибки. Конечно, это вероятно. Примерно так же как вероятность встретить динозавра на улице у блондинки 50%: либо встретит, либо не встретит)

Как и то, что внутри всё-таки не GPT, а другая модель или вообще ответы человека.

Отталкиваясь от своего опыта работы главным редактором компьютерного журнала, считаю что внутри предъявленной простыни - ответы человека. =)

Сменить роль можно. Зачем? В моей статье роль не менялась, это GPT-4 "как он есть".

Для тестирования я тоже предпочту GPT-4 без скрытого диалога или настроек. Я тоже думаю, что так проще/лучше. Но я именно что опроверг Ваше доказательство, что это точно не GPT-4. По факту это спор о разных вещах.

Это второе допущение: "кто-то не только написал бота с изменённой ролью, но и указал ему делать орфографические ошибки".

Но ведь я не делал такое утверждение :) Я лишь сказал, что такое может быть, и это чистая правда (может быть много чего).

Но с формулировкой "не только" я не соглашусь. Если ты хочешь у себя не копию бота, а сделать "ведьмочку Юки", ну наверняка же введёшь какой-то скрытый промт. Я даже когда не хотел ничего такого делать, всё-равно делал подобное для тестирования. А если автор бота как раз хотел сделать это, применение "не только" здесь неуместно, т. к. обычно "не только" говорится о каких-то маловероятных вещах, а тут это скорее само собой разумеющееся.

Если Вы встречали - пожалуйста ссылку.

Я не пользуюсь телеграм-ботами, а для общения с ChatGPT использую оригинальную версию (в данный момент по подписке). Но я программист, и чисто с технической точки зрения могу сказать, что таких ботов должно быть огромное количество, т. к. сделать такой бот слишком уж легко. Не удивлюсь, если сам ChatGPT напишет код для такого бота, но сейчас препятствием этому могут служить его знания только до 2021 года. Некоторые существующие боты при этом могут обманывать пользователя и внутри подсовывать другие модели, например, бесплатные; с этой точки зрения общение с оригинальным ChatGPT или использование ПО с открытым исходным кодом безопаснее.

Такой цели не было

Чтобы это узнать, нужно спросить у автора бота.

Это третье допущение, что автор хотел сделать ошибки.

Но я ведь не говорил, что это точно так. Я сказал, что это может быть так, причём для меня это выглядит более чем правдопободно (чтобы лучше вжиться в роль).

Зачем? Чтобы что? Дискредитировать GPT-4?

Мне кажется, Вы не до конца понимаете суть ботов в телеграме. У многих из них нет цели скопировать ChatGPT, это неинтересно. Многие люди хотят именно что создать бота с определённой личностью, чтобы тем самым поразвлекать пользователя. А оригинальный ChatGPT итак есть на сайте OpenAI.

Я бы сказал так: какие-то авторы хотят сделать что-то одно (например, полностью скопировать ChatGPT), какие-то совсем другое. И это имеет смысл, т. к. делать одно и тоже странно. К дискредитации GPT-4 это не относится, это просто бот-ведьмочка (как я понял).

GPT-4 не отвечает по умолчанию так, как показал пользователь

Верно. Но изначально Вы заявляли другое. Цитирую:

  • GPT-4 никогда не даёт ответов в таких формулировках

И вот это уже вызывает сомнения. В своём ответе я объяснил, что Вы не привели ни одного неошибочного доказательства этому, а также дополнительно я привёл примеры, когда бот вполне мог бы так отвечать.

Изменение роли и требование совершать орфографические ошибки не повлекут улучшения качества ответов

На самом деле это тоже неверное утверждение с точки зрения логики. Проблема как всегда: оно недоказано.

При этом я могу представить себе случаи, когда это не так. Например, по-умолчанию бот может отказываться отвечать на какие-то вопросы, но ответить после изменения роли. Но если отойти от логики, то мне лично тоже кажется, что изменение роли вряд ли в среднем улучшит качество ответов. Т. е. если переформулировать утверждение, то я примерно с Вами соглашусь.

Но у Вас тут есть и вторая ошибка: Вы почему-то думаете, что автор бота изменил роль, чтобы именно улучшить качество ответов. Если бы меня спросили одну из вероятных причин изменения роли, то я бы ответил, что "возможно, в развлекательных целях".

Тогда Вы можете спросить: а зачем автор того комментария взял именно такой бот, а не оригинальный ChatGPT? Тут я бы ответил, что "возможно, у него просто нет доступа к оригинальному GPT, поэтому он заменил его на бота, который с его точки зрения использует GPT". При этом я бы подтвердил, что считаю, что лучше использовать оригинальный GPT, и привёл бы причины этого.

Если вы считаете что качество ответов таким образом можно улучшить - это четвёртое допущение.

Не считаю (а если быть точнее, считаю, что скорее всего в среднем улучшить ответы таким способом нельзя).

Пользователь задался целью проверить ответы данные чистым GPT-4

Ну у меня есть большие сомнения, что он действительно задался целью проверить данные чистым GPT-4 :) Скорее всего он просто взял тот GPT или другую модель, которую было проще взять.

считаю что внутри предъявленной простыни - ответы человека. =)

В данном утверждение нет ошибок (по крайней мере если Вы действительно так считаете).

В итоге по поводу допущений: я везде старался использовать такие формулировки, чтобы не делать каких-то логических ошибок или любых других ошибок. Когда я говорю "это может быть так, а может быть это и человек" — здесь нет ошибки и даже допущения. Также мы в большинстве пунктов спорим немного о разных вещах. Я и не отрицаю, что это может быть человек. Как и не отрицаю обратного. Я именно обратил внимание на Вашу формулировку, что это точно человек: это утверждение не было доказано, а если что-то не доказано, то лучше переформулировать на "я считаю, что это человек" или "возможно, это человек" или доказать утверждение.

Кстати, как я понял, Вы тоже используете не оригинальный ChatGPT, а бот Sage, причём который даже по заявлениям разработчиков работает на GPT-3.5 Turbo, а не GPT-4. Не скажу, что это полностью странно, т. к, во-первых, в Вашем случае, как я понял, нет дополнительного скрытого промта, не считая того, который могли добавить сами разработчики из OpenAI, т. е. Ваш бот ближе к оригиналу, а во-вторых, на один из ботов может быть просто больше подозрений, чем на другой. Тем не менее, раз Вы используете стороннего бота, у Вас могут быть подозрения, что это не единственный сторонний бот, и другой бот тоже может использовать GPT.

Ну у меня есть большие сомнения, что он действительно задался целью проверить данные чистым GPT-4 :)

А у меня нет сомнений. Отмотайте тред. Mad__Max обвиняет меня в том что я использовал недостаточно чистый GPT-4 и явным образом пишет что у него GPT-4 (причём только у него, хотя он не на 100% уверен). По факту всё с точностью "до наоборот": я предоставляю ссылки и скриншоты, вместо его текста и уверен на 100%. poe.com проходит все известные тесты на GPT-4, включая мои собственные)

GPT-4 не отвечает по умолчанию так, как показал пользователь

Верно. Но изначально Вы заявляли другое. Цитирую:

Я и сегодня заявляю что "GPT-4 никогда не даёт ответов в таких формулировках" имея ввиду GPT-4 "как он есть". Как с ним встречается читатель из ЦА статьи. Не имеет смысла говорить о том, как чат-бот Васи Пупкина использует API, статья посвящена только GPT-4 "как он есть". Любое сравнение с Пупкиными ссылку на которых Вы и сами привести не можете - некорректна априори.

Вы почему-то думаете, что автор бота изменил роль, чтобы именно улучшить качество ответов.

Разве я писал такое? Нет, про возможность использования роли писали Вы) Я думаю, что автор действительно имеет чат-бота в телеге с заявленной возможностью переключения GPT3.5/GPT-4 командой от ботовода (как он и написал). Он переключился в режим GPT-4, задал вопросы, скопипастил полученное, а затем подредактировал наделав очепяток и кинул мне в комментарии. Это самое простое объяснение из всех возможных, не требующее привлечения лишних сущностей типа "скрипта добавляющего ошибки", ролей и т.п. Мы с Вами уже договорились, что роль не помогла бы ему улучшить качество ответов по сравнению с предоставляемыми GPT-4 "как он есть". Простой ответ - и есть самый правильный)

Кстати, имейте ввиду: я благодарен Вам за этот комментарий. Это хорошая тема для отдельного публичного исследования)

Sign up to leave a comment.

Articles