Как стать автором
Обновить

Комментарии 24

Они не только не умеют считать буквы, они действительно не знают, из каких букв состоит слово. Попросил LLM объяснить, как запомнить ключ -n для указания схемы утилите pg_dump.

Ответ удивил

Это просто "великое сдвижение букв" m - n в саксонских языках. Лингвисты об этом знают.

(Шутка).

Так ведь каждой задаче - свой инструмент. С тем же успехом можно взять образец ДНК неведомой прыгающей твари, чтобы после обработки его в секвенаторе с вероятностью 70% заявить, что это лягушка. Или просто посмотреть на строение твари.

Другими словами, ИИ понимает, что есть токены «straw» и «berry», которые вместе составляют «strawberry», но модель не знает, что это слово состоит из букв «s», «t», «r», «a», «w», «b», «e», «r», «r» и «y», и они располагаются именно в таком порядке. 

Это не доказывает факт, что модель по исходному запросу понимает, что слово состоит их каких-то там букв и что нужно считать количество нужных букв в слове.

Даже если дать модели инструкцию разбивать слова на отдельные буквы и считать их, она использует эту информацию как дополнительные контекст для генерации ответа. Честный подсчётом букв это всё равно тяжело назвать.

Ребёнок, который уже умеет говорить, но ещё не умеет писать и читать тоже не решит эту задачу, а мы знаем из каких букв состоят слова тоже знаем как дополнительный контекст - в уме по буквам будем произносить слово и считать.

Достаточно добавить "think step by step" в конец промпта и LLM выдаст правильный результат. Большие языковые модели думают "вслух", поэтому всегда лучше давать им пространство для размышлений.

И действительно, спросил Claude 3.5 Sonnet:

Скрытый текст

how many "r" letter are there in "strawberry" word?think step by step

Certainly! Let's think through this step by step:

  1. First, let's write out the word "strawberry": strawberry

  2. Now, let's go through the word letter by letter and count the "r" occurrences: s - not an "r" t - not an "r" r - this is our first "r" (count: 1) a - not an "r" w - not an "r" b - not an "r" e - not an "r" r - this is our second "r" (count: 2) r - this is our third "r" (count: 3) y - not an "r"

  3. After going through all the letters, we can conclude:

There are 3 "r" letters in the word "strawberry".

To verify this, we can also use a simple Python script:

word = "strawberry"
r_count = word.count("r")
print(f"The number of 'r' letters in '{word}' is: {r_count}")

count_r.py

This script would output: "The number of 'r' letters in 'strawberry' is: 3"

So, our manual count is correct. There are indeed 3 "r" letters in the word "strawberry".

До того, как увидел ваш вариант - придумал свой: Попросил чатгпт писать слово strawberry, считать буквы r, а затем проверять себя) Тоже правильный ответ выходит.

трансформатора

или

трансформера

Вообще это старая история уже. И есть теория, что OpenAI поэтому и назвали свою новую модель Strawberry - ирония + шаг вперед.

У меня тоже сначала двесосчитал. И даже стал расскладывать мне буквы по позициям.
И 8-ю сосчитал, а 9-ю - нет.
Указал на ошибку - исправился.
Но неприятно, конечно.

Но что еще характерно.
Вот диалог:

which kind of transformation represented matrix with columns 0, 1 and 1, 0

ChatGPT said:

ChatGPT

The matrix with columns (01)(01)(01​) and (10)(10)(10​), written as:

A=(0110)\mathbf{A} = (0110)A=(01​10​)

represents a reflection transformation across the line y=xy = xy=x in a 2D Cartesian coordinate system.

Explanation:

  • The first column, (01)(01)(01​), indicates that the transformation maps the standard basis vector e1=(10)\mathbf{e}_1 = (10)e1​=(10​) to e2=(01)\mathbf{e}_2 = (01)e2​=(01​).

  • The second column, (10)(10)(10​), indicates that the transformation maps the standard basis vector e2=(01)\mathbf{e}_2 = (01)e2​=(01​) to e1=(10)\mathbf{e}_1 = (10)e1​=(10​).

This swapping of coordinates corresponds to reflecting any point across the line where x=yx = yx=y. So, for any vector (xy)(xy)(xy​), the transformation by this matrix would result in (yx)(yx)(yx​).

Но в диалоге на русском он сначала ответил, что эта матрица поворачивает на 90 град, но когда я указал ему на ошибку - исправился.
Но он сначала взял в пример вектор (0, 1) поэтому у него вышел поворот и он обобщил этот случай.

Но что еще характерно.
Вот диалог:

which kind of transformation represented matrix with columns 0, 1 and 1, 0

ChatGPT said:

ChatGPT

The matrix with columns (01)(01)(01​) and (10)(10)(10​), written as:

A=(0110)\mathbf{A} = (0110)A=(01​10​)

represents a reflection transformation across the line y=xy = xy=x in a 2D Cartesian coordinate system.

Explanation:

  • The first column, (01)(01)(01​), indicates that the transformation maps the standard basis vector e1=(10)\mathbf{e}_1 = (10)e1​=(10​) to e2=(01)\mathbf{e}_2 = (01)e2​=(01​).

  • The second column, (10)(10)(10​), indicates that the transformation maps the standard basis vector e2=(01)\mathbf{e}_2 = (01)e2​=(01​) to e1=(10)\mathbf{e}_1 = (10)e1​=(10​).

This swapping of coordinates corresponds to reflecting any point across the line where x=yx = yx=y. So, for any vector (xy)(xy)(xy​), the transformation by this matrix would result in (yx)(yx)(yx​).

Но в диалоге на русском он сначала ответил, что ээта матрица поворачивает на 90 град, но когда я указал ему на ошибку - исправился.
Но он сначала взял в пример вектор (0, 1) поэтому у него вышел поворот и он обощил этот случай.

Примечательно, что жпт добавляет мозго ... эээ .... вразумительный комментарий, почему именно две буквы "r" "in reality". Яркий пример результата обучения на массиве "исключительности".

Google Advanced:

В слове "рентгеноэлектрокардиографический" 3 буквы "а".

Любопытно. Мне удалось убедить gwen2, что буквы r три, а вот gemini 1.5 со мной не согласилась, при том выдала занимательное:

S - одна буква

T - одна буква

R - одна буква

A - одна буква

W - одна буква

B - одна буква

E - одна буква

R - вторая буква r

R - третья буква r (нет)

Y - одна буква

Как видите, в слове strawberry есть две буквы r.

Но не объяснила, почему посчитала третью букву и при этом отказалась от нее сразу же.

Нормально они все понимают, если иную терминологию избрать. Если спросить, сколько раз символ "r" встречается в слове "strawberry" - то, по крайней мере, чат гпт нормально считает.

Ох, сколько ещё открытий чудных предстоит узнать таким исследователям).

Потом вообще выяснится что нейросети, оказывается, просто предсказывают следующий токен исходя из контекста и не могут определить и проверить факт или научиться навыку.

Хз, зашёл в первую попавшуюся нейросеть и..

Иван

сколько букв r в слове strawberry?

Personal robot

with a soft smile, maria answers. There are three letters 'r' in the word'strawberry'. Is there anything else you would like to know?

DeepSeek врывается в чат:

В слове "strawberry" на английском языке две буквы "r".

Эти горе иследователи не понимают что такое ЛЛМы и используют шокирующие заголовки, чтобы выудить внимание.

Тут ещё, я думаю, большая проблема в том, что отсутствует возможность использовать пользователей того же чата-гпт, как "супервизоров" модели. Например, если модель ошибается, пользователь её исправляет и просит запомнить результат. Затем этот чат отправляется модераторам с согласия пользователя, которые перепроверяют исправленный пользователем ответ, и, если он верный, то это новое "знание" используется для обучения модели.

А то получается, в модель загрузили один раз данные и все, дальше она никак не развивается и не учится до момента загрузки новых данных.

Естественно, этим самым модератором может стать поисковик гугл, а не реальный человек, ведь чат-гпт может выходить в интернет.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Другие новости

Истории