Как стать автором
Поиск
Написать публикацию
Обновить

Тестируем YandexGPT-5-Pro. Когда хотелось быть ChatGPT, но в душе всё ещё Алиса

Уровень сложностиСредний
Время на прочтение14 мин
Количество просмотров28K
Всего голосов 17: ↑16 и ↓1+16
Комментарии15

Комментарии 15

Зрение еще надо было проверить, те же задачи по математике, и вообще все школьные, прилетают в гопоту в виде фотографий коленок школьниц.

И тут в лужу садится еще и дипсик, у него со зрением не очень. Нормальное зрение (русские буквы под любым углом и с низким качеством) есть у чатгпт и джемини, и возможно еще у клода.

Так дипсик только OCR получает

Лично меня смущает непонятность того как и где это все пробовать. Это раскатано на умные колонки? А будет? У меня пять колонок дома, вроде все в интернете, но они как были глупыми алисами так и остаются, в картах не вижу, в навигаторе не вижу, это все для чего вообще, просто через сайт какие-то вопросы задавать?

да. да. оформил подписку. колонки как купили так и тупят. отключил подписку

Да, раскатали, но нужно включать. Разница огромная, стало намного лучше. Она всё равно тупее топовых моделей, но пользователям колонок должно стать комфортнее, чем было.

Я бы сказал, что она не то что тупее топовых моделей, но и даже тупее локально развернутого дикпика 7b. Я уже пробовал и подписку про подкидывать, но кроме включения лампочки она ничего не умеет. Понял, что вещь бесполезная в качестве ИИ помощника. С подпиской ПРО может ответить на вопросы из разряда: сколько грамм муки в 300мл стакане или рассказать разницу круглым и длиннозерным рисом. Во всех остальных случаях - это обычный поисковик, который берет рандомный сайт по запросу и цитирует несколько строчек с него. Я даже пытался с ней в диалоги, но спустя два запроса - она забывает о чем речь и начинает рассказывать как в первый раз. Она даже не может совершить два действия с лампочкой в рамках одного запроса "Алиса, яркость лампочки в детской на 50%, цвет огненно-белый...". После этого она выключает включенную лампочку и спрашивает "Вы хотите включить лампочку в детской?".
В общем, глупее модели я не видел и сомневаюсь, что она раскатана на колонки с про подпиской. Такое ощущение, что на колонке моделька 2018 года, только раньше она хотя бы с детьми диалог могла вести, а теперь может резко перестать слушать ответ ребенка и лежать показывать время.

НЛО прилетело и опубликовало эту надпись здесь

Сейчас уже следует сравнивать с o1/o3-mini. 4o не актуален уже пол года как

Для основного сравнения специально брал лишь нерассуждающие модели, так как рассуждающие (o1, o3-mini, DeepSeek-r1, Claude-3.7-Sonnet-Thinking и т. д.) действуют по другим принципам.

Хотелось бы подробнее остановиться на размере диалогового окна, так как этот фактор более значимый, чем кому-то может показаться.

Разрыв объект токенов в три раза — это невероятно много. А GPT, к тому же, может читать ваши файлы, не забивая это окно полученной информацией(в отличие от того же Deepseek).

Некоторые могут сказать "да какая разница, сколько там токенов? Я просто пишу в новом окне каждый раз".

Но есть огромная разница между ответам ИИ, которому вы написали впервые и ИИ, с которым вы, к примеру, уже общаетесь пару недель на разные темы и с разными задачами.

Особенно это важно для тех пользователей, которые используют помощь ИИ, как психологическую поддержку или просто для длительного общения.

У OpenAI для этого есть возможность экспорта файлов диалога — прочитав их, ваш ИИ записывает информацию в долговременную память(не забивая диалоговое окно, опять же) , сохраняя свою личность, как собеседника.

А GPT, к тому же, может читать ваши файлы, не забивая это окно полученной информацией

Не понял. Полученные им файлы не учитываются в размере диалогового окна?

У OpenAI для этого есть возможность экспорта файлов диалога — прочитав их, ваш ИИ записывает информацию в долговременную память(не забивая диалоговое окно, опять же) , сохраняя свою личность, как собеседника.

Тоже не понял. Расскажите что это и как сделать.

В первом задании у яндекса заголовки никакие, вообще не цепляют. А контент-план и список тем для публикаций - вообще разные вещи.

Наверно, надо условие "Разность второй и третьей цифр равна первой цифре" заменить на "Разность третьей и второй цифры равна первой цифре" тогда задача удовлетворит решению - 2574

Интересно, скинул задачку про код Гроку, и в обычном режиме он ушёл в бесконечный цикл с проверкой каких-то взятых от балды вариантов, а в режиме «подумоть» быстренько решил всё.

Ответ Грока

Для того чтобы открыть дверь в секретную лабораторию, нужно определить четырёхзначный код, который удовлетворяет всем заданным условиям. Давайте разберёмся шаг за шагом.

Код представим как число ABCD, где A, B, C, D — цифры от 0 до 9, причём все они различны, а A ≠ 0, так как это четырёхзначное число. Таким образом:

  • A ∈ {1, 2, ..., 9},

  • B, C, D ∈ {0, 1, ..., 9},

  • A, B, C, D — все разные.

Число ABCD в десятичной записи выражается как:

ABCD = 1000A + 100B + 10C + D

Теперь рассмотрим каждое условие.

Условие 1: Если поменять местами первую и последнюю цифры, число увеличится на 1998

Если поменять A и D местами, новое число будет DBCA, то есть:

DBCA = 1000D + 100B + 10C + A

Согласно условию:

DBCA = ABCD + 1998

Подставляем выражения:

1000D + 100B + 10C + A = 1000A + 100B + 10C + D + 1998

Упростим, вычтя 100B и 10C с обеих сторон:

1000D + A = 1000A + D + 1998

Перенесём все члены в одну сторону:

1000D + A - 1000A - D = 1998

1000D - D - 1000A + A = 1998

999D - 999A = 1998

Выносим 999 за скобки:

999(D - A) = 1998

Делим обе части на 999:

D - A = \frac{1998}{999}

Так как 1998 = 999 × 2, то:

D - A = 2

Следовательно:

D = A + 2

Поскольку A и D — цифры, и D ≤ 9, то A + 2 ≤ 9, значит A ≤ 7. Учитывая, что A ≥ 1, получаем:

  • A ∈ {1, 2, 3, 4, 5, 6, 7},

  • D ∈ {3, 4, 5, 6, 7, 8, 9},

  • D = A + 2,

  • A ≠ D (что уже выполняется, так как D > A).

Условие 2: Сумма первой и третьей цифры равна сумме второй и четвёртой цифр

Первая цифра — A, третья — C, вторая — B, четвёртая — D. Условие:

A + C = B + D

Подставим D = A + 2:

A + C = B + (A + 2)

Упростим:

A + C = B + A + 2

Вычтем A из обеих сторон:

C = B + 2

Итак:

C = B + 2

Поскольку B и C — цифры:

  • B ∈ {0, 1, ..., 9},

  • C ≤ 9,

  • C = B + 2 ≤ 9,

  • B ≤ 7.

Таким образом:

  • B ∈ {0, 1, 2, 3, 4, 5, 6, 7},

  • C ∈ {2, 3, 4, 5, 6, 7, 8, 9},

  • C ≠ B (выполняется, так как C > B).

Условие 3: Разность второй и третьей цифр равна первой цифре

Вторая цифра — B, третья — C, первая — A. В русском языке "разность второй и третьей цифр" обычно означает B - C, но поскольку она равна A, а A > 0, это может вызвать затруднение, если C > B. Рассмотрим возможные интерпретации.

Предположим сначала:

B - C = A

Подставим C = B + 2:

B - (B + 2) = A

B - B - 2 = A

-2 = A

Это невозможно, так как A ≥ 1. Значит, интерпретация B - C = A неверна.

Теперь предположим, что имеется в виду обратная разность, то есть:

C - B = A

Подставим C = B + 2:

(B + 2) - B = A

2 = A

A = 2

Это возможно, так как A = 2 ∈ {1, 2, ..., 7}. Хотя "разность второй и третьей цифр" обычно означает B - C, в контексте задачи, где разность равна положительной первой цифре, логично принять C - B = A. Проверим эту гипотезу дальше.

Если A = 2, то:

D = A + 2 = 2 + 2 = 4

Условие 4: Сумма всех цифр кода — 18

A + B + C + D = 18

Подставим A = 2, D = 4, C = B + 2:

2 + B + (B + 2) + 4 = 18

2 + B + B + 2 + 4 = 18

2B + 8 = 18

2B = 10

B = 5

Тогда:

C = B + 2 = 5 + 2 = 7

Итак, код: A = 2, B = 5, C = 7, D = 4, то есть число 2574.

Проверим, все ли цифры различны:

  • 2, 5, 7, 4 — все разные.

Проверка всех условий

  1. Поменять первую и последнюю цифры:

    • Исходное число: 2574,

    • Новое число: 4572,

    • 4572 - 2574 = 1998 — верно.

  2. Сумма первой и третьей равна сумме второй и четвёртой:

    • A + C = 2 + 7 = 9,

    • B + D = 5 + 4 = 9 — верно.

  3. Разность второй и третьей цифр равна первой:

    • Если B - C = A: 5 - 7 = -2 ≠ 2 — не подходит,

    • Если C - B = A: 7 - 5 = 2 = A — подходит.

    Учитывая, что A положительно, C - B = A более логично в данном контексте.

  4. Сумма всех цифр:

    • 2 + 5 + 7 + 4 = 18 — верно.

Все условия выполнены при интерпретации третьего условия как C - B = A.

Вывод

Код, открывающий дверь в лабораторию, — это 2574.

Ну, и заголовки про кофе, чтобы дважды не вставать:

Скрытый текст
  1. "Кофе и технологии: как кофеварки изменили нашу жизнь"

  2. "От гейзера к ИИ: эволюция кофеварок в XXI веке"

  3. "Умные чашки: будущее кофепития уже здесь"

  4. "Экология и кофе: технологии на страже природы"

  5. "Капсулы, вайфай и кастомизация: новая эра кофеварок"

  6. "Искусство утра: как кофеварки стали бариста в вашем доме"

  7. "Кофе 2.0: когда технологии встречаются с традицией"

  8. "Перемолоть и взбить: умные гаджеты для кофейных гурманов"

  9. "Зелёный тренд: кофеварки на пути к устойчивому будущему"

  10. "Будильник выключен — капучино готов: кофеварки завтрашнего дня"

Кстати, а почему они все их генерируют исключительно в формате «ХХХ: YYY»? Вроде, в ТЗ ничего такого не указано.

В тесте на рерайт YandexGPT превратила "дизайнеров, работающих из дома" в "домашних дизайнеров" - весьма вольная интерпретация ))

Зарегистрируйтесь на Хабре, чтобы оставить комментарий