Sincous Aug 16 at 14:20

Я устроил битву ИИ в игре: GPT-5 против Grok, YandexGPT и GigaChat

Easy

2 min

27K

Artificial Intelligence

Case

Comments 21

dyadyaSerezha Aug 16 at 15:18

Предлагаю новую ролевую игру для ИИ - решить, кто бежит за пивом.

danilovmy Aug 16 at 18:06

@Sincous идея классная, а можно, так сказать, proof. Я имею ввиду репозиторий с кодом, который я смогу запустить и посмотреть за ходом боя самостоятельно? Минимум научиться как api разных моделей использовать.

paulbunkie Aug 16 at 22:40

Сходите на OpenRouter и получите API key. Потом поставьте Cursor, отдайте ему ключ и не отходя от кассы сделайте за пару часов нормальную симуляцию, а не эту дичь с ручным копипастом в разные чаты. Даже в бесплатные лимиты запросто уложиться можно. Заодно и узнаете как работают API нейронок.

paulbunkie Aug 17 at 05:43

Вот вам результат - простой пример на JS, который не требует ничего кроме браузера.
https://github.com/PaulBunkie/game
Только OpenRouter теперь просит 10 баксов депозита на счёт занести чтобы пользоваться бесплатными моделями без серьезных ограничений. Без депозита быстро в rate limit упрётесь. Если денег на эксперименты не жалко, то десяти баксов надолго хватит и на дорогие топовые модели.

arturfather Aug 18 at 04:50

Я думаю чел вручную отправлял запросы к каждой модели

MisterZ Aug 17 at 07:43

Статья не понравилась, потому что пестрит шаблонами, которые скорее вводят в заблуждение, чем объясняют, что-то. Работа LLM - это статистическое сопоставление слов и фраз на основе обучающих данных. Поэтому стратегического мышления, проявления хитрости и т.д. просто не может быть. Сгенерированные ответы на промты это наиболее вероятные сопоставление в пласте используемых для обучения llm данных.

Antibilan Aug 17 at 11:11

Недавно Дудь брал интервью у русского ИТ-шника(назовем его так для простоты). После его объяснения того, как работют llm, я тоже подуспокоился на счет думающего ии. Они только мимикрируют и выглядят как думающие. Главное, чтоб никто не давал на откуп llm таких важных задач.🤷‍♂️

NeoNN Aug 17 at 11:45

Есть гораздо более наглядные (вплоть до визуализации векторных полей) и научные объяснения, например, на 3blue1brown.

snakes_are_long Aug 18 at 22:35

а ещё там же на Ютубе есть более наглядные и научные объяснения тому как думает человек. поищите )

разум человека это такой же "предсказатель следующего токена"

Axelaredz Aug 17 at 12:58

Всё несколько сложнее и проще одновременно, если прям упростить до максимума,
то у них прокачен алгоритм предсказания до 9999+ уровня)

AlexBazarov Aug 19 at 05:43

А с таким высоким уровнем заодно появляется побочный эффект, чем выше уровень, тем сильней побочка)

snakes_are_long Aug 18 at 22:34

оставлю это тут ))

vics001 Aug 17 at 22:20

Работа LLM - это статистическое сопоставление слов и фраз на основе обучающих данных.

Люди скорее всего переоценивают перспективы LLM, но точно переоценивают (стратегического мышления...) мышление среднего человека.

Достаточно привести, факт что статистическая модель, которая училась предсказывать всего лишь следующее слово по отзывам из Амазон (dataset на 20-50М). выработала отдельно специальный нейрон предсказания отзыв будет положительный или отрицательный, хотя никто и не просил ни текст понимать, ни отзывы оценивать ни т.п.. Причем это случилось, только если модель была достаточно "большой" - вопрос размера обучаемой сети.

Так что все формы известные формы мышления, даже самые сложные, это конфигурация нейронной сети и статистическое обучения на данных. Мышление - это патерны и данные.

Sly_tom_cat Aug 17 at 08:39

Мне кажется оставить в середине свободные земли - было бы интереснее, а то тут у диагональных соперников - малые зоны контакта.
А еще лучше как-то закольцевать пространство .... только вот в каком пространстве обеспечить равную протяженность границ между всем участниками .... надо спросить у LLM :)

danilovmy Aug 17 at 14:12

Ну вообще то это все уже реализовано и визуализировано в https://every.to/diplomacy

What is AI Diplomacy? We pitted a dozen AIs against each other in a battle for world domination.
The Players: 18 AI models competing

AI Diplomacy работает похоже с тем как описанно в статье, но там, кмк, более интересно. Игры проводятся регулярно, можно посмотреть записи стримов.

И главное - можно самому попробовать https://github.com/GoodStartLabs/AI_Diplomacy!

paulbunkie Aug 17 at 17:22

Я в демке выше в четырёх центральных клетках разместил ресурсы, иначе неонки топтались на месте.

fermentum Aug 17 at 13:18

А где сама статья? На пикабу?

allent-audit Aug 18 at 05:30

Очень показательный кейс 👏
Даже в простой модели видно, что ИИ склонны формировать альянсы и договариваться. По сути, мы уже видим зачатки того, что в будущем такие системы будут работать не поодиночке, а в формате команд ИИ-агентов: одни будут сильнее в дипломатии, другие в расчётах или тактике.
Вероятно, именно такие коалиции искусственных интеллектов станут нормой и это уже не фантастика, а первые шаги.

shellenberg Aug 18 at 17:24

... к Скайнет

Cheater121 Aug 18 at 11:39

Совершенно не технарский подход к уровню статьи, не по хабровски, как мне кажется. Плюс эти ссылки на ютуб, тг, они и есть цель статьи? Засаморекламиться?

Oberhort Aug 22 at 17:33

Забавно. Три иноземных ИИ напали именно на русский.