Comments 21
Предлагаю новую ролевую игру для ИИ - решить, кто бежит за пивом.
Сходите на OpenRouter и получите API key. Потом поставьте Cursor, отдайте ему ключ и не отходя от кассы сделайте за пару часов нормальную симуляцию, а не эту дичь с ручным копипастом в разные чаты. Даже в бесплатные лимиты запросто уложиться можно. Заодно и узнаете как работают API нейронок.

Вот вам результат - простой пример на JS, который не требует ничего кроме браузера.
https://github.com/PaulBunkie/game
Только OpenRouter теперь просит 10 баксов депозита на счёт занести чтобы пользоваться бесплатными моделями без серьезных ограничений. Без депозита быстро в rate limit упрётесь. Если денег на эксперименты не жалко, то десяти баксов надолго хватит и на дорогие топовые модели.
Я думаю чел вручную отправлял запросы к каждой модели
Статья не понравилась, потому что пестрит шаблонами, которые скорее вводят в заблуждение, чем объясняют, что-то. Работа LLM - это статистическое сопоставление слов и фраз на основе обучающих данных. Поэтому стратегического мышления, проявления хитрости и т.д. просто не может быть. Сгенерированные ответы на промты это наиболее вероятные сопоставление в пласте используемых для обучения llm данных.
Недавно Дудь брал интервью у русского ИТ-шника(назовем его так для простоты). После его объяснения того, как работют llm, я тоже подуспокоился на счет думающего ии. Они только мимикрируют и выглядят как думающие. Главное, чтоб никто не давал на откуп llm таких важных задач.🤷♂️
Есть гораздо более наглядные (вплоть до визуализации векторных полей) и научные объяснения, например, на 3blue1brown.
Всё несколько сложнее и проще одновременно, если прям упростить до максимума,
то у них прокачен алгоритм предсказания до 9999+ уровня)

оставлю это тут ))
Работа LLM - это статистическое сопоставление слов и фраз на основе обучающих данных.
Люди скорее всего переоценивают перспективы LLM, но точно переоценивают (стратегического мышления...) мышление среднего человека.
Достаточно привести, факт что статистическая модель, которая училась предсказывать всего лишь следующее слово по отзывам из Амазон (dataset на 20-50М). выработала отдельно специальный нейрон предсказания отзыв будет положительный или отрицательный, хотя никто и не просил ни текст понимать, ни отзывы оценивать ни т.п.. Причем это случилось, только если модель была достаточно "большой" - вопрос размера обучаемой сети.
Так что все формы известные формы мышления, даже самые сложные, это конфигурация нейронной сети и статистическое обучения на данных. Мышление - это патерны и данные.
Мне кажется оставить в середине свободные земли - было бы интереснее, а то тут у диагональных соперников - малые зоны контакта.
А еще лучше как-то закольцевать пространство .... только вот в каком пространстве обеспечить равную протяженность границ между всем участниками .... надо спросить у LLM :)
Ну вообще то это все уже реализовано и визуализировано в https://every.to/diplomacy
What is AI Diplomacy? We pitted a dozen AIs against each other in a battle for world domination.
The Players: 18 AI models competing
AI Diplomacy работает похоже с тем как описанно в статье, но там, кмк, более интересно. Игры проводятся регулярно, можно посмотреть записи стримов.
И главное - можно самому попробовать https://github.com/GoodStartLabs/AI_Diplomacy!
Я в демке выше в четырёх центральных клетках разместил ресурсы, иначе неонки топтались на месте.
А где сама статья? На пикабу?
Очень показательный кейс 👏
Даже в простой модели видно, что ИИ склонны формировать альянсы и договариваться. По сути, мы уже видим зачатки того, что в будущем такие системы будут работать не поодиночке, а в формате команд ИИ-агентов: одни будут сильнее в дипломатии, другие в расчётах или тактике.
Вероятно, именно такие коалиции искусственных интеллектов станут нормой и это уже не фантастика, а первые шаги.
Совершенно не технарский подход к уровню статьи, не по хабровски, как мне кажется. Плюс эти ссылки на ютуб, тг, они и есть цель статьи? Засаморекламиться?
Забавно. Три иноземных ИИ напали именно на русский.
Я устроил битву ИИ в игре: GPT-5 против Grok, YandexGPT и GigaChat