Comments 39
Что за Big Blue такой, который победил Каспарова?
Ну конечно это Deep Blue
https://habr.com/ru/articles/241531/
Действительно Deep Blue, не уследил за автокорректом
А то, что Gemini - это и есть продукт топовых программистов - разве противоречия не вызывает? А в самой статье так и вообще речь о студентах и олимпиадных задачах. То есть тех задачах, решение которых известно заранее их составителям.
Ещё в 90х, написал на бейсике крестики-нолики, которые невозможно было выиграть (Можно было либо в ничью сыграть, либо проиграть). И задался вопросом, умнее ли я этой программы.
Есть такое когнитивное искажение - «предвзятость подтверждения» или в народе «натянуть сову на глобус». Вот тут оно во всей красе
Студенты-олимпиадники - не то же самое, что топовые программисты мира.
Потом, обычно в каждом туре Олимпиады сразу даётся по несколько задачек. Есть вероятность, что команды и не особо-то пытались решить эту конкретную задачу, сразу оценив ее как наиболее трудоёмкую, и бросив все свои силы на другие задачи тура.
Наконец, LLM эти как раз и натренированы на решение олимпиадных задач, поэтому тут особо нечему удивляться. Нюанс в том, что условие подобной задачки очень точно сформулировано и помещается в относительно маленькое контекстное окно, и нейросети не надо анализировать местами противоречивую документацию или тонны легаси кода, как в реальных проектах.
Ну нельзя писать такие статьи, не приводя какие собственно были задачи... а судя по описанию решений - AI выигрывает просто за счет скорости перебора подходов...
Конечно, нельзя. Приходится дополнять в комментариях: https://worldfinals.icpc.global/problems/2025/finals/problems/problemset.pdf
Отключите этим ИИ интернет - и ничего они решить не смогут. С интернетом любой дурак решит
А кто сказал что они использовали интернет?
А что они использовали при обучении? Книжки из библиотеки?
При обучении != Использовали при решении.
Вы когда книжки читаете, у вас складывается некое понимание, тут тоже самое. Невозможно в 230 гигабайт сжать без потерь весь текст интернета, а тем более в модели меньшего размера, например 32-64 ГБ соответственно и об "использовании интернета" не может быть и речи. Давно доказано, что это не тупое запоминание, а там действительно выстраивается подобие калькулятора при получении задачи на простое сложение/умножение. А вот когда получают 20-значные цифры, активируется другой блок отвечающий за "примерный" подсчет и додумывание оставшегося. Так например могут совпадать последние 5 цифр, т.к. они были честно посчитаны этим внутренним калькулятором, а все первые - выдуманы.
Там действительно сохраняется ряд фактов. Чем больше нейросеть тем большую "библиотеку фактов" она имеет, остальное выводится во время ризонинга и генерации токенов ответа.
А при чем тут обучение? "отключите этим ИИ интернет" - и они продолжат работать ровно также как и работали до этого.
Если вам отключить интернет, вы же не забудете всё что видели в интернете до этого?)
Можно полноценно скачать ИИ на носитель достаточного объёма и в таком случае перебои и интернетом им не будут страшны. Для обычной работы ИИ простому пользователю нужен интернет, потому что он посылает запросы на сервер, где находится языковая модель.
Отключите интернет при обучении.
Вы просто не понимаете как это работает. Сначала разберитесь в теме на достаточном уровне. Если честно ваши замечания выглядят смешно для того кто хоть немного понимает о чем речь и зашёл дальше научно-популярных статей и провокационных новостей из ленты. И тем более смешно они выглядят для профессионалов.
Я не понял, а как ИИ решал? Ему на вход дали условие задачи, и он полчаса корпел над решением, повесив курсор в окне вывода, и потом выдал решение? Или полчаса оператор (программист, участник олимпиады, представитель гугла - кто там работал с сеткой) корректировал данные? И как вообще происходил процесс? Знал ли оператор решение задачи заранее?
Короче, одни вопросы…
Представители OpenAI написали пост в твиттере:
"Мы официально участвовали в очном AI-треке ICPC с тем же лимитом времени — 5 часов на решение всех двенадцати задач, отправляя решения в локальную систему ICPC World Finals Judge. Они оценивались идентично и одновременно с решениями участников мирового чемпионата ICPC. Мы получили задачи в точно таком же PDF-виде, и система рассуждений самостоятельно выбирала, какие ответы отправлять — без какой-либо специальной надстройки или ручных корректировок во время выполнения"
При этом известно ещё и то, что Gemini 2.5 Deep Think стартовала на 10 минут позднее, чем участники-студенты: https://www.notebookcheck.net/Gemini-2-5-Deep-Think-achieves-gold-medal-level-at-ICPC-2025.1122767.0.html
Больше никакой открытой информации не нашлось. Но не думаю, что оператор корректировал данные, скорее всего, машина сама перебирала варианты, пока не нашла решение проблемы.
прекрасно, заголовок "не осилили топовые программисты мира" а в статье про студентов
Ваша правда, исправил. Постараюсь вкладывать меньше эмоций в заголовки )
Да можно было написать про топовых олимпиадников, все таки это олимпиада действительно высокого уровня.
Топовые олимпиадники - настоящие монстры. Смотрел как то запись такой олимпиады. Чувак параллельно думает над несколькими задачами, решая и переключаясь между ними. Если не получилось, переключается на другую, а над первой в фоне подсознание думает, или осознанно.
Не сильно честное соревнование. Такого рода задачи точно были в обучающем материале, агенту нужно было только подшаманить решение.
Пока если агент решает реальную задачу кодинга, даже простые задачи он решает так себе, часто переусложняет.
У олимпиадников тоже были такого рода задачи в "обучающей выборке". Никто же не говорит ничего, когда олимпиадник прошедший тонну олимпиад выигрывает очередную подряд? Все говорят какой он молодец и какой целеустремлённый, при этом забывая, что олимпиадное программирование имеет мало общего с программированием, которое приносит ценность бизнеса, а человеку ещё и трудно/долго переучиваться. Далеко не каждый олимпиадник сможет быть качественным джун-специалистом в команде. Большинство из них слабо-коммуникативны, и целеустремленность им только мешать будете когда их неизменно начнут тыкать носом в ошибки, что выльется в споры, недомолвки и обиды.
При этом что gemini, что gpt хоть и были обучены "на всем интернете", не являются специально заточенными и даже хоть немного дообученными моделями конкретно под олимпиады. То есть их решения могут как приносить пользу бизнеса, так и разного рода академиям, решая олимпиады и просто сложные задачи на фронте математики.
Я не говорю, что всех надо заменить на LLM, наоборот, это просто продвинутый инструмент, который помимо хороших алгоритмических решений может быть хорошим подспорьем для программиста. И к сожалению если сейчас встаёт выбор, взять и обучить джуна, который уйдет через год с повышением в другую компанию, и подпиской на LLM, многие выбирают последнее. Это серьезная болезнь индустрии, на мой взгляд.
Я не очень понял причем тут программисты. Программисты не смогли написать программу или не смогли решить задачу? Если вопрос в решении задачи, то это не работа программиста. Это все-равно что обвинять программистов в неправильном диагнозе при лечении больного.
Мне не совсем понятен смысл термина AGI. Назовите мне хоть один класс задач, с которыми современный AI справлялся бы хуже среднего человека?
Забить гвоздь в стену
Недооцениваете вы современных роботов...
Впрочем, из 3-й буковки в AGI явствует, что речь идёт о задачах интеллектуальных - о чём мне, конечно, следовало уточнить ;)
А вы думаете, это — просто?
Одно дело это специализированный робот, а другое, когда это робот общего характера, который и за продуктами сходит, и квартиру уберет и ребенка убаюкает. Да он может это сделает все не слишком хорошо, не как профессионалы, но в среднем будет неплохо на любой задаче - вот это AGI.
При этом забавно, что люди не умеют делать вообще всё, нам нужно время на обучение, привыкание, а от роботов и на дуде сыграть, и нефть найти, и на луну полететь. Специализированные роботы при этом лучше. AGI возможно хорош как просто галочка, мол вот достигли, теперь легче будет строить специализированных роботов, т.к. у AGI хорошая база во всех направлениях - дообучать будет легче.
Есть ещё термин ASI - Artificial SuperIntelligence - интеллект, во всем превосходящий человека. То есть какую бы задачу ни дай, все сделает лучше любого лучшего специалиста. Звучит как невозможная мечта.
Пожалуйста, не используйте хаб Habr для статей не о Хабре.
Это не конец программирования, это начало нового уровня. Как калькулятор не убил математику, так и ИИ не убьёт код!
Gemini за полчаса решила то, что не осилили топовые студенты-программисты на олимпиаде