Комментарии 23
Приходит девушка устраиваться на работу секретаршей. Шеф спрашивает " Ас какой скоростью вы можете печатать на машинке? "Девушка " Ну... 100500 знаков в минуту.... " Шеф: " Разве можно с такой скоростью печатать?!!" Девушка: " Печатать-то можно, но такая херня получается!!!! "
Модель обучали на решениях онлайн-этапов прошлых лет
Интересно, а если олимпиадник даст своё уникальное, элегантное решение, то YandexGPT посчитает его ошибочным?
Вот представьте: нейросеть научили только сортировке пузырьком. Человек пишет алгоритм быстрой сортировки, который имеет лучший Big O. Но нейросеть говорит, что это неверно, т.к. она знает только пузырёк.
Апелляция, перепроверка.
Так можно сразу все работы оценивать нулем и проверять только те, что пошли на апелляцию, мол, раз спорит, значит знает
Только это сроки проверки, скорее всего, увеличит
Очевидно, тогда все, кто хоть сколько-нибудь заинтересованы в результате, будут подавать апелляцию. Это только увеличит общее время проверки, так как апелляция требует больше времени, чем первичная проверка
Это просто маркетинг, ничего более. Что то там может быть и проверяют нейронкой, но блин… нейронка_не_может_с_первого_раза посчитать количество символов в строке, игнорирует нижние подчеркивания. Я буквально с этим столкнулся на этой неделе. Copilot от микрософта. Уже не говорю о реально творческих вещах. Попросите нейронку сгенерировать последовательность аккордов в любой тональности и сделать в ней модуляцию или отклонение в рамках классической гармонии с ее строгими правилами. Хорошо если получится джаз. Обычно выходит какой то авангард. Они фантазируют даже когда спрашиваешь казалось бы простые штуки в том в чем они шарят по заявлению маркетологов. Это я про программирование. Я юзаю copilot как справочник по языкам - плюсы и питон(в данный момент основной стек). У меня опыт уже больше четверти века и то там ка про минному полю хожу. А тут нейронка от Яндекса, явного аутсайдера гонки ИИ хотя бы по причине более скромных бюджетов, будет как то судить олимпиадные задачи. Это похоже больше на то, что Яндекс пытается бороться за рынок внутри страны которая по известным причинам оказалась слегка в затруднительном положении в этих технологиях.
Все гораздо хуже. Человек оценивает творческие работы по формальным критериям. А нейросеть - не по формальным.
Количество апелляций осталось на уровне прошлого года
Конечно осталось, потому что они опубликовали что проверяет ИИ только после апелляций.
Как человек, неоднократно участвовавший в олимпиадной движухе и как ученик, и как преподаватель, могу сказать - имхо, в среднем кол-во апелляций не меняется совсем. Потому что апелляциями занимается небольшой процент участвующих, которому не совсем все равно и которые готовы потратить на это время (отдельный вопрос - зачем? поэтому мотивация для апелляции должна быть велика).
Более того, организаторы (сюрприз!) не любят править баллы, поэтому апелляции чаще всего заканчиваются ничем и все это знают. У меня есть пара феерических историй 2000-х годов:
В 10-м классе - физическая задача в духе "бесконечная цепь падает с бесконечного стола, найти установившуюся скорость падения". Задачу не решил никто, апелляция ничего не дала "тут все понятно"
Там же (9, 10 или 11 класс), информатика - "запрограммировать ход пешки". Особо умные люди учли, что короля есть нельзя и добавили это в программу. Сюрприз: тесты построены так, что после 2-го пешка постоянно ест короля. Апелляция ничего не выявила: "Нигде в задаче не сказано, что короля есть нельзя" (т.е. пользование здравым смыслом наказывается).
У меня веселей случай был. Вопрос был чисто терминологический, я написал определение почти точно совпадающее с энциклопедическим словарем по предмету. Получил ноль за вопрос, приношу на апелляцию словарь, показываю определение. Пожилой преподаватель открывает список авторов, смотрит и выдает "Я не знаю автора который писал статьи по этому разделу, для меня эта книга не авторитет".
Какой хоть вопрос был? А то существуют области где до сих пор нет устоявшегося мнения, например определение интеллекта.
Олимпиадник порылся в Википедии и создал свое понимание. А Нейросеть может делать это в сотни раз эффективнее. Только и всего. Оригинально мыслить - это не вписываться в систему. В т.ч. и в систему оценок- ценностей. Система образования настроена на уничтожение индивидуальности в человеке .
Интересно, а какой процент работ получает ноль баллов? По моим представлениям, хоть одну-то задачу большинство должно решить.
Скоро буду соревнования, в котором задания генерируются одной нейронкой, а другая нейронка решает это задание ....
Нейросеть YandexGPT в три раза ускорила проверку работ на олимпиаде «Турнир Ломоносова» по физике, химии и астрономии