denis-19 14 дек 2024 в 05:41

Нейросеть YandexGPT в три раза ускорила проверку работ на олимпиаде «Турнир Ломоносова» по физике, химии и астрономии

2 мин

3.9K

Искусственный интеллектУчебный процесс в ITФизикаХимияАстрономия

Комментарии 23

ForestDog 14 дек 2024 в 05:45

Приходит девушка устраиваться на работу секретаршей. Шеф спрашивает " Ас какой скоростью вы можете печатать на машинке? "Девушка " Ну... 100500 знаков в минуту.... " Шеф: " Разве можно с такой скоростью печатать?!!" Девушка: " Печатать-то можно, но такая херня получается!!!! "

IvanZaycev0717 14 дек 2024 в 06:36

Модель обучали на решениях онлайн-этапов прошлых лет

Интересно, а если олимпиадник даст своё уникальное, элегантное решение, то YandexGPT посчитает его ошибочным?

Вот представьте: нейросеть научили только сортировке пузырьком. Человек пишет алгоритм быстрой сортировки, который имеет лучший Big O. Но нейросеть говорит, что это неверно, т.к. она знает только пузырёк.

denis-19 14 дек 2024 в 06:38

Апелляция, перепроверка.

15432 14 дек 2024 в 06:56

Так можно сразу все работы оценивать нулем и проверять только те, что пошли на апелляцию, мол, раз спорит, значит знает

sunnybear 14 дек 2024 в 07:59

Только это сроки проверки, скорее всего, увеличит

НЛО прилетело и опубликовало эту надпись здесь

frazhuz 14 дек 2024 в 14:02

Очевидно, тогда все, кто хоть сколько-нибудь заинтересованы в результате, будут подавать апелляцию. Это только увеличит общее время проверки, так как апелляция требует больше времени, чем первичная проверка

BenGunn 14 дек 2024 в 07:05

Это просто маркетинг, ничего более. Что то там может быть и проверяют нейронкой, но блин… нейронка_не_может_с_первого_раза посчитать количество символов в строке, игнорирует нижние подчеркивания. Я буквально с этим столкнулся на этой неделе. Copilot от микрософта. Уже не говорю о реально творческих вещах. Попросите нейронку сгенерировать последовательность аккордов в любой тональности и сделать в ней модуляцию или отклонение в рамках классической гармонии с ее строгими правилами. Хорошо если получится джаз. Обычно выходит какой то авангард. Они фантазируют даже когда спрашиваешь казалось бы простые штуки в том в чем они шарят по заявлению маркетологов. Это я про программирование. Я юзаю copilot как справочник по языкам - плюсы и питон(в данный момент основной стек). У меня опыт уже больше четверти века и то там ка про минному полю хожу. А тут нейронка от Яндекса, явного аутсайдера гонки ИИ хотя бы по причине более скромных бюджетов, будет как то судить олимпиадные задачи. Это похоже больше на то, что Яндекс пытается бороться за рынок внутри страны которая по известным причинам оказалась слегка в затруднительном положении в этих технологиях.

rPman 14 дек 2024 в 10:21

Осторожно, майкрософтовский сопилот это хитрая комбинация умного и тупого, чаще второе, не меряйте по нему весь ИИ... Скорее всего что бы сэкономить а не какие то глубоко идущие планы по дискредитации отрасли в целом

BenGunn 14 дек 2024 в 12:04

ChatGPT еще пробовал, но он абсолютно такой же глупенький.

Spliner 14 дек 2024 в 11:14

Все гораздо хуже. Человек оценивает творческие работы по формальным критериям. А нейросеть - не по формальным.

tzlom 14 дек 2024 в 07:42

Количество апелляций осталось на уровне прошлого года

Конечно осталось, потому что они опубликовали что проверяет ИИ только после апелляций.

janvarev 14 дек 2024 в 08:44

Как человек, неоднократно участвовавший в олимпиадной движухе и как ученик, и как преподаватель, могу сказать - имхо, в среднем кол-во апелляций не меняется совсем. Потому что апелляциями занимается небольшой процент участвующих, которому не совсем все равно и которые готовы потратить на это время (отдельный вопрос - зачем? поэтому мотивация для апелляции должна быть велика).

Более того, организаторы (сюрприз!) не любят править баллы, поэтому апелляции чаще всего заканчиваются ничем и все это знают. У меня есть пара феерических историй 2000-х годов:

В 10-м классе - физическая задача в духе "бесконечная цепь падает с бесконечного стола, найти установившуюся скорость падения". Задачу не решил никто, апелляция ничего не дала "тут все понятно"
Там же (9, 10 или 11 класс), информатика - "запрограммировать ход пешки". Особо умные люди учли, что короля есть нельзя и добавили это в программу. Сюрприз: тесты построены так, что после 2-го пешка постоянно ест короля. Апелляция ничего не выявила: "Нигде в задаче не сказано, что короля есть нельзя" (т.е. пользование здравым смыслом наказывается).

DaneSoul 14 дек 2024 в 09:23

У меня веселей случай был. Вопрос был чисто терминологический, я написал определение почти точно совпадающее с энциклопедическим словарем по предмету. Получил ноль за вопрос, приношу на апелляцию словарь, показываю определение. Пожилой преподаватель открывает список авторов, смотрит и выдает "Я не знаю автора который писал статьи по этому разделу, для меня эта книга не авторитет".

rPman 14 дек 2024 в 10:24

Какой хоть вопрос был? А то существуют области где до сих пор нет устоявшегося мнения, например определение интеллекта.

DaneSoul 14 дек 2024 в 12:40

Там такой неоднозначный вопрос и был. Но если человек приводит для аргументации своей точки зрения определение из энциклопедии, то явно он не сам это придумал и знаком с вопросом. Как за это можно 0 ставить?

PrinceKorwin 14 дек 2024 в 13:50

В любом случае оппелирование к авторитету не красит того преподавателя.

НЛО прилетело и опубликовало эту надпись здесь

Spliner 14 дек 2024 в 11:18

Олимпиадник порылся в Википедии и создал свое понимание. А Нейросеть может делать это в сотни раз эффективнее. Только и всего. Оригинально мыслить - это не вписываться в систему. В т.ч. и в систему оценок- ценностей. Система образования настроена на уничтожение индивидуальности в человеке .

Daemonis 14 дек 2024 в 13:15

Интересно, а какой процент работ получает ноль баллов? По моим представлениям, хоть одну-то задачу большинство должно решить.

0x1A4 14 дек 2024 в 13:41

Всякое бывает. Меня как-то отправили на школьную олимпиаду по геологии, при том, что у нас не было такого предмета, учителей и учебников, но надо было кого-то отправить. Результат не знаю, скорее всего был совсем не высоким.

Timbalut 15 дек 2024 в 17:22

Скоро буду соревнования, в котором задания генерируются одной нейронкой, а другая нейронка решает это задание ....

rPman 15 дек 2024 в 17:28

ответы в бенчмарках уже давно проверяются нейронкой

Зарегистрируйтесь на Хабре, чтобы оставить комментарий