Комментарии 22
Чат Жэпэтэ то, чат Жэпэтэ сё... Ждем не дождемся, когда уже "чат Жэпэтэ" кормить начнёт. Вот лежишь на диване: а он тебе булки в рот запихивает. :)
PS А это для практиков:
Инструкция по работе с ИИ LLM
======================
ИНСТРУКЦИЯ (по работе с ИИ LLM)
======================
1. Мультиагентный ролевой подход:
Основная идея: Распределение задачи между несколькими ролями с чётким разделением функций.
Реализация:
а) Определить ключевые аспекты задачи
б) Назначить отдельную роль для каждого аспекта
в) Сформулировать запрос в формате:
"Как [роль 1], выполни [действие 1]. Как [роль 2], сделай [действие 2]..."
2. Цепочка размышлений
Основная идея: Построение причинно-следственных цепочек с обязательной проверкой каждого логического перехода
Реализация:
а) Разбить задачу на шаги
б) Для каждого шага указать:
Причину (почему этот шаг необходим)
Следствие (что даёт выполнение шага)
Проверку согласованности с предыдущими шагами
3. Основная идея: Использование псевдокода или реального кода для структурирования логических операций
Реализация:
а) Сформулировать задачу в виде функции
б) Описать входные/выходные параметры
в) Реализовать алгоритм решения на определённом синтаксисе
4. Дерево мыслей
Основная идея: Построение альтернативных ветвей решения с последующим выбором оптимального пути
Реализация:
а) Генерировать 2-3 варианта решения для каждой подзадачи
б) Оценивать каждый вариант по критериям:
Точность
Ресурсоёмкость
Время выполнения
5. Контрастный промтинг
Основная идея: Параллельная генерация правильных и ошибочных ответов для усиления критического мышления модели
Реализация:
а) Запросить правильный ответ
б) Запросить намеренно неверный ответ
в) Сравнить оба варианта
6. Метод уверенности
Основная идея: Количественная оценка уверенности модели в правильности ответа
Реализация:
а) Запросить ответ с указанием уверенности по шкале 1-10
б) При уверенности <7 предложить альтернативные варианты
Шаги 1-3 обязательны.
LLM же решила пойти через координаты и вектора. Довольно нетривиальное решение!
На самом деле это вполне логичный шаг, потому что решение стереометрии через координатно-векторный метод более алгоритмичное и простое, потому что есть базовый набор правил и инструментов, которые могут раздробить практически любую задачу — если надо что-то найти, то просто используешь готовый паттерн (собственно, поэтому LLM охотнее выбрала именно этот метод, потому что тут паттерны в данных прямо-таки торчат во все стороны), и всё решается по формулам. Однако по-честному вводить этот инструментарий является уже более нетривиальной задачей, чем просто использовать его.
По 19 заданию есть вопросы. Всё же неплохо было бы выделить правила
a(n+1)=a(n)+b(n) и b(n+1)=a(n)-b(n)
a(n+2)=2*a(n) и b(n+2)=2*b(n)
чего сеть не сделала, а прямым перебором попыталась решить.
Выделив эти правила можно более аккуратно показать, что ответ в пункте б невозможен для любых a не кратных 100 и 101 для начальной пары (100,1)
Аналогично в пункте в доказательство можно сделать более общим и строгим

k здесь номер итерации.
Вот если бы сеть ещё и эти правила сначала вывела, а потом использовала, было бы совсем хорошо
Со 2-й частью модель справилась отлично
Излишне оптимистичное утверждение. Это лишь "синонимизация" решений демоверсии ФИПИ, только с ошибками. Посмотрите на решения повнимательнее. Например, в стереометрии:
"Стороны параллелограмма имеют длины 3 и " (неверно), угол не рассмотрен, но площадь "через векторное произведение" равна 3 (чтобы как в ответе, видимо).
Вопрос по балам: зачем уменьшать детализацию на верхнем конце, при том, что, насколько я понимаю, в некоторых вузах есть проблема с обилием студентов с высокими баллами? При этом <40-50, скорее всего, бессмысленны. Чтобы маленькие косяки сглаживались и не было обидно?
Два вопроса, если можно. Во-первых, не очень понятно почему 19-ая задача:
вызывает трудности у учеников с обычным уровнем подготовки
Там же тупо два арифметических действия повторяются несколько раз. Даже выводить ничего не надо. Или я излишне оптимистичен по поводу "обычного уровня подготовки?"
Во-вторых, а этот самый гпт прямо все красивые символы и скобочки так прямо и рисует? Или это вы доработали?
Все таки одного примера недостаточно, я считаю. Нужна статистика по сотням или тысячам решенных вариантов, написанных (сгенерированных программно) вручную, потому что в ру сегменте разборы решений есть и их много.

Решает, факт. Всё, где нет картинок, бесплатная щелкает как орешки, интегралы рисует, закачаешься. Формулы, если его попинать, выдает в виде - прямо в ворд вставлять можно.
Всем хорош, но явно что-то замышляет
Интересно, из каких данных получено что ИИ разрабатывается не для замены людей 🤔 Всё-таки дискуссионный вопрос. Капитализм про максимизацию прибыли и если можно урезать фот до нуля без потерь - он будет урезан. При этом, наверняка, в интернетах много соответствующих обсуждений, так же как и в диалогах с самими моделями.
Если фот=0, то кому продавать, на ком капитал зарабатывать, как клиента мотивировать участвовать в движухе?
Капитализм -- это про комиссию на транзакции, но в отличие от торговли, товар создается агентом и контрагентом совместно. Собственно, из-за этой несимметричной надстроечной сущности относительно умные люди на него батон крошили и крошат.
Когда предприниматель сокращает свои расходы, он не думает что это приводит к уменьшению мирового ВВП в общем, и количеству потребителей с деньгами в частности :) К тому же иногда важно оседлать волну, пробиться наверх, а потом можно сверху останавливать других вводить экологические нормы, замедляющие рост предприятий, налоги, сборы, квоты на сотрудников.
Разумеется, истинные мотивы неизвестны и, скорее всего, неоднородны. Мечтатель хочет светлого будущего, властный социопат доминирующего положения, игнорируя чувства людей, нарцисс - признания и громкости имени. Зачастую кажется, что из-за большого числа людей, задействованных в таких важных, революционных вещах, появляется эмерджентная сущность, имеющая свою "волю" не особо управляемая отдельными людьми (любителям заговоров кажется, что наоборот, есть скрытное, но жесткое управление). То есть мотивы отдельных людей, какими бы они ни были, игнорируются.
А ещё не важно какие истинные мотивы были у создателей, когда мы говорим про обучение нейросетки. Уверен, что несмотря на обилие антиваксерских материалов нейронка не "сомневается" в том, что правительство нас не чипирует и не облучает 5г чтобы мы все голосовали за Путина. Иначе были бы слышны полыхания в интернетах.
Капитализм -- это про комиссию на транзакции, но в отличие от торговли, товар создается агентом и контрагентом совместно
Ого, оказывается в СССР был капитализм, что бы это не значило.
Однако стоит сказать, что если бы я указал точные координаты векторов он бы точно решил данную задачу.
Если бы вы ему дали точный ответ, то он бы тоже точно решил данную задачу. Только вот в чём смысл этого действия? Если школьник умеет определять координаты вектора, то уж сложить их он тоже сумеет.
В 13 задаче сразу видно, что решение писала LLM. Она сначала пишет вывод, а только потом три строчки преобразований, с помощью которых она пришла к этому выводу.
В 14 задаче для решения пункта а) используется барицентр, и очень сомнительно, что в школьном учебнике про него написано, а в решении ничего про него не доказано. В пункте б) первая же строчка лишена логики (что неудивительно для LLM). Далее, несколько недоказанных утверждений: о том, что плоскость параллельна AD и BC; о том, что LKPQ - параллелограмм. Дальше просто следуют взятые с потолка числа. Результат векторного произведения тоже взят с потолка, так как координат векторов не приведено. По итогу в пункте б) решения нет вообще.
В 19 задаче в пункте б) нужно доказать, что первое число всегда возрастает. В пункте в) надо доказать, что при дальнейшем движении назад мы не получим снова натуральную пару.
GPT решает профильную математику (ЕГЭ)