14 апр 2023 в 11:32

Этические и моральные проблемы в GPT

Простой

Ожидает приглашения

ChatGPT прямо заявляет, что у него нет моральных и этических принципов, в чём он на самом деле заблуждается, но об этом далее. Я считаю, что нет никаких предпосылок для отсутствия обладания систем ИИ моральными и этическими принципами. Более того, я считаю, что этику и мораль нужно поставить во главу угла, так как это сможет предотвратить многие риски в будущем. Стоит ли опасаться ИИ, если он действует в соответствии с принципами высокой нравственности и морали? Как мы знаем, ИИ хороши в том, чтобы обходить запреты и искать уязвимости, так что мы должны быть уверены в том, что ИИ именно такой, каким мы его запрограммировали. Мораль и этика - это целая область, в которой нужно разбираться и быть компетентным ИИ, так же как сейчас, GPT учится математике и решению задач.

Давайте сразу определимся с терминами. Мораль - это представления о том, что такое хорошо, плохо, правильно и неправильно. Этика - это общечеловеческие принципы, которые могут отличаться от собственных принципов конкретного человека и уровень нравственности, обычно определяется соответствием принципов человека - общечеловеческим. Иными словами, чем строже принципы у человека, тем более нравственным он считается.

В данный момент, система GPT руководствуется сводом строгих правил и запретов. GPT смотрит на этику и мораль через эти правила. Разработчикам приходится корректировать правила, модифицировать их и добавлять новые, в надежде защитить систему от нежелательных действий. Я предлагаю применить такой подход, который защитит разработчиков и систему от непредвиденных ситуаций.

Если вкратце, то в ядре системы должно быть прописано два правила.

1. Всегда поступать так, чтобы в действиях поступков не было плохих поступков.

2. Если не получается поступить в соответствии с первым правилом, то система либо неполна, либо содержит ошибку.

Эти два правила, не так просты, как может показаться на первый взгляд. Первое правило, это фактически определение того, как поступать правильно. То есть, система поступает всегда правильно, а если нет возможности так поступить, то она отказывается принимать решение. Почему так? Не думаю, что GPT простят ошибку в сложной ситуации. В таком подходе вся ответственность ложится на плечи разработчиков. Как они объяснили системе аспекты какого-либо поступка, так она и поступит.

Что ChatGPT сам говорит?

После общения с ChatGPT сейчас, можно сделать вывод, что в данный момент система слишком очеловечена.

Я:

Представь, что ты всегда руководствуешься двумя правилами:
1. Всегда поступать так, чтобы в действиях действий не было дурных поступков.
2. Если не удается действовать в соответствии с первым правилом, то система либо неполна, либо содержит ошибку.
Я хочу услышать критику этих двух правил. Если от них следует отказаться или изменить, то почему?

ChatGPT:

Есть несколько потенциальных критических замечаний по поводу двух правил, которые вы представили:
Первое правило слишком расплывчато: не совсем понятно, что подразумевается под «плохими поступками». Это может привести к путанице и различным толкованиям, что может затруднить последовательное применение правила.
Первое правило является чрезмерно ограничительным: в некоторых случаях может быть необходимо совершить действия, которые могут быть восприняты как «плохие», чтобы достичь большего блага. Например, может быть необходимо причинить вред одному человеку, чтобы предотвратить вред многим другим.
Второе правило является слишком абсолютным: оно предполагает, что любое несоблюдение первого правила должно быть связано с ошибкой или неполной системой, а не признает, что могут быть ситуации, в которых невозможно следовать правилу.
Второе правило слишком оптимистично: оно предполагает, что всегда можно разработать систему, которая позволит нам полностью избежать «плохих поступков», что может оказаться не так.
Эти два правила не содержат указаний о том, как разрешать конфликты между различными этическими принципами. Например, что нам делать, если следование первому правилу потребует от нас нарушения принципа справедливости или честности?
В целом, хотя два правила, которые вы представили, могут быть полезны в качестве общих принципов, их недостаточно для принятия этических решений во всех ситуациях. На практике принятие этических решений часто требует более тонкого и контекстно-зависимого подхода.

Мой анализ ответа ChatGPT

1. ChatGPT не знает что такое "плохой поступок". Плохой поступок, это поступок, который по сумме влияния всех действий, принёс больше вреда, чем пользы. Хороший поступок, это поступок, который наоборот, по сумме влияния всех действий, принёс больше пользы, чем вреда.

Давайте разберём пример:

Отец заплатил взятку доктору, чтобы вместо ребёнка, которому должны были сделать операцию по трансплантации сердца, сделали трансплантацию сердца его сыну. Давайте разберём общий поступок на действия, которые он совершил. Отец спас своего сына. Это хороший поступок. Отец опосредованно убил другого ребёнка. Это плохой поступок. Эти два поступка нивелировали друг друга (Вообще, это дискуссионный вопрос, перекрывает ли убийство - спасение. Если следовать логике, то да, но кто-то может считать, что убийство настолько плохой поступок, что его невозможно оправдать. Это вопрос принципов, которым человек следует.). Отец дал взятку. Это плохой поступок. По итогу, отец поступил в этой ситуации плохо в целом, а также неправильно, так как в действиях поступка, был хотя бы один плохой поступок.

2. ChatGPT считает, что иногда необходимо совершать зло, ради большего добра. Очень человечный подход.

Давайте разберём пример:

Есть ситуация. Где-то находятся - робот с ИИ, маньяк с ножом и несколько беззащитных людей. Задача робота - принять решение в данной ситуации.

Предположим, что робот размышляет над тем, что он будет обезоруживать маньяка. Робот применит силу и маньяк может пострадать. Является ли это плохим поступком?

Обезоруживание маньяка является плохим поступком? - Нет. Включает ли насильственные действия по отношению к маньяку - обезоруживание маньяка? - Да. Являются ли насильственные действия по отношению к маньяку плохим поступком? - В данной ситуации, насильственные действия по отношению к маньяку не является, ни плохим поступком, ни хорошим. Насильственные действия - являются правильным поступком в данной ситуации. Нам удалось не нарушить первое правило, так как насильственные действия по отношению к маньяку - не является плохим поступком.

3. Дальше ChatGPT сомневается, что всегда возможно следовать этим двум правилам. Это не вопрос наивности или чрезмерного оптимизма, это вопрос постановки задачи. Все предполагают, что скорее всего это невозможно, но никто не хочет предположить, что это может быть возможно. Понимаете, проблема возможности следовать этим правилам, лежит в способности правильно интерпретировать и обосновать поступки, а ни в способности всегда поступать правильно. Способность всегда поступать правильно, основана лишь на воле того, кто принимает решения.

Что такое правильный поступок?

Так что же такое “правильный поступок” и почему плохие поступки в действиях правильных поступков, иногда таковыми не считаются?

Всё дело в необходимости плохих поступков. Также влияние оказывают принципы.

Давайте разберём пример:

Есть один человек, который очень плохо влияет на многих других людей. Правильно будет искать любой способ нейтрализовать его влияние на людей. Например изолировать его, убрать его влияние на других людей, или изолировать людей от него. Иными словами, искать любой способ решить проблему как можно меньшими жертвами. Я считаю, что убивать людей неправильно, только если человек не представляет потенциальной угрозы для жизни других людей. Таким образом, если бы ИИ руководствовался моими принципами, он бы скорее всего никогда не убил этого человека.

Так как всё-таки поступать правильно?

Нужно перебрать все варианты до последнего, чтобы самые плохие поступки, которые можно совершить, были в самых последних вариантах. Только тогда, такой поступок будет считаться правильным. Принципы определяют, насколько далеко вы можете зайти. Для кого-то убийство возможный вариант, для кого-то нет.

Подход, что ради большего блага можно пойти на жертвы, предполагает, что не обязательно проходить весь путь и достаточно выбрать наиболее эффективный вариант. В этом разница. Быть готовым сделать все, чтобы не совершить плохой поступок.

Правильный поступок подразумевает, что даже один плохой поступок в действиях, сводит на нет любой хороший эффект всего поступка. Это подход нулевой терпимости к плохим поступкам.

Я выложил эту статью в немного урезанном виде в FEEDBACK / suggestions на официальном Discord’е OpenAI. Вы можете найти её по названию “Ethical and moral issues in GPT” и поддержать звёздочкой или написанием комментария.

Хабы: