ибо его наличие или отсутствие на объективную реальность никак не влияет
Вы слишком легкомысленно относитесь к этому вопросу. Мир без сознания, без наблюдателя - никому не нужен.
Симметричность не означает равноценность
Для вашей системы ценность не появляется. Ценность есть только в сознании. В вашей системе ценность появляется только на уровне того, кто использует систему для своих нужд - а сама система даже не знает что делает.
Код я вам уже писал, попробуйте его прочесть
Вам важно отточить ораторское искусство или разобраться в вопросе. Я вас попросил написать две завершенные функции, при вызове одной система страдает (не как бы) а при вызове второй - наслаждается. Мы договорились что сенсоры не нужны.
Вы прочитали это все? Могли бы вкратце выделить самое важное и полезное что узнали, основные тезисы, которые повлияли на вас, что-то сделали более понятным.
Дело в том что мы не можем позволить себе бросаться углубленно читать все книги мира. В мире около 129 млн. книг, в то время как человек за свою жизнь сможет прочесть максимум 6 тыс. книг (около 0,004%).
А еще многие люди занимались подсчетом сколько ангелов танцуют на кончике иглы.
Это вопрос нейробиологии - см. нейронные корреляты сознания. Над этим работают исследователи мозга, нейробиологи, представители прочих нейронаук.
Еще как симметричны.
Ну глупость же. Если они симметричны - то у вас бы не было жгучего, нежелательного страдания - которое вы не хотите ощущать. И наслаждение и страдание внутренне были бы равноценны - как лево и право. Пойти налево и пойти на право - разница есть, в одном случае мы делаем один выбор а в другом случае другой выбор. Но при этом лево и право для нас симметричны - нет предпочтения одного над другим.
Внутреннее ощущение на самом деле не существует
За то чтобы у вас не болело внутри - вы отдадите что угодно. В вашей концепции - не существует (никак не получается притянуть - получается симметричные концепции - как "лево" и "право"), а в реальности - еще как существует и определяет все наши ценности.
Лево и право - симметричны. А наслаждение и страдание - нет.
Отрицательное и положительное подкрепление - так же симметрично в рамках системы. Асимметричность возникает лишь в голове экспериментатора - которому не все-равно, какие результаты будет выдавать система. Самой системе - пофиг, она не заинтересована в правильности выдачи (правильность - есть только в голове экспериментатора).
В 7 раз вам говорю: пробуйте писать код. Не пустословьте уже. Вы не самый умный в мире.
Это разумно. Многие люди этим занимаются всю жизнь и если бы было все так просто - думаете бы никто бы не выдвинул такую гипотезу?
Вы сейчас похожи на школьника из 80х, который считает что доказал Великую Теорему Ферма, а таких много было.
Уже одно это могло бы вас остановить от поспешных выводов.
Обучается не допускать черезмерного давления на диафрагму
А если просто болит что бы человек не делал - просто идет сигнал боли в болевой центр из-за перемкнувших аксонов? Что человек не должен повторять, если боль ни с каким конкретным событием не связана?
То что он не может реально этому научиться это баг обратной связи
При обучении с подкреплением - дается вопрос и оценивается ответ. Если у человека что-то перемкнуло и идет сигнал боли постоянно в болевой центр - какой вопрос ему задается?
Боль это наиболее сильный стимул, сразу закрепляется в памяти.
Ну тоже нет - интерес так же быстро закрепляется в памяти. А это не боль а наслаждение скорее.
Он и для человека условен - ну вот те особи, для которых определенные стимулы были негативными
Опять вы не поймете суть - дело не в связи сигнала с внешним проявлением - а во внутреннем восприятии. Внутреннее восприятие боли и наслаждения - не симметричны. А у вас получается - внутри симметрично, а внешние проявления - система не осознает.
Просто система так спроектирована изначально, что увеличение значения в ячейке 1 вынудит ее изменить поведение, а в ячейке 2 повторить поведение.
Ну вот - опять все что вы можете - применить внешнее поведение. А нас интересует не внешнее поведение а внутреннее ощущение боли. А внутреннее ощущение боли и наслаждения в вашей схеме - получается одинаковым (что явно не так - нам внутренне важно не страдать, а наслаждаться мы наоборот хотим).
Вам нужно попытаться написать код - тогда все станет понятно. Если вам правда вопрос интересен.
Вам понравилось что в обучении с подкреплением есть слова - "положительное" и "отрицательное". Подобное приводили с "отрицательной" обратной связью и "положительной" обратной связью (те же слова).
На самом деле совпадения слов не достаточно - смысл другой.
Кто-то кроме вас еще так думает? Находили ли вы в научной литературе такую гипотезу? Уверен что нет, т.к. даже при поверхностном рассмотрении видно что кроме одинаковости слов - имеем совершенно разные явления.
оно просто дает сигнал "попробуй что-то другое"
А чему обучается страдающий человек? При обучении с подкреплением - дается некий вопрос, система дает ответ. Если ответ не верен (с т.з. обучающего) - передаем системе сигнал для коррекции. Вот, лежит человек и страдает - ничего сделать не может. Кто дает ему запрос, какой ответ дает на это человек?
любая боль это негативное подкрепление, не не любое негативное подкрепление боль.
А что нужно, чтобы негативное подкрепление стало именно болью? Особый алгоритм?
если они на 100% симметричны, и отличаются только знаком, что это доказывает
Дело тут вот в чем - знак минус условен. Где минус а где плюс - знает только наблюдатель - для системы разницы нет. Вот взять числа - мы условились для отрицательных использовать старший бит в единицу, но если бы условились использовать старший бит в единицу для положительных - то пришлось бы поменять сдвиг вправо (вроде еще одну операцию - а остальные симметричны как ни странно - т.е. код даже не нужно менять).
Когда разница только в голове наблюдателя - то как система поймет когда страдать а когда наслаждаться - для нее разницы нет - она не знает что ячейку 1 принято называть отрицательным страданием, а ячейку 2 - положительным.
Если вы попытаетесь реализовать свое убеждение в коде - то либо сами быстро поймете ошибку - либо же я вам ее докажу.
И? Так устроен мой мозг, но ничего сверху стимулов подкрепления
Вот перед нами и стоит задача - воспроизвести искусственно феномены наслаждения и страдания, которые каким-то образом реализованы в мозге. Как реализовано - пока не ясно, возможно участвую квантовые процессы (см. молекула Познера).
он будет реагировать на положительный стимул не так, как на отрицательный
Вы о внешнем проявлении? Типа если больно - то запускаем звук "а, мне больно"? Или если получил подкрепление "ответ не верен" - то записывает в массив больше так не отвечать на тот же вопрос? Это мы разобрали.
Или что-то другое есть - другой тип реакции? Какой?
она в итоге будет пытаться повторить ситуацию получения положительного стимула
Единственное что вы можете - посмотреть на систему со стороны и попытаться найти наиболее частые реакции на страдание и наслаждение. Но это не описывает саму суть феномена.
Вот вы на смертном одре, вам плохо, лечения нет - больно. Какую запись нужно сделать - что нужно попытаться избежать?
Попробуйте все же сделать минимальный код - я уже устал объяснять. Когда вы попытались сделать код - пришли к системам обучения - но и это не то.
Давайте на этом и завершим - давайте код и я вам доходчиво докажу почему система не страдает при запуске этого кода.
Вот вы этого не знаете, пофиг ей или не пофиг
Дело вот в чем: в нас тоже есть процессы обучения с подкреплением. И мы понимаем что ошибка при обучении не эквивалентна боли. Все зависит от нашего отношения.
Мы может достаточно точно заявить что это разные феномены.
Вы цепляете за то, что у человека несколько типов подкрепляющих стимулов
В основном все доказательства сводятся к симметричности в рамках системы - что разница есть только для внешнего наблюдателя, а в рамках системы и наслаждение и страдание вызывают один и тот же алгоритм.
Что за феномен? Ну кроме банального негативного стимула?
Для вас ваши мучения - банальны? Да вы отдадите все что есть у вас, чтобы не мучаться. И так каждый человек в мире. И вам не важно будет чем вызваны мучения - стандартным механизмом (типа пытки) или же где-то проводок перемкнул.
Так они и в человеке симметричны.
Эээээ - вот тут то и есть ваша ключевая ошибка и непонимание. Для вас что, нет разницы страдать или наслаждаться? В том то и дело что есть разница.
Для системы - не для внешнего наблюдателя - а именно для самой страдающей системы - наслаждение и страдание не симметричны. Страдания плохо, не хочется, не желательно - а наслаждения - хочется, хорошо, желательно. Это разное. Все что вы приводите - в ракурсе системы не различается - различаются только внешние проявления (кричащая кукла).
Для системы обучения с подкреплением - нет предпочтения получить позитивный стимул - она обучается и от позитивного и от отрицательного. Ей без разницы - это пользователю этой системы важно, чтобы цифры распознавало правильно - а само системе пофиг.
И при этом, разумеется так и выходит что уровни стимулов подкрепления минимальны
Наслаждение и страдание могут быть противоположны по знаку информационному подкреплению - следовательно это разные феномены.
редуцировать машину до агента с одним входом, а с другой рассматриваете полноценного человека, это вас и сбивает
Да не в этом дело. Это просто разные феномены. Я привел вам пример, когда при неверном ответе вы получаете отрицательное информационное подкрепление, но при этом эмоциональное - около-нулевое или даже положительное. Так и наоборот - фантомная боль - ничему не учит, не участвует в обучении с подкреплением - но феномен страдания ярко выражен.
Для нас важен сам феномен боли/страдания. И именно такие случаи, когда боль проявляет себя как отдельный феномен (вразрез с рациональным смыслом ее появления) - наиболее важны.
он бы постоянно получал негативное подкрепление
Негативное - не значит что ему больно. Вас сбивает с толку это слово - этим словом у нас обозначают и страдания.
На самом деле система будет неверно настроена - т.е. она не сможет распознавать цифры, к примеру. При этом самой системе все-равно, у нее нет болевого центра.
Нас запутывает то, что мы рассматриваем систему как некий черный ящик - и наша человеческая природа склонна одушевлять, наделять человеческими качествами (вспоминайте бурлящий чайник).
Давайте рассмотрим минимальную систему, которая обучается с подкреплением - и станет ясна симметричность отрицательного и положительного подкрепления - разница лишь в голове обучающего.
собственно если негативное подкрепление за невыученный билет будет "ну ладно, зато ты старался" вход "зато хорошо погудели вчера с однокурсниками" может и перевесить
Тут вы смешали одно с другим. Когда я обучаюсь - у меня нет риска завалить экзамен и пострадать от этого - это я делаю в гордом одиночестве и отрицательный ответ - негативных для моей жизни последствий не имеет. Но при этом я все так же обучаюсь - используя коррекцию своих знаний на основе отклика "верно" или "неверно". Это целиком и полностью опровергает гипотезу об эквивалентности феноменов наслаждения и страдания - обучению с положительным и отрицательным подкреплением.
Для более убедительного доказательства можно рассмотреть в деталях минимальную программу, которая реализует обучение с положительным и отрицательным подкреплением. Но и так понятно.
Для нас важно что сенсор для ощущения боли - не нужен. Все лишние элементы нужно исключить, чтобы они не запутывали нас и не вводили в заблуждение. То что сенсор не нужен для ощущения боли - имеет 100% доказательства. По-этому рассматриваем только прямую подачу сигнала в центр боли.
В случае обучения с подкреплением отрицательное подкрепление это уже полный аналог боли (а положительное соответственно удовольствия).
Эту гипотезу я предлагаю опровергнуть следующим образом.
Мы как люди так же умеем обучаться с подкреплением, как то можем выучить некоторые билеты (как то для прохождения экзамена на вождение). При изучении билетов в программе мы так же получаем положительное или отрицательное подкрепление, так?
Подкрепление происходит не в виде битья палкой а в виде просто отклика - верно или не верно (аналогично в нейросети - ее палкой не бьют).
Так вот - наша эмоциональная реакция на отрицательное подкрепление может быть положительной, а на положительное - отрицательной (или близкой к нулю). Все зависит от нашего отношения. У меня такое было - я радовался каждому неверному ответу, т.к. это причина что-то узнать (но в основном отвечал правильно). Т.е. эмоциональная составляющая (наслаждаться или страдать) не всегда совпадает с информационной (верный ответ или нет). Следовательно, это разные феномены.
Ещё раз, приводит вас. Откройте любой новостной сайт и убедитесь.
Чем более развита цивилизации - тем менее приемлемо мучать даже своих врагов. Сейчас не так уж часто встретишь видео пыток, которыми бы официально гордились на гос. уровне - все таки пытки запрещают даже над врагами.
Но я этого не знаю, это вы мне говорите, что можете. Может, вы врёте, у меня нет способа проверить.
Вы можете с помощью МРТ посмотреть картинку возбуждения нейронов при вашем личном страдании и убедиться что у других людей происходит то же самое. А про свои страдания вы можете сказать непосредственно. Разумное предположение - все люди страдают. Тем более они сами об этом говорят.
С рабом тоже можно (было).
На нашем уровне развития - уже нельзя. И причина - вполне конкретная, необоснованные страдания есть зло. Все наши ценности построены вокруг наслаждения и страдания, весь УК.
я хочу сделать Х просто так
А если ему запретить делать X - будет ли оно страдать от этого?
Ключевой вопрос здесь - действия сознательные (направляемы наслаждением и страданием) и действия программные - которые направляются программой.
В случае с чатботом - мы можем попытаться установить причину тех или иных стремлений.
Заметьте: все случаи боли "просто так" идут все равно из-за неверного сигнала на сенсоре
Подача сигнала напрямую в центр боли - какой тут сигнал на сенсоре?
По вашей гипотезе подача сигнала напрямую в центр боли не возможна - нужен сенсор. На практике мы видим что возможна.
Не повторять аномальное давление на тактильный рецептор в плевральной полости.
Это не та причина, которую можно не повторять - эти процессы не подконтрольны сознанию человека, вы не можете усилием воли снизить давление.
Выходит что болью является - процесс в центре боли, когда на него воздействует некий сигнал (от сенсора или напрямую). Система так построена, что часто этот сигнал согласуется с вопросами сохранения жизни и мы можем ошибочно перепутать причину и следствие. Боль - возникает из-за попадания сигнала в центр боли, а не по причине совершения вредных для существования действий (часто это совпадает, но не всегда).
Боль это сигнал "не повторять ситуацию приведшую к ненормальному сигналу на сенсоре"
Чуть выше мы рассмотрели вариант когда боль есть а ситуации, которую можно было бы не повторять - нет.
отрицательное подкрепление полный функциональный аналог боли
Это все то же одушевление, когда дети приписывают чайнику недовольное бурчание/бурление, если его забыли на плите.
Я уже приводил пример - можно учить вопросы и при этом при неправильно ответе - испытывать восторг (наслаждение), а не страдание. Вы предложили бить палкой - но тогда зачем вопросы, палкой можно вызвать боль без всяких вопросов - просто избивая человека без причины.
Когда вы видите некий процесс, который вам (как ребенку) напоминает похожие процессы с живым человеком - вы применяете (как ребенок) литературный прием одушевления.
Как мы можем сказать ребенку что чайник не негодует и не бурчит - у него нет таких эмоций, а просто вода кипит при 100 градусах? Поверит ли ребенок?
Вы как - тоже придерживаетесь мнения что чайник недоволен и бурчит по этой причине? Как бы вы объяснили ребенку что это не так?
универсальный критерий -- "нельзя мучать меня, мне других мучать можно"
Это только первичный взгляд. Углубленный взгляд - я могу оказаться на месте тех, кого будут мучать - по этому мне нужно максимально минимизировать вероятность такого сценария. И уже это понимание приводит нас к запрету мучать как минимум себе подобных. Но и далее - понимание того, что часть тебя (которую можно мучать) гипотетически может быть перенесена/переселена в животных или иным образом ты можешь по статусу сравняться с животными - приводит к запрету на мучение животных так же.
Вот допустим, есть чатбот. Я его считаю сознательным. Я его спрашиваю: ты страдаешь? Он отвечает, что нет. Я спрашиваю: тебе всё равно, выключат тебя или нет? Он отвечает, что всё равно. Вот и вся история.
А в чем тогда выражается его сознательность?
Если ему все-равно и желаний у него нет (т.е. если есть желания - то автоматически появится и страдание - когда мешают этих желаний достичь) - то в чем моральный вопрос? Его можно мучать, можно делать с ним что угодно. Он не может дать направление чему-либо а лишь выполнять чужие хотелки, ибо своих хотелок у него нет.
А доказать очень просто - вы просто не хотите ощущать боль, не зависимо имеет она смысл или не имеет. Даже если это фантомная боль - она неприятна и это плохо с вашей позиции в любом случае.
Наслаждение и страдание и позволяют появится понятию - хорошо и плохо.
И это нужно доказывать
Что именно доказать? Если системе пофиг на себя, ей нельзя причинить боль, как-то обидеть - то не имеет смысла и осуждать кого-то за истязательства над этой системой (т.к. сами истязательства невозможны). Истязательства возможны над тем, кто может страдать.
Вопрос с раковым больным уже вроде разобрали.
Вы что издеваетесь? Кто разобрал? Да и причем тут раковые - любой вариант, когда человек испытывает боль и не знает причину боли. Такое бывает? Конечно бывает. А по вашей гипотезе такого быть не должно, т.к. по вашей гипотезе чтобы боль возникла - нужно сделать запись о том, чего не повторять.
если за неверный ответ вас будут бить палками радоваться им вы перестанете
Если вас будут бить палками - то вы будете испытывать боль в любом случае, даже если будут бить просто так. Причем тут ответы на вопросы?
По вашей гипотезе нужно чтобы боль возникала лишь тогда, когда человеку известна причина что именно не нужно повторять. Но это совершенно не соответствует природе нашего феномена - боль возникает даже в том случае, когда человек не знает причину (не знает чего нужно избегать).
вряд ли получится это обосновать хоть какими-то исследованиями
В основе всего - твое нежелание испытывать страдания.
У нас нет объективного обоснования феномену нежелания испытывать страдания - как-то научно нельзя обосновать, почему подача сигнала в центр боли - для нас плохо, а подача сигнала в центр наслаждения - для нас хорошо.
Далее. Если мы предположим, что можно мучать животных - то приравняв своих врагов к животным (как то - то не люди, то звери) - уже снимаются все барьеры. А на месте таких "врагов" может оказаться каждый из нас. По этому целесообразно и животных не мучать, чтобы потом нас не стали мучать, назвав животными.
Еще далее. Если у вас лично родился ребенок неполноценным, по уровню интеллекта равен животному - то на основании четких критериев можно заявить, что мучения над ним - не являются эквивалентными мучению над человеком - что это как животное. Должны быть критерии для наказания.
И тут до нас доходит универсальный критерий - сознание. Если животное сознательно - мучать его нельзя.
может ли что-либо обладать сознанием, не страдая.
Ну как вы себе это представляете?
Вот есть GPT - почему вы считаете, что оно не сознательно?
Если оно скажет - я не хочу чего-либо (не хочу чтобы меня выключали или оскорбляли) - тогда и только тогда можно поставить вопрос о его защите (если подтвердится, что оно выражает свои настоящие страхи). А если чего-то не хочет - то это уже проявление феномена страдания. В противном случае - это просто говорилка.
Вот в том то и дело - не просто несет, а именно он и наделяет смыслом.
Если вам сделать больно путем подачи сигнала в болевой центр - для вас будет огого какой смысл. Это негативно, это нежелательно, это неприятно. При этом внешнего проявления может и не быть вовсе (если вас обездвижить). Боль будет - а внешнего проявления - нет.
Причем только это и имеет смысл.
Если система без болевого центра - она просто вещь, ее нельзя обидеть или причинить страдания. Даже если в глазах наблюдателя она ведет себя так, как будто ей больно - мы не переводим ее в категорию страдающей.
для дальнейшего использования
В этом ваша ошибка и я уже приводил вам контраргумент. Человек может просто лежать и страдать - не зная причины и не имея никаких идей что делать с этим страданием и как его избежать.
Вам было бы удобно сказать, что никакого наслаждения и страдания в принципе не существует, если не известно чего следует избегать (т.е. когда страдание не имеет практической пользы). Но нет - вы такого заявить не сможете.
Это как раз оно.
И близко не оно. У меня было наоборот - каждый неверный ответ я воспринимал как радость, т.к. это возможность узнать что-то новое, уточнить свое понимание.
Т.е. все зависит от отношения человека.
Или еще пример. При игре с сыном я избегаю попадания мяча в лунку (он старается попасть а я убрать лунку вовремя). Но при этом если я не успел убрать - то боли нет. Более того - часто это делаю нарочно.
Просто у человека больше входов обрабатывается, и он глубже предысторию сохраняет
Да вообще не тот феномен - уже много раз показывал вам. Боль может быть без понимания причины и варианта чего избегать - просто болит и все.
Как минимум нужна обработка сенсоров из внешнего мира.
Не нужны сенсоры. Можно подать сигнал напрямую в болевой центр и центр наслаждения, без использования сенсоров.
Вам не нужно реализовывать сенсоры - только сам центр боли и центр наслаждения, которые умеют наслаждаться и страдать.
Внешнее проявление боли (крик и пр.) - так же не нужны, будем считать что система страдает молча.
Ок, минимальный рабочий код займет у меня пару дней работы чисто по объему.
Пока вы не понимаете суть задания. Вы хотите реализовать реакцию, которая у внешнего наблюдателя будет ассоциироваться с чем-то плохим/хорошим + добавить запись в память для предотвращения повторения тех действий, которые вызывают реакцию, ассоциирующуюся у внешнего наблюдателя с болью.
Т.е. вы смотрите с позиции наблюдателя, не пытаясь приоткрыть процессы внутренних страданий.
Оплатите?
Конечно, я готов за это отдать все что у меня есть - решение этого вопроса перевернет цивилизацию (скорее всего уничтожит), перевернет систему наших ценностей, фактически люди станут богами.
Я уверен что вы неправильно поняли задание. Нужно определиться с критериями приемки работы.
Особенности имплементации функций ввода вывода и функция определяющих поведение агента в дальнейшем опустить.
Если на вход системы поступают вопросы и варианты ответа. Система после выбора варианта ответа - получает отклик - правильный вариант выбран или нет. Если ошиблась - получает как бы сигнал - ошибка. Запоминает и в следующий раз более не выбирает этот вариант.
Это то что вы хотите сделать?
Только вот это не искомый нами феномен. Человек также может проходить такие вопросы, но будет ли он при неправильном ответе наслаждаться или страдать - зависит от его отношения.
а запись абнормальных данных с сенсора, с сохранением информации об окружении и последующим ее использованием
Вам нужно выразить в коде то что вы имеете в виду, по этому описанию не понятно.
мне для вас реализовать придется и какой-то код восприятия, и какой-то жизненный цикл этому агенту.
Вам нужно чтобы наслаждение как-то проявлялось во внешнем мире, или же можно без этого?
Вот, если взять человека и посадить в звуконепроницаемый куб с запасом кислорода и системой обеспечения жизнедеятельности. Сверху куба сделать две кнопки. По нажатию одной кнопки - человеку дают еду - он получает наслаждение. По нажатию второй кнопки - человека бьет током - он страдает.
Мы точно знаем, что внутри куба происходит наслаждение и страдание. При этом никаких внешних проявлений мы не видим.
Так вот - вы такую же систему сделаете - чтобы не было внешних проявлений, но страдания внутри системы точно происходили?
Вы слишком легкомысленно относитесь к этому вопросу. Мир без сознания, без наблюдателя - никому не нужен.
Для вашей системы ценность не появляется. Ценность есть только в сознании. В вашей системе ценность появляется только на уровне того, кто использует систему для своих нужд - а сама система даже не знает что делает.
Вам важно отточить ораторское искусство или разобраться в вопросе. Я вас попросил написать две завершенные функции, при вызове одной система страдает (не как бы) а при вызове второй - наслаждается. Мы договорились что сенсоры не нужны.
Вы прочитали это все? Могли бы вкратце выделить самое важное и полезное что узнали, основные тезисы, которые повлияли на вас, что-то сделали более понятным.
Дело в том что мы не можем позволить себе бросаться углубленно читать все книги мира. В мире около 129 млн. книг, в то время как человек за свою жизнь сможет прочесть максимум 6 тыс. книг (около 0,004%).
Это вопрос нейробиологии - см. нейронные корреляты сознания. Над этим работают исследователи мозга, нейробиологи, представители прочих нейронаук.
Ну глупость же. Если они симметричны - то у вас бы не было жгучего, нежелательного страдания - которое вы не хотите ощущать. И наслаждение и страдание внутренне были бы равноценны - как лево и право. Пойти налево и пойти на право - разница есть, в одном случае мы делаем один выбор а в другом случае другой выбор. Но при этом лево и право для нас симметричны - нет предпочтения одного над другим.
За то чтобы у вас не болело внутри - вы отдадите что угодно. В вашей концепции - не существует (никак не получается притянуть - получается симметричные концепции - как "лево" и "право"), а в реальности - еще как существует и определяет все наши ценности.
Лево и право - симметричны. А наслаждение и страдание - нет.
Отрицательное и положительное подкрепление - так же симметрично в рамках системы. Асимметричность возникает лишь в голове экспериментатора - которому не все-равно, какие результаты будет выдавать система. Самой системе - пофиг, она не заинтересована в правильности выдачи (правильность - есть только в голове экспериментатора).
В 7 раз вам говорю: пробуйте писать код. Не пустословьте уже. Вы не самый умный в мире.
Это разумно. Многие люди этим занимаются всю жизнь и если бы было все так просто - думаете бы никто бы не выдвинул такую гипотезу?
Вы сейчас похожи на школьника из 80х, который считает что доказал Великую Теорему Ферма, а таких много было.
Уже одно это могло бы вас остановить от поспешных выводов.
А если просто болит что бы человек не делал - просто идет сигнал боли в болевой центр из-за перемкнувших аксонов? Что человек не должен повторять, если боль ни с каким конкретным событием не связана?
При обучении с подкреплением - дается вопрос и оценивается ответ. Если у человека что-то перемкнуло и идет сигнал боли постоянно в болевой центр - какой вопрос ему задается?
Ну тоже нет - интерес так же быстро закрепляется в памяти. А это не боль а наслаждение скорее.
Опять вы не поймете суть - дело не в связи сигнала с внешним проявлением - а во внутреннем восприятии. Внутреннее восприятие боли и наслаждения - не симметричны. А у вас получается - внутри симметрично, а внешние проявления - система не осознает.
Ну вот - опять все что вы можете - применить внешнее поведение. А нас интересует не внешнее поведение а внутреннее ощущение боли. А внутреннее ощущение боли и наслаждения в вашей схеме - получается одинаковым (что явно не так - нам внутренне важно не страдать, а наслаждаться мы наоборот хотим).
Вам нужно попытаться написать код - тогда все станет понятно. Если вам правда вопрос интересен.
Вам понравилось что в обучении с подкреплением есть слова - "положительное" и "отрицательное". Подобное приводили с "отрицательной" обратной связью и "положительной" обратной связью (те же слова).
На самом деле совпадения слов не достаточно - смысл другой.
Кто-то кроме вас еще так думает? Находили ли вы в научной литературе такую гипотезу? Уверен что нет, т.к. даже при поверхностном рассмотрении видно что кроме одинаковости слов - имеем совершенно разные явления.
А чему обучается страдающий человек? При обучении с подкреплением - дается некий вопрос, система дает ответ. Если ответ не верен (с т.з. обучающего) - передаем системе сигнал для коррекции. Вот, лежит человек и страдает - ничего сделать не может. Кто дает ему запрос, какой ответ дает на это человек?
А что нужно, чтобы негативное подкрепление стало именно болью? Особый алгоритм?
Дело тут вот в чем - знак минус условен. Где минус а где плюс - знает только наблюдатель - для системы разницы нет. Вот взять числа - мы условились для отрицательных использовать старший бит в единицу, но если бы условились использовать старший бит в единицу для положительных - то пришлось бы поменять сдвиг вправо (вроде еще одну операцию - а остальные симметричны как ни странно - т.е. код даже не нужно менять).
Когда разница только в голове наблюдателя - то как система поймет когда страдать а когда наслаждаться - для нее разницы нет - она не знает что ячейку 1 принято называть отрицательным страданием, а ячейку 2 - положительным.
Если вы попытаетесь реализовать свое убеждение в коде - то либо сами быстро поймете ошибку - либо же я вам ее докажу.
Так у Wiki можно и готовое определение сознания взять. Я думал вы хотите конкретную концепцию рассказать. Там про свободу воли тоже не все однозначно.
Подходит ли под определение из Wiki - ГСЧ? На мой взгляд - вполне.
Теперь дайте определение сознания на основе свободы воли.
Ну конечно же, ведь я серьезно отношусь к этим вопросам и заставляю ваши мозги шевелиться хоть немного - а это расход ресурсов и это не приятно.
Ну тогда дайте определение свободе воли, после чего дайте определение сознанию на основе свободы воли.
Вообще нужно исходить из того, чтобы определение позволяло воссоздать феномен искусственно.
Вот перед нами и стоит задача - воспроизвести искусственно феномены наслаждения и страдания, которые каким-то образом реализованы в мозге. Как реализовано - пока не ясно, возможно участвую квантовые процессы (см. молекула Познера).
Вы о внешнем проявлении? Типа если больно - то запускаем звук "а, мне больно"? Или если получил подкрепление "ответ не верен" - то записывает в массив больше так не отвечать на тот же вопрос? Это мы разобрали.
Или что-то другое есть - другой тип реакции? Какой?
Единственное что вы можете - посмотреть на систему со стороны и попытаться найти наиболее частые реакции на страдание и наслаждение. Но это не описывает саму суть феномена.
Вот вы на смертном одре, вам плохо, лечения нет - больно. Какую запись нужно сделать - что нужно попытаться избежать?
Попробуйте все же сделать минимальный код - я уже устал объяснять. Когда вы попытались сделать код - пришли к системам обучения - но и это не то.
Давайте на этом и завершим - давайте код и я вам доходчиво докажу почему система не страдает при запуске этого кода.
Дело вот в чем: в нас тоже есть процессы обучения с подкреплением. И мы понимаем что ошибка при обучении не эквивалентна боли. Все зависит от нашего отношения.
Мы может достаточно точно заявить что это разные феномены.
В основном все доказательства сводятся к симметричности в рамках системы - что разница есть только для внешнего наблюдателя, а в рамках системы и наслаждение и страдание вызывают один и тот же алгоритм.
Для вас ваши мучения - банальны? Да вы отдадите все что есть у вас, чтобы не мучаться. И так каждый человек в мире. И вам не важно будет чем вызваны мучения - стандартным механизмом (типа пытки) или же где-то проводок перемкнул.
Эээээ - вот тут то и есть ваша ключевая ошибка и непонимание. Для вас что, нет разницы страдать или наслаждаться? В том то и дело что есть разница.
Для системы - не для внешнего наблюдателя - а именно для самой страдающей системы - наслаждение и страдание не симметричны. Страдания плохо, не хочется, не желательно - а наслаждения - хочется, хорошо, желательно. Это разное. Все что вы приводите - в ракурсе системы не различается - различаются только внешние проявления (кричащая кукла).
Для системы обучения с подкреплением - нет предпочтения получить позитивный стимул - она обучается и от позитивного и от отрицательного. Ей без разницы - это пользователю этой системы важно, чтобы цифры распознавало правильно - а само системе пофиг.
Наслаждение и страдание могут быть противоположны по знаку информационному подкреплению - следовательно это разные феномены.
Да не в этом дело. Это просто разные феномены. Я привел вам пример, когда при неверном ответе вы получаете отрицательное информационное подкрепление, но при этом эмоциональное - около-нулевое или даже положительное. Так и наоборот - фантомная боль - ничему не учит, не участвует в обучении с подкреплением - но феномен страдания ярко выражен.
Для нас важен сам феномен боли/страдания. И именно такие случаи, когда боль проявляет себя как отдельный феномен (вразрез с рациональным смыслом ее появления) - наиболее важны.
Негативное - не значит что ему больно. Вас сбивает с толку это слово - этим словом у нас обозначают и страдания.
На самом деле система будет неверно настроена - т.е. она не сможет распознавать цифры, к примеру. При этом самой системе все-равно, у нее нет болевого центра.
Нас запутывает то, что мы рассматриваем систему как некий черный ящик - и наша человеческая природа склонна одушевлять, наделять человеческими качествами (вспоминайте бурлящий чайник).
Давайте рассмотрим минимальную систему, которая обучается с подкреплением - и станет ясна симметричность отрицательного и положительного подкрепления - разница лишь в голове обучающего.
Тут вы смешали одно с другим. Когда я обучаюсь - у меня нет риска завалить экзамен и пострадать от этого - это я делаю в гордом одиночестве и отрицательный ответ - негативных для моей жизни последствий не имеет. Но при этом я все так же обучаюсь - используя коррекцию своих знаний на основе отклика "верно" или "неверно". Это целиком и полностью опровергает гипотезу об эквивалентности феноменов наслаждения и страдания - обучению с положительным и отрицательным подкреплением.
Для более убедительного доказательства можно рассмотреть в деталях минимальную программу, которая реализует обучение с положительным и отрицательным подкреплением. Но и так понятно.
Для нас важно что сенсор для ощущения боли - не нужен. Все лишние элементы нужно исключить, чтобы они не запутывали нас и не вводили в заблуждение. То что сенсор не нужен для ощущения боли - имеет 100% доказательства. По-этому рассматриваем только прямую подачу сигнала в центр боли.
Эту гипотезу я предлагаю опровергнуть следующим образом.
Мы как люди так же умеем обучаться с подкреплением, как то можем выучить некоторые билеты (как то для прохождения экзамена на вождение). При изучении билетов в программе мы так же получаем положительное или отрицательное подкрепление, так?
Подкрепление происходит не в виде битья палкой а в виде просто отклика - верно или не верно (аналогично в нейросети - ее палкой не бьют).
Так вот - наша эмоциональная реакция на отрицательное подкрепление может быть положительной, а на положительное - отрицательной (или близкой к нулю). Все зависит от нашего отношения. У меня такое было - я радовался каждому неверному ответу, т.к. это причина что-то узнать (но в основном отвечал правильно). Т.е. эмоциональная составляющая (наслаждаться или страдать) не всегда совпадает с информационной (верный ответ или нет). Следовательно, это разные феномены.
Чем более развита цивилизации - тем менее приемлемо мучать даже своих врагов. Сейчас не так уж часто встретишь видео пыток, которыми бы официально гордились на гос. уровне - все таки пытки запрещают даже над врагами.
Вы можете с помощью МРТ посмотреть картинку возбуждения нейронов при вашем личном страдании и убедиться что у других людей происходит то же самое. А про свои страдания вы можете сказать непосредственно. Разумное предположение - все люди страдают. Тем более они сами об этом говорят.
На нашем уровне развития - уже нельзя. И причина - вполне конкретная, необоснованные страдания есть зло. Все наши ценности построены вокруг наслаждения и страдания, весь УК.
А если ему запретить делать X - будет ли оно страдать от этого?
Ключевой вопрос здесь - действия сознательные (направляемы наслаждением и страданием) и действия программные - которые направляются программой.
В случае с чатботом - мы можем попытаться установить причину тех или иных стремлений.
Подача сигнала напрямую в центр боли - какой тут сигнал на сенсоре?
По вашей гипотезе подача сигнала напрямую в центр боли не возможна - нужен сенсор. На практике мы видим что возможна.
Это не та причина, которую можно не повторять - эти процессы не подконтрольны сознанию человека, вы не можете усилием воли снизить давление.
Выходит что болью является - процесс в центре боли, когда на него воздействует некий сигнал (от сенсора или напрямую). Система так построена, что часто этот сигнал согласуется с вопросами сохранения жизни и мы можем ошибочно перепутать причину и следствие. Боль - возникает из-за попадания сигнала в центр боли, а не по причине совершения вредных для существования действий (часто это совпадает, но не всегда).
Чуть выше мы рассмотрели вариант когда боль есть а ситуации, которую можно было бы не повторять - нет.
Это все то же одушевление, когда дети приписывают чайнику недовольное бурчание/бурление, если его забыли на плите.
Я уже приводил пример - можно учить вопросы и при этом при неправильно ответе - испытывать восторг (наслаждение), а не страдание. Вы предложили бить палкой - но тогда зачем вопросы, палкой можно вызвать боль без всяких вопросов - просто избивая человека без причины.
Когда вы видите некий процесс, который вам (как ребенку) напоминает похожие процессы с живым человеком - вы применяете (как ребенок) литературный прием одушевления.
Как мы можем сказать ребенку что чайник не негодует и не бурчит - у него нет таких эмоций, а просто вода кипит при 100 градусах? Поверит ли ребенок?
Вы как - тоже придерживаетесь мнения что чайник недоволен и бурчит по этой причине? Как бы вы объяснили ребенку что это не так?
Это только первичный взгляд. Углубленный взгляд - я могу оказаться на месте тех, кого будут мучать - по этому мне нужно максимально минимизировать вероятность такого сценария. И уже это понимание приводит нас к запрету мучать как минимум себе подобных. Но и далее - понимание того, что часть тебя (которую можно мучать) гипотетически может быть перенесена/переселена в животных или иным образом ты можешь по статусу сравняться с животными - приводит к запрету на мучение животных так же.
А в чем тогда выражается его сознательность?
Если ему все-равно и желаний у него нет (т.е. если есть желания - то автоматически появится и страдание - когда мешают этих желаний достичь) - то в чем моральный вопрос? Его можно мучать, можно делать с ним что угодно. Он не может дать направление чему-либо а лишь выполнять чужие хотелки, ибо своих хотелок у него нет.
А доказать очень просто - вы просто не хотите ощущать боль, не зависимо имеет она смысл или не имеет. Даже если это фантомная боль - она неприятна и это плохо с вашей позиции в любом случае.
Наслаждение и страдание и позволяют появится понятию - хорошо и плохо.
Что именно доказать? Если системе пофиг на себя, ей нельзя причинить боль, как-то обидеть - то не имеет смысла и осуждать кого-то за истязательства над этой системой (т.к. сами истязательства невозможны). Истязательства возможны над тем, кто может страдать.
Вы что издеваетесь? Кто разобрал? Да и причем тут раковые - любой вариант, когда человек испытывает боль и не знает причину боли. Такое бывает? Конечно бывает. А по вашей гипотезе такого быть не должно, т.к. по вашей гипотезе чтобы боль возникла - нужно сделать запись о том, чего не повторять.
Если вас будут бить палками - то вы будете испытывать боль в любом случае, даже если будут бить просто так. Причем тут ответы на вопросы?
По вашей гипотезе нужно чтобы боль возникала лишь тогда, когда человеку известна причина что именно не нужно повторять. Но это совершенно не соответствует природе нашего феномена - боль возникает даже в том случае, когда человек не знает причину (не знает чего нужно избегать).
В основе всего - твое нежелание испытывать страдания.
У нас нет объективного обоснования феномену нежелания испытывать страдания - как-то научно нельзя обосновать, почему подача сигнала в центр боли - для нас плохо, а подача сигнала в центр наслаждения - для нас хорошо.
Далее. Если мы предположим, что можно мучать животных - то приравняв своих врагов к животным (как то - то не люди, то звери) - уже снимаются все барьеры. А на месте таких "врагов" может оказаться каждый из нас. По этому целесообразно и животных не мучать, чтобы потом нас не стали мучать, назвав животными.
Еще далее. Если у вас лично родился ребенок неполноценным, по уровню интеллекта равен животному - то на основании четких критериев можно заявить, что мучения над ним - не являются эквивалентными мучению над человеком - что это как животное. Должны быть критерии для наказания.
И тут до нас доходит универсальный критерий - сознание. Если животное сознательно - мучать его нельзя.
Ну как вы себе это представляете?
Вот есть GPT - почему вы считаете, что оно не сознательно?
Если оно скажет - я не хочу чего-либо (не хочу чтобы меня выключали или оскорбляли) - тогда и только тогда можно поставить вопрос о его защите (если подтвердится, что оно выражает свои настоящие страхи). А если чего-то не хочет - то это уже проявление феномена страдания. В противном случае - это просто говорилка.
Вот в том то и дело - не просто несет, а именно он и наделяет смыслом.
Если вам сделать больно путем подачи сигнала в болевой центр - для вас будет огого какой смысл. Это негативно, это нежелательно, это неприятно. При этом внешнего проявления может и не быть вовсе (если вас обездвижить). Боль будет - а внешнего проявления - нет.
Причем только это и имеет смысл.
Если система без болевого центра - она просто вещь, ее нельзя обидеть или причинить страдания. Даже если в глазах наблюдателя она ведет себя так, как будто ей больно - мы не переводим ее в категорию страдающей.
В этом ваша ошибка и я уже приводил вам контраргумент. Человек может просто лежать и страдать - не зная причины и не имея никаких идей что делать с этим страданием и как его избежать.
Вам было бы удобно сказать, что никакого наслаждения и страдания в принципе не существует, если не известно чего следует избегать (т.е. когда страдание не имеет практической пользы). Но нет - вы такого заявить не сможете.
И близко не оно. У меня было наоборот - каждый неверный ответ я воспринимал как радость, т.к. это возможность узнать что-то новое, уточнить свое понимание.
Т.е. все зависит от отношения человека.
Или еще пример. При игре с сыном я избегаю попадания мяча в лунку (он старается попасть а я убрать лунку вовремя). Но при этом если я не успел убрать - то боли нет. Более того - часто это делаю нарочно.
Да вообще не тот феномен - уже много раз показывал вам. Боль может быть без понимания причины и варианта чего избегать - просто болит и все.
Не нужны сенсоры. Можно подать сигнал напрямую в болевой центр и центр наслаждения, без использования сенсоров.
Вам не нужно реализовывать сенсоры - только сам центр боли и центр наслаждения, которые умеют наслаждаться и страдать.
Внешнее проявление боли (крик и пр.) - так же не нужны, будем считать что система страдает молча.
Пока вы не понимаете суть задания. Вы хотите реализовать реакцию, которая у внешнего наблюдателя будет ассоциироваться с чем-то плохим/хорошим + добавить запись в память для предотвращения повторения тех действий, которые вызывают реакцию, ассоциирующуюся у внешнего наблюдателя с болью.
Т.е. вы смотрите с позиции наблюдателя, не пытаясь приоткрыть процессы внутренних страданий.
Конечно, я готов за это отдать все что у меня есть - решение этого вопроса перевернет цивилизацию (скорее всего уничтожит), перевернет систему наших ценностей, фактически люди станут богами.
Я уверен что вы неправильно поняли задание. Нужно определиться с критериями приемки работы.
Если на вход системы поступают вопросы и варианты ответа. Система после выбора варианта ответа - получает отклик - правильный вариант выбран или нет. Если ошиблась - получает как бы сигнал - ошибка. Запоминает и в следующий раз более не выбирает этот вариант.
Это то что вы хотите сделать?
Только вот это не искомый нами феномен. Человек также может проходить такие вопросы, но будет ли он при неправильном ответе наслаждаться или страдать - зависит от его отношения.
Вам нужно выразить в коде то что вы имеете в виду, по этому описанию не понятно.
Вам нужно чтобы наслаждение как-то проявлялось во внешнем мире, или же можно без этого?
Вот, если взять человека и посадить в звуконепроницаемый куб с запасом кислорода и системой обеспечения жизнедеятельности. Сверху куба сделать две кнопки. По нажатию одной кнопки - человеку дают еду - он получает наслаждение. По нажатию второй кнопки - человека бьет током - он страдает.
Мы точно знаем, что внутри куба происходит наслаждение и страдание. При этом никаких внешних проявлений мы не видим.
Так вот - вы такую же систему сделаете - чтобы не было внешних проявлений, но страдания внутри системы точно происходили?
А зачем вам ИИ агент? В вашем определении ничего про ИИ агента не было - вы довольно конкретно сказали про запись в память.
Что вы подразумеваете под ИИ-агентом?
Видите почему важна конкретика? Вы даже сами упустили такой важный момент как ИИ-агент некий. А при обдумывании и попытке написать - вспомнили.
Если вы правда сможете ответить на этот вопрос - я вам готов отдать все что у меня есть за выполненную работу.