А теперь проведем мысленный эксперимент. :) Заложим пылесосу базовую программу. Что-то вроде DNA. Создадим главный цикл (main loop). Решение о том, нужно ли совершать какое-то действие в текущий момент времени мы будем принимать с помощью самой простой нейронки, которую будем дообучать налету (reinforcement learning), в которую будут заложены, допустим, такие ценности: поддержка минимального уровня заряда аккумулятора около 50%, поддержка уровеня загрязнения квартиры: 5% (ну и еще там всякое можно задать на тему скорости энергоэффективности, шума и т.д.).
При первом включении пылесос начинает уже работать по программе, которую мы в него заложили (пылесосная DNA). За какое-то кол-во итераций он оптимизирует веса, чтобы эффективно работать в даном помещении. Т.е. строит себе эту модель реальности.
А теперь добавим пылесосу еще новых сенсоров и датчиков (слух, обоняние, и др.). Заложим различные рефлексы и инстинкты и оценку текущей ситуации. Для примера: Если кто-то наступил на него -- остановить движение, чтобы не перегореть (либо опустить колеса в корпус, если это возможно). Если датчик определил скопление мусора -- замедлить скорость и/или изменить направление движения. Если резко изменилась освещенность, то замедлить скорость и/или проанализировать карту (и прошлые показания в данных координатах). Так же и со звуковым сенсором (шаги, изменения звука при различных сопротивлениях фильтра, контакт с препятствиями, сцепление с полом).
Мы уже заложили положительное и отрицательное подкрепление. Это как раз две простейшие эмоции. Ехал вот он, ехал, аккумулятор уже потратил прилично заряд, он далеко от базы, обнаружил кучу нового мусора. И тут еще кто-то на него наступил. Внутренний анализатор выставляет оценку текущей ситуации как "крайнее неудовольствие". Дальше нейронка выбирает решение о том, что нужно делать в текущей ситуации, учитывая сложившиеся обстоятельства (т.е. текущая модель мира + данные от сенсоров, прогноз на основе предыдущего опыта), где целевая "эмоция" - "крайнее удовлетворение".
Можно ли это назвать субъективными переживаниями? А почему бы и нет, если... Субъект -- есть. Эмоциональный процесс -- тоже есть, ЕСЛИ проигнорировать то, что по определению это психофизиологический процесс (головной мозг и нервная система).
Т.е., если придерживаться строгой терминологии, то про субъективные переживания нечего и говорить в отрыве от физиологического мозга и нервной системы. Но никто не планирует делать AGI с биологически идентичным человеческому мозгом, но про субъективные переживания ИИ говорить все хотят. :)
Значит будем говорить про некий альтернативный эмоциональный процесс. Проапгрейдим еще немного мозги нашему пылесосу. Добавим еще различных эмоций, инстинктов и т.д.. Хоть они и никак не нужны ему для его работы. Мы просто их заложим в его DNA. Обнаружение странного необычного мусора -> интерес. Обнаружение мусора, который плохо собирается -> гнев/ярость. Проблемы с зарядкой -> страх/ужас. И так далее. А эмоции будут влиять на степень задействования других областей -- различных анализаторов и памяти.
До какого уровня нам нужно дойти, чтобы мы согласились с тем, что пылесос обладает сознанием? :) Где граница?
Доказывать было не обязательно. :) Как и не нужно доказывать существование понедельника. Реальность будет существовать и после нас ровно по своему ОПРЕДЕЛЕНИЮ. Это всего лишь термины. Термины, а не гипотезы. Если мы называем свет длиной волны 660 нм красным, то нам не нужно доказывать существование красного цвета. Это всего лишь терминология. Но чтоб не оказалось так, что спор идет про разные смысле какого-то термина, нужно в самом начале согласовать его определение.
Да ничего нам не "дано". Это всего лишь обыкновенное слово, которое мы запомнили с детства. И это слово ассоциируется у нас с целым набором образов, при суммаризации которых у нас появляется понимание смысла этого слова. Так работает наш мозг и память.
Если в нашем сознании, вдруг, возникает вопрос "РЕАЛЬНО ЛИ ЭТО?" (допустим, нам кто-то задал этот вопрос), то наш мозг автоматически включает наш внутренний паттерн-матчинг, чтобы сделать правильный вывод.
Если такого вопроса не было, то и "внутренний анализатор" не будет запущен.
Ну и промежуточный вариант -- если мозг "спотыкается" на каких-то данных, т.е. фиксирует статистические "выбросы", но не может найти явные места, за которые может зацепиться, то тут уже может быть любой исход.
Ну да, можно и просто в Task Scheduler на какой-нибудь ивент повесить, да еще и с задержкой по времени, чтоб еще менее очевидно было :) Но такие пранки смешные были бы лет 20 назад, да и то не факт.
Да, кстати... Это важное дополнение. (Не про подыгрывание реальности.) Чувства чувствами, а планы нужно ставить осознано/адекватно, а сложные задачи делить на не очень сложные подзадачи. Если что-то долго делать без положительного обратного подкрепления, то это прямой путь к выгоранию и депрессии.
подвергаетесь постоянному стрессу, у вас чт... Как ваш покорный слуга.
Ну называть себя покорным, да еще и слугой... :) Такое тоже не добавляет дофамина. Нужно строго наоборот, осознавать себя "всемогущим" и свободным. Тогда концентрация дофамина начнет увеличиваться в ожидании новых приятностей (хоть полезных, хоть не очень). И как дофамина накопится уже достаточно, прямо захочется встать и начать что-то делать. Можно, конечно, и ингибитор обратного захвата дофамина использовать, чтобы это произошло быстрее, но это уже отдельная тема.
Не, он просто радостный, что не влез в комменты. И самодовольно смотрит на правого, который влез, загруз и загрустил, потому что "в интернете снова кто-тог не прав".
Это все лишь инструменты, которые улучшаются день за днем. Вот я LLM-ку попросил описать сцену для создания youtube thumbnail на тему выгорания (в IT). А затем этот текст закинул во Flux, который сейчас собирает максимум внимания в обсуждениях на всех ресурсах. Вот он что нарисовал. А я ж могу попросить: напиши 50 таких вариантов, а потом во Flux их все сгенерить (еще по ХХ штук для каждого описания). И выбрать сразу готовый вариант, либо выбрать хорошую идею для доработки.
Кстати, хороший возможный PR-ход. Найти шестипалого актера для съемки рекламы. Потом помочь создать хайп в интернете, мол, такая известная компания, а такое г выпустила. :) И после этого выложить бекстейдж-видео с этим актером. :)
Тоже покажу свой вариант. Вдруг, кто не знает. На сегодня самый эффективный способ -- попросить топовую LLM-ку описать изображение. Я подсунул оригинал в Claude 3.5 Sonnet. Он мне выдал подробное описание. Я только русский распознанный текст заменил английским, так как Flux нормально на русском не справится. Вот что выдал Flux с первой попытки:
А я так когда-то в блоге своем постил подобное. :) И потом как минимум два раза помню как сам себя находил в гугле, когда снова с таким сталкивался. :) Тоже удобно.
от форс-мажоров. Но внештатные ситуации все равно случаются, без этого никак…
А прикинь, когда владелец. Ты годами круглосуточно в напряжении. То какой-то сервак где-то ляжет в неподходящий момент, то вышестоящий провайдер, то с оборудованием где-то какой-то полтергейст, то, вдруг, приходят те, кто "тебя бережет", выпиливают болгаркой дверь серверной и все выносят...
Как раз питонистам виднее, что все это ненастоящее. :) А тем, кто с LLM-ками работает, так вообще.
Если у кого-то сомнения, то автор там же в своем info пишет " AI enthusiast " и дает ссылку на ресурс, где он продает инфопродукты на текму LLM Prompt Engineering. :)
Если я правильно понял цифры в интерфейсе "медиума", то у автора уже под 2 тысячи таких вот ... км... статей. :)
Когда-то давно осваивал эту технику. Был у меня свой "виртуальный маршрут", на котором я расставлял новые образы. Например, я так испанские слова пробовал учить. Т.е. в свободное время для повторения мне нужно было лишь прогуляться по маршруту, "вглядываясь в расставленные объекты рядом с моими опорными образами"..
Но на практике оказалось, что пользы в этом мало. Это как мозговой жесткий диск небольшого размера. Форматирование и запись требуют времени. Расширить очень непросто, нужно достраивать больше опорных образов, заучивать их... А выгода в чем?
Ну не число же π заучивать до ХХ знака после запятой. Такое могло бы очень пригодится для каких-то целей в условиях отсутствия цивилизации. А так... Лучше мозговой ресурс на аналитические размышления потратить, а не на обычное хранение данных.
Тоже давно на тему фото такие же думы думаю. Недавно нашел свежую нейронку InternVL, которая может описывать фото (локально на GPU). Пока применил для создания описания фотографий (captions) в обучении LoRa -- вполне уже неплохо описывает. Пример:
In the image, there is a man with a beard and a mustache. He has short, dark hair and is wearing a yellow and green jersey, which could suggest he is a fan of a sports team or participating in a sports event. The skw man is looking directly at the camera with a slight smile, and his gaze is focused on the viewer. He appears to be indoors, with a painting or framed artwork visible in the background, indicating that the setting might be a home or a room with decorative art. The lighting in the room is soft and diffused, creating a warm and inviting atmosphere.
Вот если такие описания скормить локальной LLM-ке с большим контекстным окном, то уже может получиться что-то адекватное (только нужно еще сделать так, чтобы оно фотку рисовало прям в диалоге чата, например, автозаменой айдишника). Ну либо просто локальный поисковик по таким описаниям, но это уже не так интересно.
Играть за морпеха было достаточно некомфортно: ты передвигаешься по слабо освещённым коридорам, постоянно поглядывая на детектор движения, ведь в любой момент можешь стать жертвой неожиданной атаки из темноты.
А я чуть строительством дома не занялся, бо стройматериалы появились неожиданно. Еще бы. Я тогда играл за морпеха в 3Д очках NVIDIA (затворных, которые работают в паре с 120Гц монитором) и в наушниках. Шел я по темному коридору.... А потом -- ХОП. Наугад моментально куда-то выстрелял весь магазин. На этом и закончил играть. :)
А теперь проведем мысленный эксперимент. :) Заложим пылесосу базовую программу. Что-то вроде DNA. Создадим главный цикл (main loop). Решение о том, нужно ли совершать какое-то действие в текущий момент времени мы будем принимать с помощью самой простой нейронки, которую будем дообучать налету (reinforcement learning), в которую будут заложены, допустим, такие ценности: поддержка минимального уровня заряда аккумулятора около 50%, поддержка уровеня загрязнения квартиры: 5% (ну и еще там всякое можно задать на тему скорости энергоэффективности, шума и т.д.).
При первом включении пылесос начинает уже работать по программе, которую мы в него заложили (пылесосная DNA). За какое-то кол-во итераций он оптимизирует веса, чтобы эффективно работать в даном помещении. Т.е. строит себе эту модель реальности.
А теперь добавим пылесосу еще новых сенсоров и датчиков (слух, обоняние, и др.). Заложим различные рефлексы и инстинкты и оценку текущей ситуации. Для примера: Если кто-то наступил на него -- остановить движение, чтобы не перегореть (либо опустить колеса в корпус, если это возможно). Если датчик определил скопление мусора -- замедлить скорость и/или изменить направление движения. Если резко изменилась освещенность, то замедлить скорость и/или проанализировать карту (и прошлые показания в данных координатах). Так же и со звуковым сенсором (шаги, изменения звука при различных сопротивлениях фильтра, контакт с препятствиями, сцепление с полом).
Мы уже заложили положительное и отрицательное подкрепление. Это как раз две простейшие эмоции. Ехал вот он, ехал, аккумулятор уже потратил прилично заряд, он далеко от базы, обнаружил кучу нового мусора. И тут еще кто-то на него наступил. Внутренний анализатор выставляет оценку текущей ситуации как "крайнее неудовольствие". Дальше нейронка выбирает решение о том, что нужно делать в текущей ситуации, учитывая сложившиеся обстоятельства (т.е. текущая модель мира + данные от сенсоров, прогноз на основе предыдущего опыта), где целевая "эмоция" - "крайнее удовлетворение".
Можно ли это назвать субъективными переживаниями? А почему бы и нет, если... Субъект -- есть. Эмоциональный процесс -- тоже есть, ЕСЛИ проигнорировать то, что по определению это психофизиологический процесс (головной мозг и нервная система).
Т.е., если придерживаться строгой терминологии, то про субъективные переживания нечего и говорить в отрыве от физиологического мозга и нервной системы. Но никто не планирует делать AGI с биологически идентичным человеческому мозгом, но про субъективные переживания ИИ говорить все хотят. :)
Значит будем говорить про некий альтернативный эмоциональный процесс. Проапгрейдим еще немного мозги нашему пылесосу. Добавим еще различных эмоций, инстинктов и т.д.. Хоть они и никак не нужны ему для его работы. Мы просто их заложим в его DNA. Обнаружение странного необычного мусора -> интерес. Обнаружение мусора, который плохо собирается -> гнев/ярость. Проблемы с зарядкой -> страх/ужас. И так далее. А эмоции будут влиять на степень задействования других областей -- различных анализаторов и памяти.
До какого уровня нам нужно дойти, чтобы мы согласились с тем, что пылесос обладает сознанием? :) Где граница?
Доказывать было не обязательно. :) Как и не нужно доказывать существование понедельника. Реальность будет существовать и после нас ровно по своему ОПРЕДЕЛЕНИЮ. Это всего лишь термины. Термины, а не гипотезы. Если мы называем свет длиной волны 660 нм красным, то нам не нужно доказывать существование красного цвета. Это всего лишь терминология. Но чтоб не оказалось так, что спор идет про разные смысле какого-то термина, нужно в самом начале согласовать его определение.
Да ничего нам не "дано". Это всего лишь обыкновенное слово, которое мы запомнили с детства. И это слово ассоциируется у нас с целым набором образов, при суммаризации которых у нас появляется понимание смысла этого слова. Так работает наш мозг и память.
Если в нашем сознании, вдруг, возникает вопрос "РЕАЛЬНО ЛИ ЭТО?" (допустим, нам кто-то задал этот вопрос), то наш мозг автоматически включает наш внутренний паттерн-матчинг, чтобы сделать правильный вывод.
Если такого вопроса не было, то и "внутренний анализатор" не будет запущен.
Ну и промежуточный вариант -- если мозг "спотыкается" на каких-то данных, т.е. фиксирует статистические "выбросы", но не может найти явные места, за которые может зацепиться, то тут уже может быть любой исход.
Да, потому что у него и нет холостого хода :) Блокируются одни обработчики, активируются другие.
Ага. И софтайсом дебажили. :)
Ну да, можно и просто в Task Scheduler на какой-нибудь ивент повесить, да еще и с задержкой по времени, чтоб еще менее очевидно было :) Но такие пранки смешные были бы лет 20 назад, да и то не факт.
Да, кстати... Это важное дополнение. (Не про подыгрывание реальности.) Чувства чувствами, а планы нужно ставить осознано/адекватно, а сложные задачи делить на не очень сложные подзадачи. Если что-то долго делать без положительного обратного подкрепления, то это прямой путь к выгоранию и депрессии.
Ну называть себя покорным, да еще и слугой... :) Такое тоже не добавляет дофамина. Нужно строго наоборот, осознавать себя "всемогущим" и свободным. Тогда концентрация дофамина начнет увеличиваться в ожидании новых приятностей (хоть полезных, хоть не очень). И как дофамина накопится уже достаточно, прямо захочется встать и начать что-то делать. Можно, конечно, и ингибитор обратного захвата дофамина использовать, чтобы это произошло быстрее, но это уже отдельная тема.
Не, он просто радостный, что не влез в комменты. И самодовольно смотрит на правого, который влез, загруз и загрустил, потому что "в интернете снова кто-тог не прав".
Не раз попадались не-нейтивы, которые именно "height" произносили как "хейт".
Никогда не слышал "девелОпер". :) Зато часто слышал "биaс" вместо "баяс" и "хейт" вместо "хайт". :)
Это все лишь инструменты, которые улучшаются день за днем. Вот я LLM-ку попросил описать сцену для создания youtube thumbnail на тему выгорания (в IT). А затем этот текст закинул во Flux, который сейчас собирает максимум внимания в обсуждениях на всех ресурсах. Вот он что нарисовал. А я ж могу попросить: напиши 50 таких вариантов, а потом во Flux их все сгенерить (еще по ХХ штук для каждого описания). И выбрать сразу готовый вариант, либо выбрать хорошую идею для доработки.
Кстати, хороший возможный PR-ход. Найти шестипалого актера для съемки рекламы. Потом помочь создать хайп в интернете, мол, такая известная компания, а такое г выпустила. :) И после этого выложить бекстейдж-видео с этим актером. :)
Тоже покажу свой вариант. Вдруг, кто не знает. На сегодня самый эффективный способ -- попросить топовую LLM-ку описать изображение. Я подсунул оригинал в Claude 3.5 Sonnet. Он мне выдал подробное описание. Я только русский распознанный текст заменил английским, так как Flux нормально на русском не справится. Вот что выдал Flux с первой попытки:
А я так когда-то в блоге своем постил подобное. :) И потом как минимум два раза помню как сам себя находил в гугле, когда снова с таким сталкивался. :) Тоже удобно.
А прикинь, когда владелец. Ты годами круглосуточно в напряжении. То какой-то сервак где-то ляжет в неподходящий момент, то вышестоящий провайдер, то с оборудованием где-то какой-то полтергейст, то, вдруг, приходят те, кто "тебя бережет", выпиливают болгаркой дверь серверной и все выносят...
Как раз питонистам виднее, что все это ненастоящее. :) А тем, кто с LLM-ками работает, так вообще.
Если у кого-то сомнения, то автор там же в своем info пишет " AI enthusiast " и дает ссылку на ресурс, где он продает инфопродукты на текму LLM Prompt Engineering. :)
Если я правильно понял цифры в интерфейсе "медиума", то у автора уже под 2 тысячи таких вот ... км... статей. :)
Когда-то давно осваивал эту технику. Был у меня свой "виртуальный маршрут", на котором я расставлял новые образы. Например, я так испанские слова пробовал учить. Т.е. в свободное время для повторения мне нужно было лишь прогуляться по маршруту, "вглядываясь в расставленные объекты рядом с моими опорными образами"..
Но на практике оказалось, что пользы в этом мало. Это как мозговой жесткий диск небольшого размера. Форматирование и запись требуют времени. Расширить очень непросто, нужно достраивать больше опорных образов, заучивать их... А выгода в чем?
Ну не число же π заучивать до ХХ знака после запятой. Такое могло бы очень пригодится для каких-то целей в условиях отсутствия цивилизации. А так... Лучше мозговой ресурс на аналитические размышления потратить, а не на обычное хранение данных.
Тоже давно на тему фото такие же думы думаю. Недавно нашел свежую нейронку InternVL, которая может описывать фото (локально на GPU). Пока применил для создания описания фотографий (captions) в обучении LoRa -- вполне уже неплохо описывает. Пример:
In the image, there is a man with a beard and a mustache. He has short, dark hair and is wearing a yellow and green jersey, which could suggest he is a fan of a sports team or participating in a sports event. The skw man is looking directly at the camera with a slight smile, and his gaze is focused on the viewer. He appears to be indoors, with a painting or framed artwork visible in the background, indicating that the setting might be a home or a room with decorative art. The lighting in the room is soft and diffused, creating a warm and inviting atmosphere.
Вот если такие описания скормить локальной LLM-ке с большим контекстным окном, то уже может получиться что-то адекватное (только нужно еще сделать так, чтобы оно фотку рисовало прям в диалоге чата, например, автозаменой айдишника). Ну либо просто локальный поисковик по таким описаниям, но это уже не так интересно.
А я чуть строительством дома не занялся, бо стройматериалы появились неожиданно. Еще бы. Я тогда играл за морпеха в 3Д очках NVIDIA (затворных, которые работают в паре с 120Гц монитором) и в наушниках. Шел я по темному коридору.... А потом -- ХОП. Наугад моментально куда-то выстрелял весь магазин. На этом и закончил играть. :)