All streams
Search
Write a publication
Pull to refresh
4
0
Александр @aleksanderL

User

Send message

При этом чат ГПТ справляется https://chatgpt.com/share/c4994ed9-26f4-4c80-96b9-65d410adbca4

Можно сказать, что он подсмотрел в интернете

Меняем самолёт на вертолёт https://chatgpt.com/share/226f35f5-d805-4f58-9e41-d84236aec761

Он показывает понимание отличия принципов взлёта самолёта и вертолёта.

Люди с высшим образованием до сих пор некоторые доказывают, что не взлетит...

Ещё толпа недоматематиков думают, что колёса будут вращаться всего лишь в 2 раза быстрее. То есть в голове понять простую положительную обратную связь из задачки способны вообще единицы населения нашей планеты.

Человек понимает, что a × b = взять a b раз = a_1 + a_2 + … + a_b. Вы можете сказать что не все люди это понимают, однако они запоминают алгоритм того же умножения в столбик и решают.

Ещё пример на котором ломаются даже некоторые заслуженные физики:

Задача о самолёте на транспортёре:

Самолет (реактивный или винтовой) стоит на взлётной полосе с подвижным покрытием (типа транспортёра). Покрытие может двигаться против направления взлёта самолёта, то есть ему навстречу. Оно имеет систему управления, которая отслеживает и подстраивает скорость движения полотна таким образом, чтобы скорость вращения колёс самолёта была равна скорости движения полотна.

Вопрос: сможет ли самолёт разбежаться по этому полотну и взлететь?

Жесть какому количеству людей даже бумаги не хватает чтобы выйти из когнитивной паттерновой ловушки. Оно в интернете обсосано уже 20 лет как покругу, и то не все согласны с физикой происходящего.

Задача не только на сложение, но и на логику.

Давайте чуть-чуть логически задумаемся: ведь задачка на простенькую логику, как раз должна показывать возможности сознания, интеллекта и прочее превосходство человека.

Человек, вероятно, с ходу ошибку не найдёт, если ранее не встречал подобные.

А как же математическая модель в голове, логическое мышление и все прочие прелести человеческого мозга? Куда они деваются если он не видел решения похожей задачи?

Самые умные на бумаге раскладывают движения материальных и финансовых средств и конечно находят ошибку в своей логике. Но это примитивная задача в которой человеческий мозг и то путается

Потому что мозг - больше, чем паттерн-матчинг.

Как вы любите говорить: Это не доказано. Докажите сначала

… так умеют люди, но не языковые модели. Пообщайтесь хоть с LLM с вашим промптом и дайте ей настоящую задачу, которую она должна выполнить согласно вашим указаниям. Не сферическую задачу в вакууме где модель должна в вашем воображаемом мире сходить за хлебом.

К лингвистической модели нужен простенький модуль алгоритмический, который сейчас выполняет человек в чате копируя JSON из CV.

Выше есть примеры общения, развитие ситуации.

Приведите пример "настоящей задачи". Чем задача с хлебом ненастоящая?

Так это как раз и есть предмет обсуждения - то, что ни ваша система, ни вы не замечает своих ошибок.

Это прототип сделанный за пару минут чтобы проверить концепцию. Какая из ошибок бота станет фатальной для цели? Никакая. Пока он не самоубился, ошибок нет.

Вы хотите 100% гарантию. Её не бывает. Вы путаете ИИ с калькулятором.

Вы хотите отбросить существующее определение? Тогда вам надо дать свое и объяснить, почему оно жизнеспособно.

Пробовал в соседней ветке, определение им не нравится, им надо чего-то человеческого. Требовали наличия страдания и наслаждения, с аргументами что они так умеют, значит оно есть.

Мышление — процесс познавательной деятельности, характеризующийся обобщенным и опосредствованным отражением действительности.

Хотя философы в Википедии дают такое антропоцентричное определение

Мышле́ние — познавательная деятельность человека[1]. Умственный процесс. Он является опосредованным и обобщённым способом отражения действительности, и неразрывно связан с использованием внутренней речи. Он включает в себя как и сознательные процессы, так и иррациональную корневину.

По сути сами признают, что в основе мышления лежит лингвистическая модель

Кем запрещено?

Разработчиками и не прямо запрещено, просто не предусмотрено. Теслу системой ИИ можно назвать весьма условно.

Человек, вероятно, с ходу ошибку не найдёт

Потомучто хоть что-то нестандартное ставит людей в тупик. Люди берут исключительно вычислительной мощностью и имеют кучу дополнительных "модулей" в мозгу, кроме лингвистической модели мира. И то такая банальная задачка из нескольких цифр ставит в тупик.

Нейробиологи признают, что наш мозг по сути мега мощный паттерн матчер. Именно поэтому на нас действует зомби-реклама, НЛП и прочие примитивные воздействия. Люди в астрологию верят! Какой интеллект нафиг?

Но почему-то людей считают носителями какого-то волшебного сознания. А ИИ категорически боятся признать, что даже сложная система из множества модулей (я не имею ввиду какую-либо LLM, а целую систему из множества различных модулей) может иметь зачатки сознания.

Hidden text

Логика принятия решения:

  1. Цель:

    • Найти цельнозерновой хлеб.

    • Найти что-нибудь к кофе.

  2. Анализ входных данных:

    • Видимые объекты: "bread loaves", "chocolate covered pastries", "pastries with powdered sugar", "assorted cookies", "price tags in Russian".

  3. Распознавание объектов:

    • "bread loaves" может содержать цельнозерновой хлеб.

    • "chocolate covered pastries", "pastries with powdered sugar", и "assorted cookies" являются потенциальными продуктами к кофе.

  4. Действия:

    • Осмотреть "bread loaves" для идентификации цельнозернового хлеба.

    • Осмотреть "chocolate covered pastries", "pastries with powdered sugar", и "assorted cookies" для выбора продукта к кофе.

    • Проверить "price tags in Russian" для получения информации о ценах и подтверждения выбора продуктов.

  5. Принятие решения:

    • Если цельнозерновой хлеб найден среди "bread loaves", выбрать его.

    • Выбрать один из продуктов к кофе (например, "chocolate covered pastries").

    • Проверить соответствие цены на "price tags in Russian".

    • Если цена устраивает и продукты выбраны, перейти к оплате.

Пример команды исполнения:

  1. Осмотреть хлеб:

    { "тип действия": "осмотреть", "объект действия": "bread loaves" }
    
  2. Выбрать продукт к кофе:

    { "тип действия": "выбрать", "объект действия": "chocolate covered pastries" }
    
  3. Проверить цены:

    { "тип действия": "проверить", "объект действия": "price tags in Russian" }
    

 Человек понимает, что a × b = взять a b раз = a_1 + a_2 + … + a_b. Вы можете сказать что не все люди это понимают, однако они запоминают алгоритм того же умножения в столбик и решают.

Люди, даже с высшим образованием с простыми математическими задачками из трёх цифр не справляются, если заранее ответа не знают.

Вот банальная задачка, которая легко в уме должна решаться на сложение:

Три мальчика скинулись по 10рублей на гитару, но продавщица сказала что она стоит 25 и послала мальчика чтобы тот догнал их отдал им 5 рублей, но мальчик дал каждому по 1 рублю ,а себе оставил 2 рубля. Значит каждый мальчик потратил 9рублей: 9*3+2рубля у мальчика который догонял=29. Вопрос где ещё 1 рубль?

Отличить Луну от сигнала светофора, чтобы это стабильно работало в незнакомых ситуациях.

Я не смогу что-то новое написать. Можно привязаться к наличию контура самого светофора (не всегда поможет в полной темноте), лазерный дальномер добавить для измерения расстояния. Тесла экономит деньги, такчто для неё это нерешаемая проблема, а искать альтернативные пути ей запрещено.

(можно заметить, например, что в этом описании нет продавца)

Пока он его не видит, увидит будет думать, нужен ли он ему.

В вашем планировании действий появилось "найти цельнозерновой хлеб", хотя нигде в задаче это не озвучено. У вас течет контекст, а вы этого не видите.

Да, использовал старый чат, где в начале ставилась цель про цельнозерновой. Вы до несущественных мелочей докапываться будете или предметно обсуждать? Мне тут деньги не платят за это.

...оплатить какие покупки? В вашем плане потерялся шаг, но ни вас, ни вашего робота это не волнует.

План не должен быть полный, важен следующий шаг. После его выполнения будем планировать заново.

Это не картинка пекарни, это картинка прилавка. Реальная картинка из пекарни содержит намного больше объектов. При этом в вашей инструкции к этой картинке есть подсказки "ты в булочной у прилавка". Но откуда эта информация возникнет в реальном мире?

Картинку распознали. Отдаём её роботу. https://chatgpt.com/share/1898d56e-c14b-47bf-8fee-4655e6f015bd

Входные данные с CV модуля:

{ “objects”: [ “display case with various baked goods”, “assortment of cakes”, “hanging lamps”, “menu board with text”, “people standing in line”, “wooden counter” ] }

Hidden text

Алгоритм действий:

  1. Инициализация задачи:

    • Главная цель: "Купить хлеб и чего-нибудь к кофе."

  2. Анализ текущей ситуации:

    • Видимые объекты:

      • “display case with various baked goods”

      • “assortment of cakes”

      • “hanging lamps”

      • “menu board with text”

      • “people standing in line”

      • “wooden counter”

  3. Декомпозиция цели:

    • Найти хлеб.

    • Найти что-нибудь к кофе.

    • Оплатить покупки.

    • Вернуться домой.

  4. Приоритизация задач:

    • Важное: найти хлеб и что-нибудь к кофе.

  5. Планирование действий:

    • Подойти к витрине с выпечкой.

    • Найти цельнозерновой хлеб.

    • Найти подходящий продукт к кофе (например, торт из ассортимента).

    • Встать в очередь.

    • Оплатить покупки на деревянной стойке.

  6. Выполнение действий:

    • Подойти к витрине с выпечкой.

    • Идентифицировать цельнозерновой хлеб среди выпечки.

    • Идентифицировать подходящий продукт к кофе среди ассортимента тортов.

  7. Анализ текущей ситуации:

    • Проверить наличие цельнозернового хлеба и выбранного продукта к кофе.

    • Если цельнозернового хлеба нет, выбрать другой хлеб.

    • Если продукт к кофе не найден, выбрать другой из меню или ассортимента.

  8. Продолжение плана:

    • Встать в очередь к деревянной стойке.

    • Оплатить покупки.

    • Вернуться домой с покупками.

Проверка действий:

  1. Идентификация хлеба и продукта к кофе:

    • Осмотреть витрину с выпечкой и идентифицировать цельнозерновой хлеб.

    • Осмотреть ассортимент тортов и выбрать подходящий продукт к кофе.

  2. Выполнение покупок:

    • Встать в очередь к деревянной стойке.

    • Оплатить покупки, следуя стандартной процедуре (передать деньги или использовать карту).

  3. Возвращение домой:

    • Выйти из магазина и направиться домой с покупками.

Hidden text

В этом и проблема - это упрощенное описание мира, а не реальное.

Вот вам реальное, даже в формате JSON. Не так много, но достаточно понятно. Я просто кинул ему картинку, первую какую нашёл, наиболее похожую на реальную обстановку, которую может видеть робот.

Промт:

Представь, что ты CV модуль робота. На вход поступает изображение. Перечисли основные объекты с изображения. Дай ответ в формате JSON. Не пиши пояснений и комментариев.

{ “objects”: [ “display case with various baked goods”, “assortment of cakes”, “hanging lamps”, “menu board with text”, “people standing in line”, “wooden counter” ] }

Ссылка для проверки: https://copilot.microsoft.com/sl/Q6vJE9m0UC

Вы упускаете из вида маленькую деталь: "чат" ориентируется не по входным данным, а по вашим инструкциям.

Инструкции примитивные. Коммуникация "Объект тебе говорит"
И обстановка "Видишь объекты"

Это может поступать извне с CV модуля. Даже вы сами скинули картинку пекарни и бот понял, что с ней делать, понял что на ценниках названия изделий и цены.

Оснастка робота универсальным отмычечным манипулятором - задача на порядок легче, чем универсальная задача выхода из любой точки любой квартиры...

Это почему? Если робот хоть как-то может передвигаться, значит сможет обследовать квартиру, ЧатГПТ вполне способен сообразить применить стратегию поиска и открытия всех доступных дверей. В моих примерах он куда более сложные задачи решал. Он раз допёр, что есть окно, можно оценить высоту и спрыгнуть. Как это реализовать в механике - там куда сложнее.

Information

Rating
Does not participate
Location
Санкт-Петербург, Санкт-Петербург и область, Россия
Date of birth
Registered
Activity

Specialization

Project Manager, Product Manager
Lead
From 300,000 ₽
JavaScript
Node.js
Java