Как мне это все напоминает бум AR, когда статьи про световые поля, пространственные вычисления и другую ерунду от magic leap (привлекшей тогда 2 млрд$ на обещания), google их преувеличенным маркетингом google glass, и куча других подобных пиаров. Более сотен стартапов делающих очки, огромные инвестиции, обещания. Ещё больше тех, кто делал будущий софт, притянутый за уши в этой сфере.
Затем VR и крипта. Сейчас время нейронок и все 1 в 1. При этом все перечисленное важно, но настолько переоценено.
Не будет в нейронках ни завтра, ни через 5 лет бегающих разумных, да даже виртуальных систем.
Тех, кто ни разу не пытался понять, что делают сетки, в чем их проблема. Как делает мозг, почему отличается и в чем. Будут как и в прошлом кричать о новой эре.
Я сейчас шаг шагом, разбираю в чем отличие конкретных сеток и зон мозга, чтобы изменить архитектуру. И сложность даже не только в понимании (сейчас накоплено много исследований, на основе которых мы можем понять и трансформеры как аналогию и разобрать разные реальные зоны мозга на архитектуры), а том что очень много разных важных функций. Для примера распознавание речи. Сейчас из всей цепочки по сути реализовали зоны слуховой коры и то криво. А в реальности, при разборе зон мозга мы видим, что сначала спектр делиться на интервалы. Дальше кохлейное ядро работает с интенсивностью, чтобы выделить паузы, динамику интенсивности, и другие мелочи. При этом две зоны (сетки), где одна быстрая простая для низких частот и другая немного сложнее для верхних частот (чтоб детализировать интенсивность, для эхолокации например или других моментов). Затем зоны определение звука в пространстве и так далее. Где уже в систему распознавания приходит сигнал с множеством доп информации о положении, ритме, темпе, паузах, интенсивности, типе звука и так далее. Что позволяет распознавать речь в шуме, выделять ее, отличать качественно. А ни как сейчас Whisper, шаг в сторону и перестал работать.
Я часто слышу, что можно продавить мощностями и деньгами. Нет, нельзя! Мозг все равно придется включать и пытаться разобраться. Поэтому тут прежде всего требуется кропотливо изучать и переносить. А это долго, требует времени прежде всего , а не денег. И на сегодня это почти не делают.
Можно потратить триллион долларов, скормить всю информацию в мире и выхлоп будет 0.
Текущие LLM прежде всего показали, не свой интеллект. Он у них низкий, так как построен на частотной выборке слов + механизмов внимания усиления связей между частотными словами. В нем нет на сегодня ни пространственного абстрагирования, ни реальной модели кратковременной памяти. Так вот, текущие LLM на самом деле показали, что в среднем интеллект людей очень низкий и за несколько тысяч лет развился слабо.
Не может абстрагировать и не могут такое составить, так как для этого надо понимать с чем сравнивать. В этом и есть смысл абстрагирования, когда ты видишь общие закономерности например на уровне физики и биологического процесса и на молекулярном уровне. Нейронки на трансформерах по своей природе не могут это сделать.
Можно сколько угодно приводить бенчмаркеров. Сама архитектура трансформеров последовательная, как язык, так как речь последовательная.
Абстрагирование это пространственное восприятие, которое досталось нам от зрения. Которое не последовательно, а пространственное и связывает разные события друг с другом.
Я на днях мучился с паузами речи, пытаясь с помощью них сделать какую то оценку о языке. Все разбилось, так как в итоге после долгих мучений, заметил что паузы образуют языковой граф с разным уровнем детализации речи. Это схоже с графом детализации у зрения. Но есть одно важное отличие, речь последовательная и граф там тоже, механизм внимания перемещается между узлами чтобы либо найти смысл, эмоциональное выражение, слова, слоги, общение, бит. В то время как у зрения этот граф сложнее, он не последовательный а пространственный (близко к swin сеткам зрения).
Так вот абстрактное мышление , связано с пространственным представлением сеток. У llm в основе трансформеры - это речь, с последовательным представлением связей в виде текста. И хоть агенты, хоть триллион параметров не сделают из llm трансформеров - пространственную модель. Тут надо усложнять архитектуру сеток.
Как инструмент llm прекрасны, дополняют разработку, делает некоторые простые черновые вещи. У них есть предел, хоть с агентами, хоть без агентов. Он прежде всего связан с архитектурной, основой этих llm.
Я сейчас переношу некоторые части мозга, под их аналог на нейронках. Там такая лютая дичь на запросы. Для того, кто не понимает, что он выдал, кажется круто, попросил и написал. А когда ты понимаешь, то это ужас. Причем дело не в ТЗ, так как описание на основе исследований он неплохо обобщает. (Вот обобщает текст, llm достаточно хорошо, хотя тоже главное не перестараться). Но вот абстрактно перенести идеи из одной области на другую. Тут тупик.
С агентом или без, современные llm не умеют абстрагировать и следовательно связывать закономерности и события двух разных областей. Это уже графы, пространственные сравнения, а текущие llm это последовательный набор данных. Вы их хоть миллионов агентов обвешайте, проблему это не решит. Так как нужны изменения на уровне архитектуры. Агенты это просто разные специализированные llm или набор знаний или действий. Это совсем не решает указанной выше проблемы.
Как инструмент отличные, но из джуна не сделают сеньора. Скорей, сделают человека, который думает что он сеньор.
Столько раз уже слышал про это. LLM отчасти помогают с небольшими фрагментами. НО очень часто жестко тупят и если ты не понимаешь, что они пишут, то.. Выше один из примеров... N-ая неудачная попытка в ChatGPT сегодня в течении дня. Где он мне написал полную охинею в ответе. Самый шик был сегодня, когда я ему написал, что это бред и нужно сконвертировать весь код, который я ему написал. Он в ответ начал писать на Python какую то дичь. Какой к черту Python, когда даже слово такого в чате не было, а в запросе было конвертировать MS SQL скрипт в PostgreSQL.
Так же, когда я написал, что он выкинул часть кода после конвертации (на другой запрос), он в ответ начал вставлять CREATE TABLE придумывая, какие могли быть таблицы в этом большом запросе. А в целом, я часто вижу такое: --- название поля ... и что тут будет. ЧТО? тебя просили сконвертировать, а не написать комментарий, где дальше сам код убран и написано что тут надо будет дописать его мне.
Ок, я понимаю, что он делает и вижу его ошибки. Могу разбить на множество частей, или те части с которым он не справляется сделать сам. А как вы предлагаете это делать Джуну, чтобы стать Сеньором? Это кстати относится ко всем, кто хвалит LLM и что они заменят разработчиков. Что вы там пишете такого, что вас могут заменить?
Тут на хабре была статья, как помню кто-то писал что делают Nocode для отчетов, где генерируется SQL по скормленной базе. Серьезно? Чтобы на сложных запросах, сложнее нескольких select и join он написал полнейшую пургу с "... тут должен быть код" (что в итоге выполниться возможно, но даст совсем другой результат).
И это я описал мизерную часть. Там LLM до полноценной разработки, как суслику до кроманьонца. Не ужели есть такая работа, где LLM за разработчика может написать нормальный код и ему за это платят большие деньги? Где она такая? Назовите компания)
Спасибо, про зрение почитаю больше, так как в численность не лез там. Но как раз сейчас столкнулся с тем, что на уровне механизма внимания в префронтальной коре используется закон Вебера для звука. Дело в том, что паузы не делятся четко на слоги, слова. выделение слов, дыхание и т.д. По сути мы получаем граф, в котором ветки между более крупными паузами включают в себя то что между более мелкими. А механизм внимания, просто перемешается по уровням узлов графа, обращая внимание либо на выделение ярких слов, или слов. или общего смысла. Так как узлы не идеально будут совпадать, то мозг тогда не сможет понять какие узлы находятся на одном и том же уровне. И тут на как раз закон Вебера, определяющий не точное значение, а интервал вокруг. Чем паузе меньше, тем интервал вокруг уровня внимания меньше, чем паузы больше - тем уровень механизма внимания поднимается выше и ширина интервала увеличивается (например разброс пауз дыхания больше). И подобное, явно наблюдается у зрения, тот же граф , где механизм внимания префронтальной коры переходит либо к мелкому уровню детализации в графе (рассматривает мазок картины) либо более верхнем (где видит что это картина).
Но вот про счет, не смотрел подробно. Надо будет более детально изучить.
Я с этим не спорю. Речь просто про то, что у нас организм выстроен таким образом, что это все стоит учитывать. Можно упростить, но тогда возникают ограничения. Что касается нейронок, то на самом деле там так же, общие механики копируются. И постепенно обрастает теми же деталями в плане механик. То что реализовано по разному - то форма подстраивается по среду, если среда электронная то и форма реализации будет такой, а если органическая то так же. Как язык, звуки у разных языков разные, но при абстрагировании получаем те же элементы слова предложения и т.д.
Любой подход начинает с упрощения. Так что я не спорю. Это самая оптимальная практика.
Не совсем худождественное. Картина основана на автобиографическом романе Коринны Хофман «Белая масаи»[нем.], повествующем о браке швейцарки и воина из племени масаи. Да и таких случаев было не мало.
Исследований подобных было не мало. Разницы в интеллекте как раз не было, имеется ввиду развитие ребенка в другой среде изначально.
Почему же корреляция между размером мозга на сколько помниться была отлично установлена. Другое дело что тут еще роль играет плотность нейронов.
Насчет человека, прежде всего дело в том, что он заполнил всю планету не давая возможности другим видам развиваться. Например в эпоху динозавров, другим видам не было возможности полноценно развиться. Как только динозавры освободили нишу, началось бурное развитие других видов. Завтра вымрет человечество, ниша освободится, будет возможность развиться другим видам и через 100 тыс лет летучие мыши будут размером с человека или еноты, которые имеют сложный язык и все все предпосылки биологические к развитию. Или кто то еще, кто будет лучше адаптирован к новой среде.
Насчет одежды, то согласно антропологии, она была лишь у малых групп. а группы тогда были по 5-25 человек. И ученые больше склоняются что одежда пришла от неандертальцев, а кроманьонцы были без нее. При это неандертальцы считаются просто как узкий подвид (вроде чукчей живущих в маленькой части). И считается что неандертальцы были менее развитыми чем кроманьонцы, о того и вымерли (частично смешавшись с кроманьонцами, так как в генах людей всего ~2% неандертальцев).
Да, копировать мышечные сокращения смысла нет. Это с одной стороны. Как бы не вылезло это боком в другом. Дело в том, что пульсирующие сокращения играют важную роль в дыхании. Я когда реализовывал модель для речи, которая учитывает гормоны, сердце, дыхание и кучу всего, то вижу какую роль играет пульсация в дыхании. Дело в том, что у нас есть мешочки альвиольные в легких, которые покрыты капиллярами которые через диффузию газов обмениваются кислородом и углекислым газом, насыщая участок крови. При регулировании этого кровотока через пульс, кровь нормально насыщается кислородом и успевает отдать углекислый газ. Если пульса не будет, это означает что могут возникнуть проблемы с выводом углекислого газа, повышением кислотности крови, нехваткой кислорода.
В среднем при спокойном образе жизни, такое случается не часто. Но при обычном образе жизни, таких проблем будет выше крыши.
Так что при первом упрощении, пульсацию можно опустить. Но она играет важную роль в регулировки газом в легких и крови через диффузию. Так что пульсация играет важную роль. Выкинуть ее можно, но это сделает организм менее пригодным к различным условиям. Иначе нам и руки не нужны, можно ноги для этого использовать.
Так было про африканские племена. И да, им просто не нужно было больше чисел поэтому они были ограничены в этом. Суть была в том, что на тех исследованиях они не могли отличить какая куча вещей была больше, если куча вещей превышала их счетные возможности. Условно они видели что в одной 9 вещей, а в другой 7 вещей, но не могли сказать какая из этих куч больше, так как для этого надо по сути сосчитать кол-во вещей в них. Я об этом.
Сапольский в той лекции не делал выводов о доступности. Но безусловно, дело не в биологическом уровне развития. Был отличный фильм "Белая массая" (по моему так), когда одна женщина из Британии (по моему) дернуло жить с массаями и родить. Выдержала она года 2 по-моему и потом уехала с ребенком. И тот отлично развит, разницы нет. Поэтому прежде всего окружение и знания при начальном обучении играют первостепенную роль. Если изначально в детском возрасте их не заложить, то потом уже легко получит детей "маугли", которым будет сложно даже начать говорить, не то что считать.
В целом у некоторых африканских народов мозг чуть больше по моему (сейчас не вспомню опровергли это исследование или нет, одни говорят что опровергли, другие что нет). И некоторые высказываются что мозг стал меньше, и деградировал. Если это не так, то за 30 тыс лет он и не увеличился. Что говорит больше о том, что дело в передаваемой с детства ребенку информации и обучении и среде его обитания.
Так что базовая у них не отлично. На сколько я помню из антропологии, то наш мозг за последние несколько тысяч лет не менялся. Просто понятие интеллект это не про цифры и текст (это все знания и опыт), а интеллект про умение решать задачи в своей среде. В тех же джунглях, городе, на острове... И бросив современного человека в джунгли, легко окажется что интеллекта там особо и нет. И абстрактно решать задачи, чтобы выжить и приспособиться вероятно смогут не так много людей.
Но конечно биология играет важную роль. Шимпанзе поместив к людям в городскую среду, хоть и даст прирост интеллекта, но он будет ограничен их биологией.
Надо отметить, что искусственное сердце с таким функционалом это конечно огромный шаг вперёд, но пока сильный костыль который позволяет поддержать жизнь на определенном уровне. Слишком много побочек, чтобы хватало только гонять кровь.
Сразу скажу, что искусственное сердце это очень крутой шаг вперёд. Но все равно придется в итоге делать тоже самое, что и реальное сердце. Я про механизм. Иначе любой шаг влево или вправо и тромбоз или кирдык.
Зависимость от артериального давления. Что то поели не то, давление скакануло, а сердце не подстроилось
Гормональные колебания. Сильные эмоции, будь то радости, страха или депрессии и отсутствие реакции на эти изменения может легко привести к смерти
Регулирование ЧСС нервной системой. Например, в крови много углекислого газа (воздух грязный) и надо чаще дышать для вывода co2. А ЧСС не увеличивается и кирдык.
Решил дополнить и раскрыть ваш ответ в более развернутый.
На уровне нейробиологии это как раз степень развития лобных долей, которые позволяют переключаться между глобальными маршрутами (идущие через несколько зон мозга) и локальными маршрутами (в рамках одной зоны). Лобные зоны регулируют поведение. Локальные маршруты это короткие простые, увидел еду и схватил. Глобальные маршруты - это увидел еду, оценил, что выгоднее, схватить ее сейчас или подождать.
Для слабо развитых лобных долей, доминирует лимбическая система, которая с помощью кортизола ослабляет лобные доли и сигнал идёт по локальным маршрутам. То есть животное схватит еду, как только видит ее.
Поэтому, как правильно вы заметили, самообладание это как раз сильно развитие лобные доли у животного. Это означает, что у него уже есть сильные когнитивные способности, то есть сильно развиты лобные доли и глобальные маршруты, которые формируют сложное поведение. При отсутствии самообладания, результат действия животного будет локальный маршрут (то есть лимбическая система доминирует).
Тот же эксперимент с Зефиром и детьми отлично это демонстрирует, так как лобные доли ещё не развиты. Поэтому ни о каком самообладании не может идти и речи. У человека они окончательно формируются позже всех зон, к 25 годам.
Я к тому, что самообладание очень много может рассказать об интеллекте и развитии мозга.
Да, Whisper с одной стороны уделывает. С другой, когда я смотрю исследования психоакустики, лингвистики и других, я вижу несколько проблем
1) попытка просто в лоб реализоват биологические вещи. Например тот же Синтез речи — Сорокин В.Н, где идет попытка описать работу голосового тракта через поршни и прочие вещи, чтобы воспроизвести вибрации голосовых связок.
2) исследования, которые чаще всего можно выкинуть. Как например исследования влияния формант на эмоции или изучение фонем. Ни кто не полез глубже. Нейробиологам это не так интересно, а те кто изучают уровень абстракции выше не лезут глубже.
Например, не так давно анализировал речь на низком уровне и выяснилось что никаких фонем нет, это неправильное толкование. Точнее звуки есть, но не такие как принято в фонемах. например звук МА, ЛА, как и отдельные М, Л и т.д. В фонемах их нет. А многие в нейронках до сих пор пытаются использовать фонемы, и это зло.
Про эмоции вообще молчу. Там добрую часть научных статей можно смело выкинуть в мусор, так как при проверке оказывается, что описанное в них притянуто за уши.
Но почему важно разбирать на уровне биологии? Потому что тот же Whisper очень паршиво работает в реальных условиях. Он не способен справляться с шумами, качественно следить на конкретным спикеров и т.д. В нем реализована лишь часть биологии. И безусловно ASR можно значительно улучшить, как раз за счет того что мы знаешь о работе слуха. А он на сегодня изучен прекрасно, вплоть до какие типы нейронов (а каждый вид можно сопоставить с топологией сеток) в слоях слуховой коры и в каком слое. Как они связаны. Как изначально происходит обработка звука слухом, как разные зоны помогают уловить все это, убрать шумы и т.д.
И почему то этого я как раз не вижу. Я не вижу, чтобы реально кто то использовал в своих работах эти знания.
Чем больше смотришь исследований, тем больше начинаешь задаваться вопросом. Правильно ли они поставлены? Ведь если взять рандомно человека, и оценить его способности, то можно получить низкий интеллект алкоголика и высокий интеллект какого то профессора. Так как боюсь, что развитие интеллекта у вида имеет что то схожее к нормальному распределению. И кого из этого списка мы взяли не ясно, нужно сотни повторяющихся экспериментов, а не десяток.
Кроме того, как оценивать особь? Допустим человека выкинуть в джунгли, он там помрет через несколько дней. Значит ли это, что интеллект человека низкий, раз он не смог выжить не в своей среде? Или мы оцениваем не интеллект, а уровень знаний? Не стоит ли оценивать интеллект относительно среды обитания, а не сравнивать с человеком. Да и смотря, как многие люди ведутся на мошенников, начинает казаться, что некоторые вороны имеют более крутой интеллект по сравнению с ними, так как способны обманут некоторых людей.
На самом дело, у человека умение считать кол-во предметов не врожденное.
По-моему в лекциях Роберта Сапольского как раз были два примера племен которые живут сейчас (точно не помню то ли оба в Африке, то ли одни в Африке а другие в Австралии), которые умеют считать до 3 и 5 или 5 м 7 (точно не вспомню) соответственно. Так как им больше и не нужно. Тл есть больше этого числа у них в языке идет понятие - много, куча. Оно ограничивает их мышление.
Раскладывали две кучи вещей, и пока в двух кучах число вещей не превышало число до которого они умеют считать они могли сказать в какой куче вещей больше. Но когда кол-во вещей в кучах превышало максимальное число, которое есть в их понимании, то эти люди не могли сказать в какой куче больше вещей.
Так что без должного обучения и передачи знаний, боюсь что человек не далеко ушел от животных (если вообще ушел).
Я понимаю, слепой энтузиазм и непонимание, как ведут себя различные зоны мозга, позволяет мечтать. Ни сколько не приуменьшаю LLM, так же как интернет, и множество других достижений. Но пока там до AGI далеко. Ведь тогда и поисковик можно в назвать в какой то мере AGI, в нем есть вся информация и он ее выдает по запросу, но в более хаотичном виде.
А так, полный игнор работы мозга, нейробиологии, речи, вокализации, почему именно так работает и тд.
Пересмотрел все лекции ребят Яндекс по сеткам. Не увидел ни одной попытки понять, разобраться почему так работает. Нельзя оторвать тему llm от мозга. Язык и последовательности сформировались так не из вакуума. Они изначально были завязаны на биологии, будь то кол-во слов на паузах, или построение речи.
Возьмём для примера трансформеры:
Механизм внимания, это модулятор работающий подобно лобным долям, который под действием важной информации (например, дофамина, норадреналина) усиливает или ослабевает связи на глобальных и локальных маршрутах. Где кортизол играет роль переключателя между локальными и глобальными маршрутами. Тоже происходит в ллм, только на сегодня очень упрощённо. И подобные механизмы есть на разных участках.
Byte per encoding - коснусоидное и синусоидное кодирование позиции "слова" в ллм, тоже самое делает мозг через Альфа, бета, гамма ритмы после зоны Брока. Схожее делает unigramm, только через закон Ципфа на более абстрактном уровне.
Само подобие - в теорию хаоса, так как нейроны являются странными аттракторами и их производные тоже должны обладать само подобием на верхнем уровне.
И многое другое. Вы можете хоть скормить абсолютно все данные вселенные, но получите на выходе отличный поисковик способный быстро обобщать данные. Вы понимаете, что в текущих архитектурах нет ни локальных глобальных маршрутов на уровне модели, ни реализации архитектуры абстрагирования, ни реализации архитектуры отделения себя от остального (теменная зона), ни ведение хронологических цепочек текущих событий (гиппокамп), ни удержание и связь текущего контекста и общих данных (механизм внимания префронтальная кора), ни связи событий (энторинальная кора).
Да что уж там, где нормальная реализация хотя бы слуховой коры, которая способна слышать в шумной части. Хотя там то изучено все.
Даже близко не аналог кратковременной человеческой. От слова совсем, кратковременная гораздо сложнее чем текущие трансформеры. Так же, как и на долговременную он похож лишь частично. Небольшая часть.
Положительные эмоции ни куда не деваются. Но базовые генные паттерны не подразумевают положительных эмоций, они не нужны для выживания особи на начальных этапах, ведь там главное испугаться и тревожиться, а так же усилиться внимание. Все остальное уже идет на более высоком уровне и является цепочкой.
Для примера смех. Из палеонтологии мы знаем, ужас и смех - это близкие последовательности и на уровне мимики и реакции. Когда рядом происходит что-то непонятно, первая реакция это испуг и как-то защититься. Чтобы защититься, хорошо бы в ответ напугать того, кто пугает вас. Чтобы продемонстрировать свою реакцию. Для этого надо разинуть пасть пошире, оскалить клыки, растопырить глаза, поднять шерсть дыбом и громко заорать. Тогда может быть противник не станет нападать. Но в последующем может оказаться, что опасность мнимая и ерунда.
И момент осознания этого, это удивление, когда мы соображаем (амигдала в лимбической системе распознает опасность). В этот момент рот разевается, но так как процесс прерывается, то мы прекращаем этот процесс и он не до конца разевается. Клыки обнажаются чуть чуть, глаза уже немного растопырены, шерсть дыбом, но все по не многу, так как процесс был прерван. И мы удивляемся. А если вдруг оказывается, что то нам показалось опасностью вообще не опасность. То процесс проявления реакции на опасность уже сильный, и поэтому мы перенаправляем эту энергию в другую сторону. Тогда рот открывается не по вертикали, а начинает растягиваться по горизонтали. Клыки при этом не обнажаются, потому что нам не нужно никого пугать. Глаза начинают прищуриваться обратно. И поэтому звук, который мы начали уже издавать из себя становится прерывистым, так как поток воздуха идет через ротовую щель и мы пытаемся приостановить поток воздуха (чтобы и другие не сочли наши действия что мы агрессивные). Если мы замерим мускулатуру мышц, то обнаружим что одни и те же мышцы начинают работать синхронно в обоих случаях, только отличается продолжение. Особенно характерно, что это видно у маленьких детей и детенышей. И поэтому ребенок пока еще не знает что опасно и что неопасно, он очень быстро переключается между плачем и смехом. Иногда это дает сбой и человек видит что то страшное и ужасное и начинает сильно смеяться, потому что его лимбический аппарат допустил ошибку и распознал опасность как не опасную. Так и наоборот, когда опасности нет, но мозг не разобрался и начинает дико пугаться.
Прерывается не сам процесс работы мышц, а скорее самая эмоция. Так как был страх, обнаружили что опасности нет, и чтобы уже запущенный процесс открытия рта и звука другие не сочли за агрессию, проявление должно быть не походим на агрессию. Из легких уже начинает выходить большой поток воздуха, ведь изначально мы хотели напугать в ответ. Остановиться мгновенно мы это не можем, поэтому нам надо
1) изменить мимику лица, но так чтобы она отличалась от мимики агрессии и другая особь не решила что это агрессия. Но при этом, дать потоку воздуха выйти из легких, выдохнув, поэтому мы должны открыть рот. Раз мы не можем открыть его вертикально (другая особь может перепутать с агрессией), мы делаем это горизонтально (в этом случае перепутать уже нельзя).
2) поток воздуха, мы одновременно либо пытаемся остановить выдавая его порциями. Либо пытаемся сделать его выход максимально не похожим на выдыхание при агрессии. Либо из за голосовых связок, которые вместо планового агрессивного крика перекрывают поток воздуха, который периодически под давлением легких прорывается через них. Что напоминает рывки. Не выпускать воздух мы тоже не можем, так как это наполненная грудь больше похоже на воинственный посыл, но и выпустить сразу весь воздух не издав какой то звук мы тоже не можем чтобы его не перепутали с агрессией, поэтому воздух будет выходить максимально не похожим на другие звуки.
Важно, не обязательно воздух будет выходить таким образом. Так как это крайний случай поздней реакции. Если же неопределенность/опасность была быстро распознана как неопасность, то и реакция будет меньше. Например, только в виде улыбки без выдоха потока воздуха или прищуренных глаз. Или же настройкой голосового аппарата, когда голос будет слегка отличаться.
И это один из примеров нарастания эмоций на основе базовых - это неосознанное избегание агрессии. И данный механизм избегания агрессии происходить автоматически. Иначе любая реакция будет всегда приводить к агрессии. И это будет означать цепную реакцию агрессии в обществе, что в итоге приведет к его вымиранию.
Большинство эмоций это вообще субъективное понятие и они возникают только на высшем уровне, за счет понимания сказанного контекста. Например, тут я показывал что на речевом уровне многие из них одинаковые. https://t.me/greenruff/1855 На биологическом за счет перенаправления, прерывания гормональных всплесков (сюда же входят и нейротрансмиттеры), когда организм пытается стабилизировать ситуацию. Все сложнее конечно, так как в той же музыке огромную роль играет на сколько она попадает под "гамматон фильтры" слуха (интервалы) человека, на сколько человек может предсказать дальше мелодию (слишком сильно может - не интересно будет, не может совсем предсказать - жанр не будет нравиться).
Поэтому тут нельзя в двух словах описать. Про боль при слухе и обратное чуть чуть затрагивал тут https://t.me/greenruff/1872 Для пример разбор одного из базовых про-эмоций (я называю их генными, так как они предопределены биологически и прошиты в генах) https://t.me/greenruff/1895
Напишите кто то статью, где с помощью LLM мигрируете запросы SQL с mssql в postgres со всеми триггерами, процедурами и тд. Я постоянно использую chstgpt, сбер и другие llm, чтобы облегчить себе задачи в разработке.
Простые вещи решает отлично. Но что то сложнее и там полная ж... Будь это конвертация функций с одного фреймворка на другой, или где требуется подумать как можно сделать. И самое ужасное, что они пишут правдоподобно и если не перепроверить то проблема вылезет потом. Сделать функцию по формуле, по описанной блок схеме - да, ок. Прописать настройки, сохранить , загрузить данные из файла, сделать примитивные запросы, выдать инфу из доков.
Люди, которые довольны LLM и считают что они заменят. Напишите статью, я реально хочу понять, какие вы задачи решаете что llm отлично справляется и экономит время.
LLM отличный инструмент для облегчения ряда задач. Но даже при написании игры чуть сложнее арканоида, она уже начинает тупить.
С болью все ещё интереснее. У нас весь слух по сути построен на боли. Точнее на воздействии сигнала на волоски. При увеличении частоты звука и более узкий диапазон сигнала (как скрежет металла) и интенсивности, возникает уже боль.
Для примера крик. Там возникают болевые сигналы волосков и параллельно вырабатываются опиоидные гормоны, чтобы не было ощущения боли до какого то момента. И при определенных интерпретациях сигнала мозгом, останется только эффект опиодов. И будет ощущение радости, а в другом боль возьмёт свое. Именно поэтому некоторые мазохисты любят когда на них кричат, так как у них нарушен/обострена реакция на звук и опиодных гормонов выбрасывается очень много.
У нас вообще изначально нет положительных эмоций. Только те что являются сигналом об опасности через тревогу и боль. А все остальные возникли как наслоение на них, чтобы показать обратную реакцию. Так злобный крик превращается в смех. Но в основе, все та же боль. Это универсальный сигнальный механизм у нас для всего, просто пока она не сильная не ощущаем.
Как мне это все напоминает бум AR, когда статьи про световые поля, пространственные вычисления и другую ерунду от magic leap (привлекшей тогда 2 млрд$ на обещания), google их преувеличенным маркетингом google glass, и куча других подобных пиаров. Более сотен стартапов делающих очки, огромные инвестиции, обещания. Ещё больше тех, кто делал будущий софт, притянутый за уши в этой сфере.
Затем VR и крипта. Сейчас время нейронок и все 1 в 1. При этом все перечисленное важно, но настолько переоценено.
Не будет в нейронках ни завтра, ни через 5 лет бегающих разумных, да даже виртуальных систем.
Тех, кто ни разу не пытался понять, что делают сетки, в чем их проблема. Как делает мозг, почему отличается и в чем. Будут как и в прошлом кричать о новой эре.
Я сейчас шаг шагом, разбираю в чем отличие конкретных сеток и зон мозга, чтобы изменить архитектуру. И сложность даже не только в понимании (сейчас накоплено много исследований, на основе которых мы можем понять и трансформеры как аналогию и разобрать разные реальные зоны мозга на архитектуры), а том что очень много разных важных функций. Для примера распознавание речи. Сейчас из всей цепочки по сути реализовали зоны слуховой коры и то криво. А в реальности, при разборе зон мозга мы видим, что сначала спектр делиться на интервалы. Дальше кохлейное ядро работает с интенсивностью, чтобы выделить паузы, динамику интенсивности, и другие мелочи. При этом две зоны (сетки), где одна быстрая простая для низких частот и другая немного сложнее для верхних частот (чтоб детализировать интенсивность, для эхолокации например или других моментов). Затем зоны определение звука в пространстве и так далее. Где уже в систему распознавания приходит сигнал с множеством доп информации о положении, ритме, темпе, паузах, интенсивности, типе звука и так далее. Что позволяет распознавать речь в шуме, выделять ее, отличать качественно. А ни как сейчас Whisper, шаг в сторону и перестал работать.
Я часто слышу, что можно продавить мощностями и деньгами. Нет, нельзя! Мозг все равно придется включать и пытаться разобраться. Поэтому тут прежде всего требуется кропотливо изучать и переносить. А это долго, требует времени прежде всего , а не денег. И на сегодня это почти не делают.
Можно потратить триллион долларов, скормить всю информацию в мире и выхлоп будет 0.
Текущие LLM прежде всего показали, не свой интеллект. Он у них низкий, так как построен на частотной выборке слов + механизмов внимания усиления связей между частотными словами. В нем нет на сегодня ни пространственного абстрагирования, ни реальной модели кратковременной памяти. Так вот, текущие LLM на самом деле показали, что в среднем интеллект людей очень низкий и за несколько тысяч лет развился слабо.
Не может абстрагировать и не могут такое составить, так как для этого надо понимать с чем сравнивать. В этом и есть смысл абстрагирования, когда ты видишь общие закономерности например на уровне физики и биологического процесса и на молекулярном уровне. Нейронки на трансформерах по своей природе не могут это сделать.
Можно сколько угодно приводить бенчмаркеров. Сама архитектура трансформеров последовательная, как язык, так как речь последовательная.
Абстрагирование это пространственное восприятие, которое досталось нам от зрения. Которое не последовательно, а пространственное и связывает разные события друг с другом.
Я на днях мучился с паузами речи, пытаясь с помощью них сделать какую то оценку о языке. Все разбилось, так как в итоге после долгих мучений, заметил что паузы образуют языковой граф с разным уровнем детализации речи. Это схоже с графом детализации у зрения. Но есть одно важное отличие, речь последовательная и граф там тоже, механизм внимания перемещается между узлами чтобы либо найти смысл, эмоциональное выражение, слова, слоги, общение, бит. В то время как у зрения этот граф сложнее, он не последовательный а пространственный (близко к swin сеткам зрения).
Так вот абстрактное мышление , связано с пространственным представлением сеток. У llm в основе трансформеры - это речь, с последовательным представлением связей в виде текста. И хоть агенты, хоть триллион параметров не сделают из llm трансформеров - пространственную модель. Тут надо усложнять архитектуру сеток.
Как инструмент llm прекрасны, дополняют разработку, делает некоторые простые черновые вещи. У них есть предел, хоть с агентами, хоть без агентов. Он прежде всего связан с архитектурной, основой этих llm.
Я сейчас переношу некоторые части мозга, под их аналог на нейронках. Там такая лютая дичь на запросы. Для того, кто не понимает, что он выдал, кажется круто, попросил и написал. А когда ты понимаешь, то это ужас. Причем дело не в ТЗ, так как описание на основе исследований он неплохо обобщает. (Вот обобщает текст, llm достаточно хорошо, хотя тоже главное не перестараться). Но вот абстрактно перенести идеи из одной области на другую. Тут тупик.
С агентом или без, современные llm не умеют абстрагировать и следовательно связывать закономерности и события двух разных областей. Это уже графы, пространственные сравнения, а текущие llm это последовательный набор данных. Вы их хоть миллионов агентов обвешайте, проблему это не решит. Так как нужны изменения на уровне архитектуры. Агенты это просто разные специализированные llm или набор знаний или действий. Это совсем не решает указанной выше проблемы.
Как инструмент отличные, но из джуна не сделают сеньора. Скорей, сделают человека, который думает что он сеньор.
Столько раз уже слышал про это. LLM отчасти помогают с небольшими фрагментами. НО очень часто жестко тупят и если ты не понимаешь, что они пишут, то..
Выше один из примеров... N-ая неудачная попытка в ChatGPT сегодня в течении дня. Где он мне написал полную охинею в ответе. Самый шик был сегодня, когда я ему написал, что это бред и нужно сконвертировать весь код, который я ему написал. Он в ответ начал писать на Python какую то дичь. Какой к черту Python, когда даже слово такого в чате не было, а в запросе было конвертировать MS SQL скрипт в PostgreSQL.
Так же, когда я написал, что он выкинул часть кода после конвертации (на другой запрос), он в ответ начал вставлять CREATE TABLE придумывая, какие могли быть таблицы в этом большом запросе.
А в целом, я часто вижу такое: --- название поля ... и что тут будет. ЧТО? тебя просили сконвертировать, а не написать комментарий, где дальше сам код убран и написано что тут надо будет дописать его мне.
Ок, я понимаю, что он делает и вижу его ошибки. Могу разбить на множество частей, или те части с которым он не справляется сделать сам. А как вы предлагаете это делать Джуну, чтобы стать Сеньором?
Это кстати относится ко всем, кто хвалит LLM и что они заменят разработчиков. Что вы там пишете такого, что вас могут заменить?
Тут на хабре была статья, как помню кто-то писал что делают Nocode для отчетов, где генерируется SQL по скормленной базе. Серьезно? Чтобы на сложных запросах, сложнее нескольких select и join он написал полнейшую пургу с "... тут должен быть код" (что в итоге выполниться возможно, но даст совсем другой результат).
И это я описал мизерную часть. Там LLM до полноценной разработки, как суслику до кроманьонца. Не ужели есть такая работа, где LLM за разработчика может написать нормальный код и ему за это платят большие деньги? Где она такая? Назовите компания)
Спасибо, про зрение почитаю больше, так как в численность не лез там. Но как раз сейчас столкнулся с тем, что на уровне механизма внимания в префронтальной коре используется закон Вебера для звука. Дело в том, что паузы не делятся четко на слоги, слова. выделение слов, дыхание и т.д. По сути мы получаем граф, в котором ветки между более крупными паузами включают в себя то что между более мелкими. А механизм внимания, просто перемешается по уровням узлов графа, обращая внимание либо на выделение ярких слов, или слов. или общего смысла. Так как узлы не идеально будут совпадать, то мозг тогда не сможет понять какие узлы находятся на одном и том же уровне. И тут на как раз закон Вебера, определяющий не точное значение, а интервал вокруг. Чем паузе меньше, тем интервал вокруг уровня внимания меньше, чем паузы больше - тем уровень механизма внимания поднимается выше и ширина интервала увеличивается (например разброс пауз дыхания больше). И подобное, явно наблюдается у зрения, тот же граф , где механизм внимания префронтальной коры переходит либо к мелкому уровню детализации в графе (рассматривает мазок картины) либо более верхнем (где видит что это картина).
Но вот про счет, не смотрел подробно. Надо будет более детально изучить.
Я с этим не спорю. Речь просто про то, что у нас организм выстроен таким образом, что это все стоит учитывать. Можно упростить, но тогда возникают ограничения. Что касается нейронок, то на самом деле там так же, общие механики копируются. И постепенно обрастает теми же деталями в плане механик. То что реализовано по разному - то форма подстраивается по среду, если среда электронная то и форма реализации будет такой, а если органическая то так же. Как язык, звуки у разных языков разные, но при абстрагировании получаем те же элементы слова предложения и т.д.
Любой подход начинает с упрощения. Так что я не спорю. Это самая оптимальная практика.
Не совсем худождественное. Картина основана на автобиографическом романе Коринны Хофман «Белая масаи»[нем.], повествующем о браке швейцарки и воина из племени масаи. Да и таких случаев было не мало.
Исследований подобных было не мало. Разницы в интеллекте как раз не было, имеется ввиду развитие ребенка в другой среде изначально.
Почему же корреляция между размером мозга на сколько помниться была отлично установлена. Другое дело что тут еще роль играет плотность нейронов.
Насчет человека, прежде всего дело в том, что он заполнил всю планету не давая возможности другим видам развиваться. Например в эпоху динозавров, другим видам не было возможности полноценно развиться. Как только динозавры освободили нишу, началось бурное развитие других видов. Завтра вымрет человечество, ниша освободится, будет возможность развиться другим видам и через 100 тыс лет летучие мыши будут размером с человека или еноты, которые имеют сложный язык и все все предпосылки биологические к развитию. Или кто то еще, кто будет лучше адаптирован к новой среде.
Насчет одежды, то согласно антропологии, она была лишь у малых групп. а группы тогда были по 5-25 человек. И ученые больше склоняются что одежда пришла от неандертальцев, а кроманьонцы были без нее. При это неандертальцы считаются просто как узкий подвид (вроде чукчей живущих в маленькой части). И считается что неандертальцы были менее развитыми чем кроманьонцы, о того и вымерли (частично смешавшись с кроманьонцами, так как в генах людей всего ~2% неандертальцев).
Да, копировать мышечные сокращения смысла нет. Это с одной стороны. Как бы не вылезло это боком в другом. Дело в том, что пульсирующие сокращения играют важную роль в дыхании. Я когда реализовывал модель для речи, которая учитывает гормоны, сердце, дыхание и кучу всего, то вижу какую роль играет пульсация в дыхании. Дело в том, что у нас есть мешочки альвиольные в легких, которые покрыты капиллярами которые через диффузию газов обмениваются кислородом и углекислым газом, насыщая участок крови. При регулировании этого кровотока через пульс, кровь нормально насыщается кислородом и успевает отдать углекислый газ. Если пульса не будет, это означает что могут возникнуть проблемы с выводом углекислого газа, повышением кислотности крови, нехваткой кислорода.
В среднем при спокойном образе жизни, такое случается не часто. Но при обычном образе жизни, таких проблем будет выше крыши.
Так что при первом упрощении, пульсацию можно опустить. Но она играет важную роль в регулировки газом в легких и крови через диффузию. Так что пульсация играет важную роль. Выкинуть ее можно, но это сделает организм менее пригодным к различным условиям. Иначе нам и руки не нужны, можно ноги для этого использовать.
Так было про африканские племена. И да, им просто не нужно было больше чисел поэтому они были ограничены в этом. Суть была в том, что на тех исследованиях они не могли отличить какая куча вещей была больше, если куча вещей превышала их счетные возможности. Условно они видели что в одной 9 вещей, а в другой 7 вещей, но не могли сказать какая из этих куч больше, так как для этого надо по сути сосчитать кол-во вещей в них. Я об этом.
По вашим ссылкам почитаю.
Сапольский в той лекции не делал выводов о доступности. Но безусловно, дело не в биологическом уровне развития. Был отличный фильм "Белая массая" (по моему так), когда одна женщина из Британии (по моему) дернуло жить с массаями и родить. Выдержала она года 2 по-моему и потом уехала с ребенком. И тот отлично развит, разницы нет. Поэтому прежде всего окружение и знания при начальном обучении играют первостепенную роль. Если изначально в детском возрасте их не заложить, то потом уже легко получит детей "маугли", которым будет сложно даже начать говорить, не то что считать.
В целом у некоторых африканских народов мозг чуть больше по моему (сейчас не вспомню опровергли это исследование или нет, одни говорят что опровергли, другие что нет). И некоторые высказываются что мозг стал меньше, и деградировал. Если это не так, то за 30 тыс лет он и не увеличился. Что говорит больше о том, что дело в передаваемой с детства ребенку информации и обучении и среде его обитания.
Так что базовая у них не отлично. На сколько я помню из антропологии, то наш мозг за последние несколько тысяч лет не менялся. Просто понятие интеллект это не про цифры и текст (это все знания и опыт), а интеллект про умение решать задачи в своей среде. В тех же джунглях, городе, на острове... И бросив современного человека в джунгли, легко окажется что интеллекта там особо и нет. И абстрактно решать задачи, чтобы выжить и приспособиться вероятно смогут не так много людей.
Но конечно биология играет важную роль. Шимпанзе поместив к людям в городскую среду, хоть и даст прирост интеллекта, но он будет ограничен их биологией.
Надо отметить, что искусственное сердце с таким функционалом это конечно огромный шаг вперёд, но пока сильный костыль который позволяет поддержать жизнь на определенном уровне. Слишком много побочек, чтобы хватало только гонять кровь.
Сразу скажу, что искусственное сердце это очень крутой шаг вперёд. Но все равно придется в итоге делать тоже самое, что и реальное сердце. Я про механизм. Иначе любой шаг влево или вправо и тромбоз или кирдык.
Зависимость от артериального давления. Что то поели не то, давление скакануло, а сердце не подстроилось
Гормональные колебания. Сильные эмоции, будь то радости, страха или депрессии и отсутствие реакции на эти изменения может легко привести к смерти
Регулирование ЧСС нервной системой. Например, в крови много углекислого газа (воздух грязный) и надо чаще дышать для вывода co2. А ЧСС не увеличивается и кирдык.
Решил дополнить и раскрыть ваш ответ в более развернутый.
На уровне нейробиологии это как раз степень развития лобных долей, которые позволяют переключаться между глобальными маршрутами (идущие через несколько зон мозга) и локальными маршрутами (в рамках одной зоны). Лобные зоны регулируют поведение. Локальные маршруты это короткие простые, увидел еду и схватил. Глобальные маршруты - это увидел еду, оценил, что выгоднее, схватить ее сейчас или подождать.
Для слабо развитых лобных долей, доминирует лимбическая система, которая с помощью кортизола ослабляет лобные доли и сигнал идёт по локальным маршрутам. То есть животное схватит еду, как только видит ее.
Поэтому, как правильно вы заметили, самообладание это как раз сильно развитие лобные доли у животного. Это означает, что у него уже есть сильные когнитивные способности, то есть сильно развиты лобные доли и глобальные маршруты, которые формируют сложное поведение. При отсутствии самообладания, результат действия животного будет локальный маршрут (то есть лимбическая система доминирует).
Тот же эксперимент с Зефиром и детьми отлично это демонстрирует, так как лобные доли ещё не развиты. Поэтому ни о каком самообладании не может идти и речи. У человека они окончательно формируются позже всех зон, к 25 годам.
Я к тому, что самообладание очень много может рассказать об интеллекте и развитии мозга.
Да, Whisper с одной стороны уделывает. С другой, когда я смотрю исследования психоакустики, лингвистики и других, я вижу несколько проблем
1) попытка просто в лоб реализоват биологические вещи. Например тот же Синтез речи — Сорокин В.Н, где идет попытка описать работу голосового тракта через поршни и прочие вещи, чтобы воспроизвести вибрации голосовых связок.
2) исследования, которые чаще всего можно выкинуть. Как например исследования влияния формант на эмоции или изучение фонем. Ни кто не полез глубже. Нейробиологам это не так интересно, а те кто изучают уровень абстракции выше не лезут глубже.
Например, не так давно анализировал речь на низком уровне и выяснилось что никаких фонем нет, это неправильное толкование. Точнее звуки есть, но не такие как принято в фонемах. например звук МА, ЛА, как и отдельные М, Л и т.д. В фонемах их нет. А многие в нейронках до сих пор пытаются использовать фонемы, и это зло.
Про эмоции вообще молчу. Там добрую часть научных статей можно смело выкинуть в мусор, так как при проверке оказывается, что описанное в них притянуто за уши.
Но почему важно разбирать на уровне биологии? Потому что тот же Whisper очень паршиво работает в реальных условиях. Он не способен справляться с шумами, качественно следить на конкретным спикеров и т.д. В нем реализована лишь часть биологии. И безусловно ASR можно значительно улучшить, как раз за счет того что мы знаешь о работе слуха. А он на сегодня изучен прекрасно, вплоть до какие типы нейронов (а каждый вид можно сопоставить с топологией сеток) в слоях слуховой коры и в каком слое. Как они связаны. Как изначально происходит обработка звука слухом, как разные зоны помогают уловить все это, убрать шумы и т.д.
И почему то этого я как раз не вижу. Я не вижу, чтобы реально кто то использовал в своих работах эти знания.
Чем больше смотришь исследований, тем больше начинаешь задаваться вопросом. Правильно ли они поставлены? Ведь если взять рандомно человека, и оценить его способности, то можно получить низкий интеллект алкоголика и высокий интеллект какого то профессора. Так как боюсь, что развитие интеллекта у вида имеет что то схожее к нормальному распределению. И кого из этого списка мы взяли не ясно, нужно сотни повторяющихся экспериментов, а не десяток.
Кроме того, как оценивать особь? Допустим человека выкинуть в джунгли, он там помрет через несколько дней. Значит ли это, что интеллект человека низкий, раз он не смог выжить не в своей среде? Или мы оцениваем не интеллект, а уровень знаний? Не стоит ли оценивать интеллект относительно среды обитания, а не сравнивать с человеком. Да и смотря, как многие люди ведутся на мошенников, начинает казаться, что некоторые вороны имеют более крутой интеллект по сравнению с ними, так как способны обманут некоторых людей.
На самом дело, у человека умение считать кол-во предметов не врожденное.
По-моему в лекциях Роберта Сапольского как раз были два примера племен которые живут сейчас (точно не помню то ли оба в Африке, то ли одни в Африке а другие в Австралии), которые умеют считать до 3 и 5 или 5 м 7 (точно не вспомню) соответственно. Так как им больше и не нужно. Тл есть больше этого числа у них в языке идет понятие - много, куча. Оно ограничивает их мышление.
Раскладывали две кучи вещей, и пока в двух кучах число вещей не превышало число до которого они умеют считать они могли сказать в какой куче вещей больше. Но когда кол-во вещей в кучах превышало максимальное число, которое есть в их понимании, то эти люди не могли сказать в какой куче больше вещей.
Так что без должного обучения и передачи знаний, боюсь что человек не далеко ушел от животных (если вообще ушел).
Я понимаю, слепой энтузиазм и непонимание, как ведут себя различные зоны мозга, позволяет мечтать. Ни сколько не приуменьшаю LLM, так же как интернет, и множество других достижений. Но пока там до AGI далеко. Ведь тогда и поисковик можно в назвать в какой то мере AGI, в нем есть вся информация и он ее выдает по запросу, но в более хаотичном виде.
А так, полный игнор работы мозга, нейробиологии, речи, вокализации, почему именно так работает и тд.
Пересмотрел все лекции ребят Яндекс по сеткам. Не увидел ни одной попытки понять, разобраться почему так работает. Нельзя оторвать тему llm от мозга. Язык и последовательности сформировались так не из вакуума. Они изначально были завязаны на биологии, будь то кол-во слов на паузах, или построение речи.
Возьмём для примера трансформеры:
Механизм внимания, это модулятор работающий подобно лобным долям, который под действием важной информации (например, дофамина, норадреналина) усиливает или ослабевает связи на глобальных и локальных маршрутах. Где кортизол играет роль переключателя между локальными и глобальными маршрутами. Тоже происходит в ллм, только на сегодня очень упрощённо. И подобные механизмы есть на разных участках.
Byte per encoding - коснусоидное и синусоидное кодирование позиции "слова" в ллм, тоже самое делает мозг через Альфа, бета, гамма ритмы после зоны Брока. Схожее делает unigramm, только через закон Ципфа на более абстрактном уровне.
Само подобие - в теорию хаоса, так как нейроны являются странными аттракторами и их производные тоже должны обладать само подобием на верхнем уровне.
И многое другое. Вы можете хоть скормить абсолютно все данные вселенные, но получите на выходе отличный поисковик способный быстро обобщать данные. Вы понимаете, что в текущих архитектурах нет ни локальных глобальных маршрутов на уровне модели, ни реализации архитектуры абстрагирования, ни реализации архитектуры отделения себя от остального (теменная зона), ни ведение хронологических цепочек текущих событий (гиппокамп), ни удержание и связь текущего контекста и общих данных (механизм внимания префронтальная кора), ни связи событий (энторинальная кора).
Да что уж там, где нормальная реализация хотя бы слуховой коры, которая способна слышать в шумной части. Хотя там то изучено все.
Даже близко не аналог кратковременной человеческой. От слова совсем, кратковременная гораздо сложнее чем текущие трансформеры. Так же, как и на долговременную он похож лишь частично. Небольшая часть.
Положительные эмоции ни куда не деваются. Но базовые генные паттерны не подразумевают положительных эмоций, они не нужны для выживания особи на начальных этапах, ведь там главное испугаться и тревожиться, а так же усилиться внимание. Все остальное уже идет на более высоком уровне и является цепочкой.
Для примера смех. Из палеонтологии мы знаем, ужас и смех - это близкие последовательности и на уровне мимики и реакции. Когда рядом происходит что-то непонятно, первая реакция это испуг и как-то защититься. Чтобы защититься, хорошо бы в ответ напугать того, кто пугает вас. Чтобы продемонстрировать свою реакцию. Для этого надо разинуть пасть пошире, оскалить клыки, растопырить глаза, поднять шерсть дыбом и громко заорать. Тогда может быть противник не станет нападать. Но в последующем может оказаться, что опасность мнимая и ерунда.
И момент осознания этого, это удивление, когда мы соображаем (амигдала в лимбической системе распознает опасность). В этот момент рот разевается, но так как процесс прерывается, то мы прекращаем этот процесс и он не до конца разевается. Клыки обнажаются чуть чуть, глаза уже немного растопырены, шерсть дыбом, но все по не многу, так как процесс был прерван. И мы удивляемся. А если вдруг оказывается, что то нам показалось опасностью вообще не опасность. То процесс проявления реакции на опасность уже сильный, и поэтому мы перенаправляем эту энергию в другую сторону. Тогда рот открывается не по вертикали, а начинает растягиваться по горизонтали. Клыки при этом не обнажаются, потому что нам не нужно никого пугать. Глаза начинают прищуриваться обратно. И поэтому звук, который мы начали уже издавать из себя становится прерывистым, так как поток воздуха идет через ротовую щель и мы пытаемся приостановить поток воздуха (чтобы и другие не сочли наши действия что мы агрессивные). Если мы замерим мускулатуру мышц, то обнаружим что одни и те же мышцы начинают работать синхронно в обоих случаях, только отличается продолжение. Особенно характерно, что это видно у маленьких детей и детенышей. И поэтому ребенок пока еще не знает что опасно и что неопасно, он очень быстро переключается между плачем и смехом. Иногда это дает сбой и человек видит что то страшное и ужасное и начинает сильно смеяться, потому что его лимбический аппарат допустил ошибку и распознал опасность как не опасную. Так и наоборот, когда опасности нет, но мозг не разобрался и начинает дико пугаться.
Прерывается не сам процесс работы мышц, а скорее самая эмоция. Так как был страх, обнаружили что опасности нет, и чтобы уже запущенный процесс открытия рта и звука другие не сочли за агрессию, проявление должно быть не походим на агрессию. Из легких уже начинает выходить большой поток воздуха, ведь изначально мы хотели напугать в ответ. Остановиться мгновенно мы это не можем, поэтому нам надо
1) изменить мимику лица, но так чтобы она отличалась от мимики агрессии и другая особь не решила что это агрессия. Но при этом, дать потоку воздуха выйти из легких, выдохнув, поэтому мы должны открыть рот. Раз мы не можем открыть его вертикально (другая особь может перепутать с агрессией), мы делаем это горизонтально (в этом случае перепутать уже нельзя).
2) поток воздуха, мы одновременно либо пытаемся остановить выдавая его порциями. Либо пытаемся сделать его выход максимально не похожим на выдыхание при агрессии. Либо из за голосовых связок, которые вместо планового агрессивного крика перекрывают поток воздуха, который периодически под давлением легких прорывается через них. Что напоминает рывки. Не выпускать воздух мы тоже не можем, так как это наполненная грудь больше похоже на воинственный посыл, но и выпустить сразу весь воздух не издав какой то звук мы тоже не можем чтобы его не перепутали с агрессией, поэтому воздух будет выходить максимально не похожим на другие звуки.
Важно, не обязательно воздух будет выходить таким образом. Так как это крайний случай поздней реакции. Если же неопределенность/опасность была быстро распознана как неопасность, то и реакция будет меньше. Например, только в виде улыбки без выдоха потока воздуха или прищуренных глаз. Или же настройкой голосового аппарата, когда голос будет слегка отличаться.
И это один из примеров нарастания эмоций на основе базовых - это неосознанное избегание агрессии. И данный механизм избегания агрессии происходить автоматически. Иначе любая реакция будет всегда приводить к агрессии. И это будет означать цепную реакцию агрессии в обществе, что в итоге приведет к его вымиранию.
Большинство эмоций это вообще субъективное понятие и они возникают только на высшем уровне, за счет понимания сказанного контекста.
Например, тут я показывал что на речевом уровне многие из них одинаковые.
https://t.me/greenruff/1855
На биологическом за счет перенаправления, прерывания гормональных всплесков (сюда же входят и нейротрансмиттеры), когда организм пытается стабилизировать ситуацию. Все сложнее конечно, так как в той же музыке огромную роль играет на сколько она попадает под "гамматон фильтры" слуха (интервалы) человека, на сколько человек может предсказать дальше мелодию (слишком сильно может - не интересно будет, не может совсем предсказать - жанр не будет нравиться).
Поэтому тут нельзя в двух словах описать. Про боль при слухе и обратное чуть чуть затрагивал тут https://t.me/greenruff/1872
Для пример разбор одного из базовых про-эмоций (я называю их генными, так как они предопределены биологически и прошиты в генах) https://t.me/greenruff/1895
Напишите кто то статью, где с помощью LLM мигрируете запросы SQL с mssql в postgres со всеми триггерами, процедурами и тд. Я постоянно использую chstgpt, сбер и другие llm, чтобы облегчить себе задачи в разработке.
Простые вещи решает отлично. Но что то сложнее и там полная ж... Будь это конвертация функций с одного фреймворка на другой, или где требуется подумать как можно сделать. И самое ужасное, что они пишут правдоподобно и если не перепроверить то проблема вылезет потом. Сделать функцию по формуле, по описанной блок схеме - да, ок. Прописать настройки, сохранить , загрузить данные из файла, сделать примитивные запросы, выдать инфу из доков.
Люди, которые довольны LLM и считают что они заменят. Напишите статью, я реально хочу понять, какие вы задачи решаете что llm отлично справляется и экономит время.
LLM отличный инструмент для облегчения ряда задач. Но даже при написании игры чуть сложнее арканоида, она уже начинает тупить.
С болью все ещё интереснее. У нас весь слух по сути построен на боли. Точнее на воздействии сигнала на волоски. При увеличении частоты звука и более узкий диапазон сигнала (как скрежет металла) и интенсивности, возникает уже боль.
Для примера крик. Там возникают болевые сигналы волосков и параллельно вырабатываются опиоидные гормоны, чтобы не было ощущения боли до какого то момента. И при определенных интерпретациях сигнала мозгом, останется только эффект опиодов. И будет ощущение радости, а в другом боль возьмёт свое. Именно поэтому некоторые мазохисты любят когда на них кричат, так как у них нарушен/обострена реакция на звук и опиодных гормонов выбрасывается очень много.
У нас вообще изначально нет положительных эмоций. Только те что являются сигналом об опасности через тревогу и боль. А все остальные возникли как наслоение на них, чтобы показать обратную реакцию. Так злобный крик превращается в смех. Но в основе, все та же боль. Это универсальный сигнальный механизм у нас для всего, просто пока она не сильная не ощущаем.