Вы правильно написали, llm это ПОСЛЕДОВАТЕЛЬНАЯ модель. Так как информация формирует последовательный граф со связями (речь разделенная паузами). Но например зрение это пространственная модель, которая позволяет связывать последовательные цепочки между собой. LLM частично реализовала последовательную модель, но не способна связывать две последовательные модели, чтобы находить закономерности. Поэтому llm не может связать закономерности в химии с закономерностями в физике. Или даже в рамках программирования. Поэтому ограничения LLM, это архитектурные ограничения. Объем данных, какие то дополнения - принципиально проблемы не исправят.
Здесь надо сочетание как последовательной модели llm, так и связь с пространственной моделью. И нет, это не решит проблему AGI, но без этого шага llm на новый уровень возможности не перейдет.
Но кое что в llm сейчас мелькает в плане прогресса, это разделение механизма внимания на длинные и короткие маршруты. Как это делает лобная доля (тот же механизм внимания, только больше), переключаясь между локальными и глобальными маршрутами. Локальные в пределах одной зоны мозга (например для речи это в основном эмоциональные фразы), и глобальные которые длинные и могут проходить через несколько зон мозга. Но это пока в зародыше у llm, и лишь позволит снизить ресурсы и ускорить, но принципиально проблему не решит.
Так я к компании отношения не имею. Просто рассказал, что вероятно в случае большой компании и хорошего юридического отдела, выгоднее решать дела через такие компании. Так как они должны взять на себя проблемы и растаможки, и сроков и остальные. И если компания не уложилась, то отдел юристов стрясет у них неустойки. Насчет ошибок, согласен.. обычно закладываю ~3-и итерации на доработки партии, и соответственно первые идет скорее штучно, и ближе к 3ей уже больше (когда вроде больше косяков не нашли).
У меня было один раз когда запороли партию, так как чип поставили не тем боком. Предложили прислать обратно , чтобы они переделали. Я посчитал, решил что мне быстрее и проще простить их, а взамен они изготовят меньшее кол-во но переделают правильно. На том и сошлись.
С нашими компаниями работал только с резонитом. Что то Резонит все же делает в РФ. Но конечно разница в цене получается слишком большая для меня. Я думал что сроки в этом случае будут быстрее, но нет, из система обработки заявок может занять неделю или две. В то время как с Китаем я обговорю все за день, тут же оплачу партию и завтра они уже начнут делать.
Я лишь предположил, что в договоре можно прописать неустойки и прочие вещи. И потом через суд требовать. Но это для крупных заказчиков.
И да и нет. Я предпочитаю заказывать изготовление плат в Китае, но порой они могут другой стороной припаять чип и это становиться головной болью. Плата частично работает, а частично нет. После разборов, китайцы предлагают отправить платы им на переделку. А это время, накладные расходы на логистику. В такой момент фирмы прокладки имеют смысл, как страховые компании. По принципу решайте проблемы с китайцами, следите за ними, это ваша теперь головная боль, а у меня в договоре указан срок с вами и неустойки. Но я пока не так богат, чтобы мог на небольших тиражах так не экономить. Поэтому сам заказываю и решаю головную боль с Китаем. Решением будет либо огромная партия, либо посредники объединяют несколько партий в крупную и тогда больше рычагов давления на китайцев. Иначе, косяки там постоянно у них, от срыва сроков до неправильно припаянных чипов.
Все что вы пишите, то что так же говорили и писали про AR в свое время, про крипту (веб3, ICO, и прочие вещи), VR, теперь про сетки. Сетки полезная вещь, но там до полноценного развития еще не один десяток лет. В том состоянии как сейчас, это очень ограниченный инструмент. При чем самые "продвинутые" сетки очень тупые. И дело не в объемах данных, или обещаниях. Дело в архитектуре самих LLM. Это последовательные предсказания, которые в своей основе просто не могут связывать параллельные предсказания. Текст как и речь построены на последовательных графах пауз, а например зрение на пространственных графах. Где каждые уровни дают разную детализацию. А механизм внимания - позволяет переключаться между разными уровнями. Так вот сама архитектура последовательных предсказаний - не позволяет по ним делать пространственные предсказания, связанные друг с другом. А по простому абстрактное мышление. Поэтому сейчас сетки не могут нормально работать ни с кодом, ни с БД... все что получается это очень примитивно.
Вопрос веры - это религия. Эмоции всегда мешают посмотрет на вещи под другим углом. И не важно - религия бога, или вера в нейронные сети, крипту, VR или что то еще. LLM хороший инструмент - классный, но весь хайп не стоит конечно тех денег. Он строится ради капитализации компаний. Пройдет хайп - будут новые инструменты на основе LLM и мешура спадет. И дальше годы улучшения. А компании уцепятся за новую "веру" людей про роботов, нейро чипы или что то еще.
А зачем кому-то верить на слово. Верить или не верить. Нейросети превращаются в какую то религию. Если тесно не работать с ними и не развивать их, то выбор стороны значения не имеет. Я лишь указал - то подобный пиар был и раньше, это не вопрос к технологиям и веры. Для них это напрямую связано с капитализацией.
Как мне это все напоминает бум AR, когда статьи про световые поля, пространственные вычисления и другую ерунду от magic leap (привлекшей тогда 2 млрд$ на обещания), google их преувеличенным маркетингом google glass, и куча других подобных пиаров. Более сотен стартапов делающих очки, огромные инвестиции, обещания. Ещё больше тех, кто делал будущий софт, притянутый за уши в этой сфере.
Затем VR и крипта. Сейчас время нейронок и все 1 в 1. При этом все перечисленное важно, но настолько переоценено.
Не будет в нейронках ни завтра, ни через 5 лет бегающих разумных, да даже виртуальных систем.
Тех, кто ни разу не пытался понять, что делают сетки, в чем их проблема. Как делает мозг, почему отличается и в чем. Будут как и в прошлом кричать о новой эре.
Я сейчас шаг шагом, разбираю в чем отличие конкретных сеток и зон мозга, чтобы изменить архитектуру. И сложность даже не только в понимании (сейчас накоплено много исследований, на основе которых мы можем понять и трансформеры как аналогию и разобрать разные реальные зоны мозга на архитектуры), а том что очень много разных важных функций. Для примера распознавание речи. Сейчас из всей цепочки по сути реализовали зоны слуховой коры и то криво. А в реальности, при разборе зон мозга мы видим, что сначала спектр делиться на интервалы. Дальше кохлейное ядро работает с интенсивностью, чтобы выделить паузы, динамику интенсивности, и другие мелочи. При этом две зоны (сетки), где одна быстрая простая для низких частот и другая немного сложнее для верхних частот (чтоб детализировать интенсивность, для эхолокации например или других моментов). Затем зоны определение звука в пространстве и так далее. Где уже в систему распознавания приходит сигнал с множеством доп информации о положении, ритме, темпе, паузах, интенсивности, типе звука и так далее. Что позволяет распознавать речь в шуме, выделять ее, отличать качественно. А ни как сейчас Whisper, шаг в сторону и перестал работать.
Я часто слышу, что можно продавить мощностями и деньгами. Нет, нельзя! Мозг все равно придется включать и пытаться разобраться. Поэтому тут прежде всего требуется кропотливо изучать и переносить. А это долго, требует времени прежде всего , а не денег. И на сегодня это почти не делают.
Можно потратить триллион долларов, скормить всю информацию в мире и выхлоп будет 0.
Текущие LLM прежде всего показали, не свой интеллект. Он у них низкий, так как построен на частотной выборке слов + механизмов внимания усиления связей между частотными словами. В нем нет на сегодня ни пространственного абстрагирования, ни реальной модели кратковременной памяти. Так вот, текущие LLM на самом деле показали, что в среднем интеллект людей очень низкий и за несколько тысяч лет развился слабо.
Не может абстрагировать и не могут такое составить, так как для этого надо понимать с чем сравнивать. В этом и есть смысл абстрагирования, когда ты видишь общие закономерности например на уровне физики и биологического процесса и на молекулярном уровне. Нейронки на трансформерах по своей природе не могут это сделать.
Можно сколько угодно приводить бенчмаркеров. Сама архитектура трансформеров последовательная, как язык, так как речь последовательная.
Абстрагирование это пространственное восприятие, которое досталось нам от зрения. Которое не последовательно, а пространственное и связывает разные события друг с другом.
Я на днях мучился с паузами речи, пытаясь с помощью них сделать какую то оценку о языке. Все разбилось, так как в итоге после долгих мучений, заметил что паузы образуют языковой граф с разным уровнем детализации речи. Это схоже с графом детализации у зрения. Но есть одно важное отличие, речь последовательная и граф там тоже, механизм внимания перемещается между узлами чтобы либо найти смысл, эмоциональное выражение, слова, слоги, общение, бит. В то время как у зрения этот граф сложнее, он не последовательный а пространственный (близко к swin сеткам зрения).
Так вот абстрактное мышление , связано с пространственным представлением сеток. У llm в основе трансформеры - это речь, с последовательным представлением связей в виде текста. И хоть агенты, хоть триллион параметров не сделают из llm трансформеров - пространственную модель. Тут надо усложнять архитектуру сеток.
Как инструмент llm прекрасны, дополняют разработку, делает некоторые простые черновые вещи. У них есть предел, хоть с агентами, хоть без агентов. Он прежде всего связан с архитектурной, основой этих llm.
Я сейчас переношу некоторые части мозга, под их аналог на нейронках. Там такая лютая дичь на запросы. Для того, кто не понимает, что он выдал, кажется круто, попросил и написал. А когда ты понимаешь, то это ужас. Причем дело не в ТЗ, так как описание на основе исследований он неплохо обобщает. (Вот обобщает текст, llm достаточно хорошо, хотя тоже главное не перестараться). Но вот абстрактно перенести идеи из одной области на другую. Тут тупик.
С агентом или без, современные llm не умеют абстрагировать и следовательно связывать закономерности и события двух разных областей. Это уже графы, пространственные сравнения, а текущие llm это последовательный набор данных. Вы их хоть миллионов агентов обвешайте, проблему это не решит. Так как нужны изменения на уровне архитектуры. Агенты это просто разные специализированные llm или набор знаний или действий. Это совсем не решает указанной выше проблемы.
Как инструмент отличные, но из джуна не сделают сеньора. Скорей, сделают человека, который думает что он сеньор.
Столько раз уже слышал про это. LLM отчасти помогают с небольшими фрагментами. НО очень часто жестко тупят и если ты не понимаешь, что они пишут, то.. Выше один из примеров... N-ая неудачная попытка в ChatGPT сегодня в течении дня. Где он мне написал полную охинею в ответе. Самый шик был сегодня, когда я ему написал, что это бред и нужно сконвертировать весь код, который я ему написал. Он в ответ начал писать на Python какую то дичь. Какой к черту Python, когда даже слово такого в чате не было, а в запросе было конвертировать MS SQL скрипт в PostgreSQL.
Так же, когда я написал, что он выкинул часть кода после конвертации (на другой запрос), он в ответ начал вставлять CREATE TABLE придумывая, какие могли быть таблицы в этом большом запросе. А в целом, я часто вижу такое: --- название поля ... и что тут будет. ЧТО? тебя просили сконвертировать, а не написать комментарий, где дальше сам код убран и написано что тут надо будет дописать его мне.
Ок, я понимаю, что он делает и вижу его ошибки. Могу разбить на множество частей, или те части с которым он не справляется сделать сам. А как вы предлагаете это делать Джуну, чтобы стать Сеньором? Это кстати относится ко всем, кто хвалит LLM и что они заменят разработчиков. Что вы там пишете такого, что вас могут заменить?
Тут на хабре была статья, как помню кто-то писал что делают Nocode для отчетов, где генерируется SQL по скормленной базе. Серьезно? Чтобы на сложных запросах, сложнее нескольких select и join он написал полнейшую пургу с "... тут должен быть код" (что в итоге выполниться возможно, но даст совсем другой результат).
И это я описал мизерную часть. Там LLM до полноценной разработки, как суслику до кроманьонца. Не ужели есть такая работа, где LLM за разработчика может написать нормальный код и ему за это платят большие деньги? Где она такая? Назовите компания)
Спасибо, про зрение почитаю больше, так как в численность не лез там. Но как раз сейчас столкнулся с тем, что на уровне механизма внимания в префронтальной коре используется закон Вебера для звука. Дело в том, что паузы не делятся четко на слоги, слова. выделение слов, дыхание и т.д. По сути мы получаем граф, в котором ветки между более крупными паузами включают в себя то что между более мелкими. А механизм внимания, просто перемешается по уровням узлов графа, обращая внимание либо на выделение ярких слов, или слов. или общего смысла. Так как узлы не идеально будут совпадать, то мозг тогда не сможет понять какие узлы находятся на одном и том же уровне. И тут на как раз закон Вебера, определяющий не точное значение, а интервал вокруг. Чем паузе меньше, тем интервал вокруг уровня внимания меньше, чем паузы больше - тем уровень механизма внимания поднимается выше и ширина интервала увеличивается (например разброс пауз дыхания больше). И подобное, явно наблюдается у зрения, тот же граф , где механизм внимания префронтальной коры переходит либо к мелкому уровню детализации в графе (рассматривает мазок картины) либо более верхнем (где видит что это картина).
Но вот про счет, не смотрел подробно. Надо будет более детально изучить.
Я с этим не спорю. Речь просто про то, что у нас организм выстроен таким образом, что это все стоит учитывать. Можно упростить, но тогда возникают ограничения. Что касается нейронок, то на самом деле там так же, общие механики копируются. И постепенно обрастает теми же деталями в плане механик. То что реализовано по разному - то форма подстраивается по среду, если среда электронная то и форма реализации будет такой, а если органическая то так же. Как язык, звуки у разных языков разные, но при абстрагировании получаем те же элементы слова предложения и т.д.
Любой подход начинает с упрощения. Так что я не спорю. Это самая оптимальная практика.
Не совсем худождественное. Картина основана на автобиографическом романе Коринны Хофман «Белая масаи»[нем.], повествующем о браке швейцарки и воина из племени масаи. Да и таких случаев было не мало.
Исследований подобных было не мало. Разницы в интеллекте как раз не было, имеется ввиду развитие ребенка в другой среде изначально.
Почему же корреляция между размером мозга на сколько помниться была отлично установлена. Другое дело что тут еще роль играет плотность нейронов.
Насчет человека, прежде всего дело в том, что он заполнил всю планету не давая возможности другим видам развиваться. Например в эпоху динозавров, другим видам не было возможности полноценно развиться. Как только динозавры освободили нишу, началось бурное развитие других видов. Завтра вымрет человечество, ниша освободится, будет возможность развиться другим видам и через 100 тыс лет летучие мыши будут размером с человека или еноты, которые имеют сложный язык и все все предпосылки биологические к развитию. Или кто то еще, кто будет лучше адаптирован к новой среде.
Насчет одежды, то согласно антропологии, она была лишь у малых групп. а группы тогда были по 5-25 человек. И ученые больше склоняются что одежда пришла от неандертальцев, а кроманьонцы были без нее. При это неандертальцы считаются просто как узкий подвид (вроде чукчей живущих в маленькой части). И считается что неандертальцы были менее развитыми чем кроманьонцы, о того и вымерли (частично смешавшись с кроманьонцами, так как в генах людей всего ~2% неандертальцев).
Да, копировать мышечные сокращения смысла нет. Это с одной стороны. Как бы не вылезло это боком в другом. Дело в том, что пульсирующие сокращения играют важную роль в дыхании. Я когда реализовывал модель для речи, которая учитывает гормоны, сердце, дыхание и кучу всего, то вижу какую роль играет пульсация в дыхании. Дело в том, что у нас есть мешочки альвиольные в легких, которые покрыты капиллярами которые через диффузию газов обмениваются кислородом и углекислым газом, насыщая участок крови. При регулировании этого кровотока через пульс, кровь нормально насыщается кислородом и успевает отдать углекислый газ. Если пульса не будет, это означает что могут возникнуть проблемы с выводом углекислого газа, повышением кислотности крови, нехваткой кислорода.
В среднем при спокойном образе жизни, такое случается не часто. Но при обычном образе жизни, таких проблем будет выше крыши.
Так что при первом упрощении, пульсацию можно опустить. Но она играет важную роль в регулировки газом в легких и крови через диффузию. Так что пульсация играет важную роль. Выкинуть ее можно, но это сделает организм менее пригодным к различным условиям. Иначе нам и руки не нужны, можно ноги для этого использовать.
Так было про африканские племена. И да, им просто не нужно было больше чисел поэтому они были ограничены в этом. Суть была в том, что на тех исследованиях они не могли отличить какая куча вещей была больше, если куча вещей превышала их счетные возможности. Условно они видели что в одной 9 вещей, а в другой 7 вещей, но не могли сказать какая из этих куч больше, так как для этого надо по сути сосчитать кол-во вещей в них. Я об этом.
Сапольский в той лекции не делал выводов о доступности. Но безусловно, дело не в биологическом уровне развития. Был отличный фильм "Белая массая" (по моему так), когда одна женщина из Британии (по моему) дернуло жить с массаями и родить. Выдержала она года 2 по-моему и потом уехала с ребенком. И тот отлично развит, разницы нет. Поэтому прежде всего окружение и знания при начальном обучении играют первостепенную роль. Если изначально в детском возрасте их не заложить, то потом уже легко получит детей "маугли", которым будет сложно даже начать говорить, не то что считать.
В целом у некоторых африканских народов мозг чуть больше по моему (сейчас не вспомню опровергли это исследование или нет, одни говорят что опровергли, другие что нет). И некоторые высказываются что мозг стал меньше, и деградировал. Если это не так, то за 30 тыс лет он и не увеличился. Что говорит больше о том, что дело в передаваемой с детства ребенку информации и обучении и среде его обитания.
Так что базовая у них не отлично. На сколько я помню из антропологии, то наш мозг за последние несколько тысяч лет не менялся. Просто понятие интеллект это не про цифры и текст (это все знания и опыт), а интеллект про умение решать задачи в своей среде. В тех же джунглях, городе, на острове... И бросив современного человека в джунгли, легко окажется что интеллекта там особо и нет. И абстрактно решать задачи, чтобы выжить и приспособиться вероятно смогут не так много людей.
Но конечно биология играет важную роль. Шимпанзе поместив к людям в городскую среду, хоть и даст прирост интеллекта, но он будет ограничен их биологией.
Надо отметить, что искусственное сердце с таким функционалом это конечно огромный шаг вперёд, но пока сильный костыль который позволяет поддержать жизнь на определенном уровне. Слишком много побочек, чтобы хватало только гонять кровь.
Сразу скажу, что искусственное сердце это очень крутой шаг вперёд. Но все равно придется в итоге делать тоже самое, что и реальное сердце. Я про механизм. Иначе любой шаг влево или вправо и тромбоз или кирдык.
Зависимость от артериального давления. Что то поели не то, давление скакануло, а сердце не подстроилось
Гормональные колебания. Сильные эмоции, будь то радости, страха или депрессии и отсутствие реакции на эти изменения может легко привести к смерти
Регулирование ЧСС нервной системой. Например, в крови много углекислого газа (воздух грязный) и надо чаще дышать для вывода co2. А ЧСС не увеличивается и кирдык.
Решил дополнить и раскрыть ваш ответ в более развернутый.
На уровне нейробиологии это как раз степень развития лобных долей, которые позволяют переключаться между глобальными маршрутами (идущие через несколько зон мозга) и локальными маршрутами (в рамках одной зоны). Лобные зоны регулируют поведение. Локальные маршруты это короткие простые, увидел еду и схватил. Глобальные маршруты - это увидел еду, оценил, что выгоднее, схватить ее сейчас или подождать.
Для слабо развитых лобных долей, доминирует лимбическая система, которая с помощью кортизола ослабляет лобные доли и сигнал идёт по локальным маршрутам. То есть животное схватит еду, как только видит ее.
Поэтому, как правильно вы заметили, самообладание это как раз сильно развитие лобные доли у животного. Это означает, что у него уже есть сильные когнитивные способности, то есть сильно развиты лобные доли и глобальные маршруты, которые формируют сложное поведение. При отсутствии самообладания, результат действия животного будет локальный маршрут (то есть лимбическая система доминирует).
Тот же эксперимент с Зефиром и детьми отлично это демонстрирует, так как лобные доли ещё не развиты. Поэтому ни о каком самообладании не может идти и речи. У человека они окончательно формируются позже всех зон, к 25 годам.
Я к тому, что самообладание очень много может рассказать об интеллекте и развитии мозга.
Да, Whisper с одной стороны уделывает. С другой, когда я смотрю исследования психоакустики, лингвистики и других, я вижу несколько проблем
1) попытка просто в лоб реализоват биологические вещи. Например тот же Синтез речи — Сорокин В.Н, где идет попытка описать работу голосового тракта через поршни и прочие вещи, чтобы воспроизвести вибрации голосовых связок.
2) исследования, которые чаще всего можно выкинуть. Как например исследования влияния формант на эмоции или изучение фонем. Ни кто не полез глубже. Нейробиологам это не так интересно, а те кто изучают уровень абстракции выше не лезут глубже.
Например, не так давно анализировал речь на низком уровне и выяснилось что никаких фонем нет, это неправильное толкование. Точнее звуки есть, но не такие как принято в фонемах. например звук МА, ЛА, как и отдельные М, Л и т.д. В фонемах их нет. А многие в нейронках до сих пор пытаются использовать фонемы, и это зло.
Про эмоции вообще молчу. Там добрую часть научных статей можно смело выкинуть в мусор, так как при проверке оказывается, что описанное в них притянуто за уши.
Но почему важно разбирать на уровне биологии? Потому что тот же Whisper очень паршиво работает в реальных условиях. Он не способен справляться с шумами, качественно следить на конкретным спикеров и т.д. В нем реализована лишь часть биологии. И безусловно ASR можно значительно улучшить, как раз за счет того что мы знаешь о работе слуха. А он на сегодня изучен прекрасно, вплоть до какие типы нейронов (а каждый вид можно сопоставить с топологией сеток) в слоях слуховой коры и в каком слое. Как они связаны. Как изначально происходит обработка звука слухом, как разные зоны помогают уловить все это, убрать шумы и т.д.
И почему то этого я как раз не вижу. Я не вижу, чтобы реально кто то использовал в своих работах эти знания.
Чем больше смотришь исследований, тем больше начинаешь задаваться вопросом. Правильно ли они поставлены? Ведь если взять рандомно человека, и оценить его способности, то можно получить низкий интеллект алкоголика и высокий интеллект какого то профессора. Так как боюсь, что развитие интеллекта у вида имеет что то схожее к нормальному распределению. И кого из этого списка мы взяли не ясно, нужно сотни повторяющихся экспериментов, а не десяток.
Кроме того, как оценивать особь? Допустим человека выкинуть в джунгли, он там помрет через несколько дней. Значит ли это, что интеллект человека низкий, раз он не смог выжить не в своей среде? Или мы оцениваем не интеллект, а уровень знаний? Не стоит ли оценивать интеллект относительно среды обитания, а не сравнивать с человеком. Да и смотря, как многие люди ведутся на мошенников, начинает казаться, что некоторые вороны имеют более крутой интеллект по сравнению с ними, так как способны обманут некоторых людей.
Вы правильно написали, llm это ПОСЛЕДОВАТЕЛЬНАЯ модель. Так как информация формирует последовательный граф со связями (речь разделенная паузами). Но например зрение это пространственная модель, которая позволяет связывать последовательные цепочки между собой. LLM частично реализовала последовательную модель, но не способна связывать две последовательные модели, чтобы находить закономерности. Поэтому llm не может связать закономерности в химии с закономерностями в физике. Или даже в рамках программирования. Поэтому ограничения LLM, это архитектурные ограничения. Объем данных, какие то дополнения - принципиально проблемы не исправят.
Здесь надо сочетание как последовательной модели llm, так и связь с пространственной моделью. И нет, это не решит проблему AGI, но без этого шага llm на новый уровень возможности не перейдет.
Но кое что в llm сейчас мелькает в плане прогресса, это разделение механизма внимания на длинные и короткие маршруты. Как это делает лобная доля (тот же механизм внимания, только больше), переключаясь между локальными и глобальными маршрутами. Локальные в пределах одной зоны мозга (например для речи это в основном эмоциональные фразы), и глобальные которые длинные и могут проходить через несколько зон мозга. Но это пока в зародыше у llm, и лишь позволит снизить ресурсы и ускорить, но принципиально проблему не решит.
Так я к компании отношения не имею. Просто рассказал, что вероятно в случае большой компании и хорошего юридического отдела, выгоднее решать дела через такие компании. Так как они должны взять на себя проблемы и растаможки, и сроков и остальные. И если компания не уложилась, то отдел юристов стрясет у них неустойки. Насчет ошибок, согласен.. обычно закладываю ~3-и итерации на доработки партии, и соответственно первые идет скорее штучно, и ближе к 3ей уже больше (когда вроде больше косяков не нашли).
У меня было один раз когда запороли партию, так как чип поставили не тем боком. Предложили прислать обратно , чтобы они переделали. Я посчитал, решил что мне быстрее и проще простить их, а взамен они изготовят меньшее кол-во но переделают правильно. На том и сошлись.
С нашими компаниями работал только с резонитом. Что то Резонит все же делает в РФ. Но конечно разница в цене получается слишком большая для меня. Я думал что сроки в этом случае будут быстрее, но нет, из система обработки заявок может занять неделю или две. В то время как с Китаем я обговорю все за день, тут же оплачу партию и завтра они уже начнут делать.
Я лишь предположил, что в договоре можно прописать неустойки и прочие вещи. И потом через суд требовать. Но это для крупных заказчиков.
И да и нет. Я предпочитаю заказывать изготовление плат в Китае, но порой они могут другой стороной припаять чип и это становиться головной болью. Плата частично работает, а частично нет. После разборов, китайцы предлагают отправить платы им на переделку. А это время, накладные расходы на логистику. В такой момент фирмы прокладки имеют смысл, как страховые компании. По принципу решайте проблемы с китайцами, следите за ними, это ваша теперь головная боль, а у меня в договоре указан срок с вами и неустойки. Но я пока не так богат, чтобы мог на небольших тиражах так не экономить. Поэтому сам заказываю и решаю головную боль с Китаем. Решением будет либо огромная партия, либо посредники объединяют несколько партий в крупную и тогда больше рычагов давления на китайцев. Иначе, косяки там постоянно у них, от срыва сроков до неправильно припаянных чипов.
Все что вы пишите, то что так же говорили и писали про AR в свое время, про крипту (веб3, ICO, и прочие вещи), VR, теперь про сетки. Сетки полезная вещь, но там до полноценного развития еще не один десяток лет. В том состоянии как сейчас, это очень ограниченный инструмент. При чем самые "продвинутые" сетки очень тупые. И дело не в объемах данных, или обещаниях. Дело в архитектуре самих LLM. Это последовательные предсказания, которые в своей основе просто не могут связывать параллельные предсказания. Текст как и речь построены на последовательных графах пауз, а например зрение на пространственных графах. Где каждые уровни дают разную детализацию. А механизм внимания - позволяет переключаться между разными уровнями. Так вот сама архитектура последовательных предсказаний - не позволяет по ним делать пространственные предсказания, связанные друг с другом. А по простому абстрактное мышление. Поэтому сейчас сетки не могут нормально работать ни с кодом, ни с БД... все что получается это очень примитивно.
Вопрос веры - это религия. Эмоции всегда мешают посмотрет на вещи под другим углом. И не важно - религия бога, или вера в нейронные сети, крипту, VR или что то еще. LLM хороший инструмент - классный, но весь хайп не стоит конечно тех денег. Он строится ради капитализации компаний. Пройдет хайп - будут новые инструменты на основе LLM и мешура спадет. И дальше годы улучшения. А компании уцепятся за новую "веру" людей про роботов, нейро чипы или что то еще.
А зачем кому-то верить на слово. Верить или не верить. Нейросети превращаются в какую то религию. Если тесно не работать с ними и не развивать их, то выбор стороны значения не имеет. Я лишь указал - то подобный пиар был и раньше, это не вопрос к технологиям и веры. Для них это напрямую связано с капитализацией.
Как мне это все напоминает бум AR, когда статьи про световые поля, пространственные вычисления и другую ерунду от magic leap (привлекшей тогда 2 млрд$ на обещания), google их преувеличенным маркетингом google glass, и куча других подобных пиаров. Более сотен стартапов делающих очки, огромные инвестиции, обещания. Ещё больше тех, кто делал будущий софт, притянутый за уши в этой сфере.
Затем VR и крипта. Сейчас время нейронок и все 1 в 1. При этом все перечисленное важно, но настолько переоценено.
Не будет в нейронках ни завтра, ни через 5 лет бегающих разумных, да даже виртуальных систем.
Тех, кто ни разу не пытался понять, что делают сетки, в чем их проблема. Как делает мозг, почему отличается и в чем. Будут как и в прошлом кричать о новой эре.
Я сейчас шаг шагом, разбираю в чем отличие конкретных сеток и зон мозга, чтобы изменить архитектуру. И сложность даже не только в понимании (сейчас накоплено много исследований, на основе которых мы можем понять и трансформеры как аналогию и разобрать разные реальные зоны мозга на архитектуры), а том что очень много разных важных функций. Для примера распознавание речи. Сейчас из всей цепочки по сути реализовали зоны слуховой коры и то криво. А в реальности, при разборе зон мозга мы видим, что сначала спектр делиться на интервалы. Дальше кохлейное ядро работает с интенсивностью, чтобы выделить паузы, динамику интенсивности, и другие мелочи. При этом две зоны (сетки), где одна быстрая простая для низких частот и другая немного сложнее для верхних частот (чтоб детализировать интенсивность, для эхолокации например или других моментов). Затем зоны определение звука в пространстве и так далее. Где уже в систему распознавания приходит сигнал с множеством доп информации о положении, ритме, темпе, паузах, интенсивности, типе звука и так далее. Что позволяет распознавать речь в шуме, выделять ее, отличать качественно. А ни как сейчас Whisper, шаг в сторону и перестал работать.
Я часто слышу, что можно продавить мощностями и деньгами. Нет, нельзя! Мозг все равно придется включать и пытаться разобраться. Поэтому тут прежде всего требуется кропотливо изучать и переносить. А это долго, требует времени прежде всего , а не денег. И на сегодня это почти не делают.
Можно потратить триллион долларов, скормить всю информацию в мире и выхлоп будет 0.
Текущие LLM прежде всего показали, не свой интеллект. Он у них низкий, так как построен на частотной выборке слов + механизмов внимания усиления связей между частотными словами. В нем нет на сегодня ни пространственного абстрагирования, ни реальной модели кратковременной памяти. Так вот, текущие LLM на самом деле показали, что в среднем интеллект людей очень низкий и за несколько тысяч лет развился слабо.
Не может абстрагировать и не могут такое составить, так как для этого надо понимать с чем сравнивать. В этом и есть смысл абстрагирования, когда ты видишь общие закономерности например на уровне физики и биологического процесса и на молекулярном уровне. Нейронки на трансформерах по своей природе не могут это сделать.
Можно сколько угодно приводить бенчмаркеров. Сама архитектура трансформеров последовательная, как язык, так как речь последовательная.
Абстрагирование это пространственное восприятие, которое досталось нам от зрения. Которое не последовательно, а пространственное и связывает разные события друг с другом.
Я на днях мучился с паузами речи, пытаясь с помощью них сделать какую то оценку о языке. Все разбилось, так как в итоге после долгих мучений, заметил что паузы образуют языковой граф с разным уровнем детализации речи. Это схоже с графом детализации у зрения. Но есть одно важное отличие, речь последовательная и граф там тоже, механизм внимания перемещается между узлами чтобы либо найти смысл, эмоциональное выражение, слова, слоги, общение, бит. В то время как у зрения этот граф сложнее, он не последовательный а пространственный (близко к swin сеткам зрения).
Так вот абстрактное мышление , связано с пространственным представлением сеток. У llm в основе трансформеры - это речь, с последовательным представлением связей в виде текста. И хоть агенты, хоть триллион параметров не сделают из llm трансформеров - пространственную модель. Тут надо усложнять архитектуру сеток.
Как инструмент llm прекрасны, дополняют разработку, делает некоторые простые черновые вещи. У них есть предел, хоть с агентами, хоть без агентов. Он прежде всего связан с архитектурной, основой этих llm.
Я сейчас переношу некоторые части мозга, под их аналог на нейронках. Там такая лютая дичь на запросы. Для того, кто не понимает, что он выдал, кажется круто, попросил и написал. А когда ты понимаешь, то это ужас. Причем дело не в ТЗ, так как описание на основе исследований он неплохо обобщает. (Вот обобщает текст, llm достаточно хорошо, хотя тоже главное не перестараться). Но вот абстрактно перенести идеи из одной области на другую. Тут тупик.
С агентом или без, современные llm не умеют абстрагировать и следовательно связывать закономерности и события двух разных областей. Это уже графы, пространственные сравнения, а текущие llm это последовательный набор данных. Вы их хоть миллионов агентов обвешайте, проблему это не решит. Так как нужны изменения на уровне архитектуры. Агенты это просто разные специализированные llm или набор знаний или действий. Это совсем не решает указанной выше проблемы.
Как инструмент отличные, но из джуна не сделают сеньора. Скорей, сделают человека, который думает что он сеньор.
Столько раз уже слышал про это. LLM отчасти помогают с небольшими фрагментами. НО очень часто жестко тупят и если ты не понимаешь, что они пишут, то..
Выше один из примеров... N-ая неудачная попытка в ChatGPT сегодня в течении дня. Где он мне написал полную охинею в ответе. Самый шик был сегодня, когда я ему написал, что это бред и нужно сконвертировать весь код, который я ему написал. Он в ответ начал писать на Python какую то дичь. Какой к черту Python, когда даже слово такого в чате не было, а в запросе было конвертировать MS SQL скрипт в PostgreSQL.
Так же, когда я написал, что он выкинул часть кода после конвертации (на другой запрос), он в ответ начал вставлять CREATE TABLE придумывая, какие могли быть таблицы в этом большом запросе.
А в целом, я часто вижу такое: --- название поля ... и что тут будет. ЧТО? тебя просили сконвертировать, а не написать комментарий, где дальше сам код убран и написано что тут надо будет дописать его мне.
Ок, я понимаю, что он делает и вижу его ошибки. Могу разбить на множество частей, или те части с которым он не справляется сделать сам. А как вы предлагаете это делать Джуну, чтобы стать Сеньором?
Это кстати относится ко всем, кто хвалит LLM и что они заменят разработчиков. Что вы там пишете такого, что вас могут заменить?
Тут на хабре была статья, как помню кто-то писал что делают Nocode для отчетов, где генерируется SQL по скормленной базе. Серьезно? Чтобы на сложных запросах, сложнее нескольких select и join он написал полнейшую пургу с "... тут должен быть код" (что в итоге выполниться возможно, но даст совсем другой результат).
И это я описал мизерную часть. Там LLM до полноценной разработки, как суслику до кроманьонца. Не ужели есть такая работа, где LLM за разработчика может написать нормальный код и ему за это платят большие деньги? Где она такая? Назовите компания)
Спасибо, про зрение почитаю больше, так как в численность не лез там. Но как раз сейчас столкнулся с тем, что на уровне механизма внимания в префронтальной коре используется закон Вебера для звука. Дело в том, что паузы не делятся четко на слоги, слова. выделение слов, дыхание и т.д. По сути мы получаем граф, в котором ветки между более крупными паузами включают в себя то что между более мелкими. А механизм внимания, просто перемешается по уровням узлов графа, обращая внимание либо на выделение ярких слов, или слов. или общего смысла. Так как узлы не идеально будут совпадать, то мозг тогда не сможет понять какие узлы находятся на одном и том же уровне. И тут на как раз закон Вебера, определяющий не точное значение, а интервал вокруг. Чем паузе меньше, тем интервал вокруг уровня внимания меньше, чем паузы больше - тем уровень механизма внимания поднимается выше и ширина интервала увеличивается (например разброс пауз дыхания больше). И подобное, явно наблюдается у зрения, тот же граф , где механизм внимания префронтальной коры переходит либо к мелкому уровню детализации в графе (рассматривает мазок картины) либо более верхнем (где видит что это картина).
Но вот про счет, не смотрел подробно. Надо будет более детально изучить.
Я с этим не спорю. Речь просто про то, что у нас организм выстроен таким образом, что это все стоит учитывать. Можно упростить, но тогда возникают ограничения. Что касается нейронок, то на самом деле там так же, общие механики копируются. И постепенно обрастает теми же деталями в плане механик. То что реализовано по разному - то форма подстраивается по среду, если среда электронная то и форма реализации будет такой, а если органическая то так же. Как язык, звуки у разных языков разные, но при абстрагировании получаем те же элементы слова предложения и т.д.
Любой подход начинает с упрощения. Так что я не спорю. Это самая оптимальная практика.
Не совсем худождественное. Картина основана на автобиографическом романе Коринны Хофман «Белая масаи»[нем.], повествующем о браке швейцарки и воина из племени масаи. Да и таких случаев было не мало.
Исследований подобных было не мало. Разницы в интеллекте как раз не было, имеется ввиду развитие ребенка в другой среде изначально.
Почему же корреляция между размером мозга на сколько помниться была отлично установлена. Другое дело что тут еще роль играет плотность нейронов.
Насчет человека, прежде всего дело в том, что он заполнил всю планету не давая возможности другим видам развиваться. Например в эпоху динозавров, другим видам не было возможности полноценно развиться. Как только динозавры освободили нишу, началось бурное развитие других видов. Завтра вымрет человечество, ниша освободится, будет возможность развиться другим видам и через 100 тыс лет летучие мыши будут размером с человека или еноты, которые имеют сложный язык и все все предпосылки биологические к развитию. Или кто то еще, кто будет лучше адаптирован к новой среде.
Насчет одежды, то согласно антропологии, она была лишь у малых групп. а группы тогда были по 5-25 человек. И ученые больше склоняются что одежда пришла от неандертальцев, а кроманьонцы были без нее. При это неандертальцы считаются просто как узкий подвид (вроде чукчей живущих в маленькой части). И считается что неандертальцы были менее развитыми чем кроманьонцы, о того и вымерли (частично смешавшись с кроманьонцами, так как в генах людей всего ~2% неандертальцев).
Да, копировать мышечные сокращения смысла нет. Это с одной стороны. Как бы не вылезло это боком в другом. Дело в том, что пульсирующие сокращения играют важную роль в дыхании. Я когда реализовывал модель для речи, которая учитывает гормоны, сердце, дыхание и кучу всего, то вижу какую роль играет пульсация в дыхании. Дело в том, что у нас есть мешочки альвиольные в легких, которые покрыты капиллярами которые через диффузию газов обмениваются кислородом и углекислым газом, насыщая участок крови. При регулировании этого кровотока через пульс, кровь нормально насыщается кислородом и успевает отдать углекислый газ. Если пульса не будет, это означает что могут возникнуть проблемы с выводом углекислого газа, повышением кислотности крови, нехваткой кислорода.
В среднем при спокойном образе жизни, такое случается не часто. Но при обычном образе жизни, таких проблем будет выше крыши.
Так что при первом упрощении, пульсацию можно опустить. Но она играет важную роль в регулировки газом в легких и крови через диффузию. Так что пульсация играет важную роль. Выкинуть ее можно, но это сделает организм менее пригодным к различным условиям. Иначе нам и руки не нужны, можно ноги для этого использовать.
Так было про африканские племена. И да, им просто не нужно было больше чисел поэтому они были ограничены в этом. Суть была в том, что на тех исследованиях они не могли отличить какая куча вещей была больше, если куча вещей превышала их счетные возможности. Условно они видели что в одной 9 вещей, а в другой 7 вещей, но не могли сказать какая из этих куч больше, так как для этого надо по сути сосчитать кол-во вещей в них. Я об этом.
По вашим ссылкам почитаю.
Сапольский в той лекции не делал выводов о доступности. Но безусловно, дело не в биологическом уровне развития. Был отличный фильм "Белая массая" (по моему так), когда одна женщина из Британии (по моему) дернуло жить с массаями и родить. Выдержала она года 2 по-моему и потом уехала с ребенком. И тот отлично развит, разницы нет. Поэтому прежде всего окружение и знания при начальном обучении играют первостепенную роль. Если изначально в детском возрасте их не заложить, то потом уже легко получит детей "маугли", которым будет сложно даже начать говорить, не то что считать.
В целом у некоторых африканских народов мозг чуть больше по моему (сейчас не вспомню опровергли это исследование или нет, одни говорят что опровергли, другие что нет). И некоторые высказываются что мозг стал меньше, и деградировал. Если это не так, то за 30 тыс лет он и не увеличился. Что говорит больше о том, что дело в передаваемой с детства ребенку информации и обучении и среде его обитания.
Так что базовая у них не отлично. На сколько я помню из антропологии, то наш мозг за последние несколько тысяч лет не менялся. Просто понятие интеллект это не про цифры и текст (это все знания и опыт), а интеллект про умение решать задачи в своей среде. В тех же джунглях, городе, на острове... И бросив современного человека в джунгли, легко окажется что интеллекта там особо и нет. И абстрактно решать задачи, чтобы выжить и приспособиться вероятно смогут не так много людей.
Но конечно биология играет важную роль. Шимпанзе поместив к людям в городскую среду, хоть и даст прирост интеллекта, но он будет ограничен их биологией.
Надо отметить, что искусственное сердце с таким функционалом это конечно огромный шаг вперёд, но пока сильный костыль который позволяет поддержать жизнь на определенном уровне. Слишком много побочек, чтобы хватало только гонять кровь.
Сразу скажу, что искусственное сердце это очень крутой шаг вперёд. Но все равно придется в итоге делать тоже самое, что и реальное сердце. Я про механизм. Иначе любой шаг влево или вправо и тромбоз или кирдык.
Зависимость от артериального давления. Что то поели не то, давление скакануло, а сердце не подстроилось
Гормональные колебания. Сильные эмоции, будь то радости, страха или депрессии и отсутствие реакции на эти изменения может легко привести к смерти
Регулирование ЧСС нервной системой. Например, в крови много углекислого газа (воздух грязный) и надо чаще дышать для вывода co2. А ЧСС не увеличивается и кирдык.
Решил дополнить и раскрыть ваш ответ в более развернутый.
На уровне нейробиологии это как раз степень развития лобных долей, которые позволяют переключаться между глобальными маршрутами (идущие через несколько зон мозга) и локальными маршрутами (в рамках одной зоны). Лобные зоны регулируют поведение. Локальные маршруты это короткие простые, увидел еду и схватил. Глобальные маршруты - это увидел еду, оценил, что выгоднее, схватить ее сейчас или подождать.
Для слабо развитых лобных долей, доминирует лимбическая система, которая с помощью кортизола ослабляет лобные доли и сигнал идёт по локальным маршрутам. То есть животное схватит еду, как только видит ее.
Поэтому, как правильно вы заметили, самообладание это как раз сильно развитие лобные доли у животного. Это означает, что у него уже есть сильные когнитивные способности, то есть сильно развиты лобные доли и глобальные маршруты, которые формируют сложное поведение. При отсутствии самообладания, результат действия животного будет локальный маршрут (то есть лимбическая система доминирует).
Тот же эксперимент с Зефиром и детьми отлично это демонстрирует, так как лобные доли ещё не развиты. Поэтому ни о каком самообладании не может идти и речи. У человека они окончательно формируются позже всех зон, к 25 годам.
Я к тому, что самообладание очень много может рассказать об интеллекте и развитии мозга.
Да, Whisper с одной стороны уделывает. С другой, когда я смотрю исследования психоакустики, лингвистики и других, я вижу несколько проблем
1) попытка просто в лоб реализоват биологические вещи. Например тот же Синтез речи — Сорокин В.Н, где идет попытка описать работу голосового тракта через поршни и прочие вещи, чтобы воспроизвести вибрации голосовых связок.
2) исследования, которые чаще всего можно выкинуть. Как например исследования влияния формант на эмоции или изучение фонем. Ни кто не полез глубже. Нейробиологам это не так интересно, а те кто изучают уровень абстракции выше не лезут глубже.
Например, не так давно анализировал речь на низком уровне и выяснилось что никаких фонем нет, это неправильное толкование. Точнее звуки есть, но не такие как принято в фонемах. например звук МА, ЛА, как и отдельные М, Л и т.д. В фонемах их нет. А многие в нейронках до сих пор пытаются использовать фонемы, и это зло.
Про эмоции вообще молчу. Там добрую часть научных статей можно смело выкинуть в мусор, так как при проверке оказывается, что описанное в них притянуто за уши.
Но почему важно разбирать на уровне биологии? Потому что тот же Whisper очень паршиво работает в реальных условиях. Он не способен справляться с шумами, качественно следить на конкретным спикеров и т.д. В нем реализована лишь часть биологии. И безусловно ASR можно значительно улучшить, как раз за счет того что мы знаешь о работе слуха. А он на сегодня изучен прекрасно, вплоть до какие типы нейронов (а каждый вид можно сопоставить с топологией сеток) в слоях слуховой коры и в каком слое. Как они связаны. Как изначально происходит обработка звука слухом, как разные зоны помогают уловить все это, убрать шумы и т.д.
И почему то этого я как раз не вижу. Я не вижу, чтобы реально кто то использовал в своих работах эти знания.
Чем больше смотришь исследований, тем больше начинаешь задаваться вопросом. Правильно ли они поставлены? Ведь если взять рандомно человека, и оценить его способности, то можно получить низкий интеллект алкоголика и высокий интеллект какого то профессора. Так как боюсь, что развитие интеллекта у вида имеет что то схожее к нормальному распределению. И кого из этого списка мы взяли не ясно, нужно сотни повторяющихся экспериментов, а не десяток.
Кроме того, как оценивать особь? Допустим человека выкинуть в джунгли, он там помрет через несколько дней. Значит ли это, что интеллект человека низкий, раз он не смог выжить не в своей среде? Или мы оцениваем не интеллект, а уровень знаний? Не стоит ли оценивать интеллект относительно среды обитания, а не сравнивать с человеком. Да и смотря, как многие люди ведутся на мошенников, начинает казаться, что некоторые вороны имеют более крутой интеллект по сравнению с ними, так как способны обманут некоторых людей.