Комментарии / Профиль tac / Хабр

Сергей@tac

Программист

ПрофильСтатьи43Посты1НовостиКомментарии2.1K

Интерпретация и оптимизация перцептрона Розенблатта

tac 9 сен 2025 в 10:10

многослойный персептрон без функции активации сводится к однослойному

а такие бывают? Без функции активации не бывает "нейронов"

не одно и то же

и чем же это отличается? Вам кажется, что кошка, которую вы привели станет более круглой?

Интерпретация и оптимизация перцептрона Розенблатта

tac 7 сен 2025 в 22:32

Я долго вам не отвечал, я на самом деле так и не понял, что вы хотите сказать. По серьезнее можно?

Интерпретация и оптимизация перцептрона Розенблатта

tac 7 сен 2025 в 22:23

Это не требует доказательства, это известно. Первая же ссылка в статье

На практике же это в известной степени не так, в работе [1] для распознавания рукописных цифр на базе MNIST была получена точность распознавания выше 99%.

Интерпретация и оптимизация перцептрона Розенблатта

tac 6 сен 2025 в 15:11

"включен - был включен", "включен - был выключен", "выключен - был включен", "выключен - был выключен"

Не очень понятно из контекста, о чем вы спрашиваете. Простой перцептрон таких состояний не имеет, это больше признак рекуррентных сетей. Настоящие нейроны? Они конечно, на порядок сложнее и да у них есть нечто аналогичное, только еще сложнее. У них есть т.н. рефрактерный период, который позволяет им хранить информацию какое время они не активировались.У меня две связанные с этим статьи, которые показывают как это свойство можно моделировать, и что оно очень важно. Если вам интересно напишите в личку, выложу текст этих статей.

На дворе LLM, а книгу о перцептроне так никто и не открыл!?

tac 3 сен 2025 в 14:22

Думаю в нашем случае, мы друг друга плохо понимаем. В отличии от моих других оппонентов выше. Вы описываете очень тяжело для понимания, как я понимаю некоторую свою теорию. И к иерархиям, о которых говорят выше любители аппроксимации она не относится, надо полагать.

Вы просто выше сравнивали LLM и трансформеры (их архитектуру в основе LLM) с перцептрон, говоря о том что те не туда ушли. Или я не так понял.

Я совсем не говорю, что с LLM ушли куда то не туда. Они все же сделали научный прорыв. Но при этом это закрытая область и я перечисляю 4 для этого причины.

При этом, нет никаких видимых препятствий, чтобы нельзя было заменить MLP + backprop на перцептрон и существенно ускорить вычисления. Вот, что я говорю.

Ваши соображения, скорее где-то параллельны с моими, просто вы используете другую терминологию и соответственно подходы.

Наверно, выше вы не заметили, поэтому повторю свой вопрос: вы математик или программист, или то и другое? Как вы делали свои эксперименты, у вас есть код для LLM?

P.S. я нахожусь в Европе, и ссылки которые вы даете на яндекс у меня не открываются.

На дворе LLM, а книгу о перцептроне так никто и не открыл!?

tac 3 сен 2025 в 10:41

т.е. теперь мы говорим исключительно о механизме внимания, который по вашему принципиально отличается от рекуррентности классических RNN ? А слои по которым бегает бэкпроп тут не причем, следовательно?

С другой стороны, раз вы говорите о марковских цепях, это означает, что вы говорите о системе "без истории", т.е. ваши выводы не могут относится не к рекуррентным сетям, например, к простому MLP+backprop? И даже больше, любая не рекуррентная сеть, не совсем понимаю что это значит, но то что вы называете "Система нашла выход из этого, через разрывы марковской цепи" не сможет этого сделать.

Всё, что вы хотели знать о перцептронах Розенблатта, но боялись спросить

tac 3 сен 2025 в 09:58

Уж точно не худшую, чем у бэкпропа. А история да, очень поучительная, особенно в той части, как много людей не читают оригиналы. Автору статьи, большое спасибо, за точную и выверенную информацию, а не распространение мифов, как повально делают (увы, в том числе, тут же на хабре)

На дворе LLM, а книгу о перцептроне так никто и не открыл!?

tac 3 сен 2025 в 09:52

Это не число рекуррентных шагов, это именно иерархия.

Давайте я тогда спрошу проще, вы в курсе, что в LLM токены (там нет понятия букв) появляются одна за другой, через рекуррентный шаг, сколько токенов, столько рекуррентных шагов и делает LLM?

На дворе LLM, а книгу о перцептроне так никто и не открыл!?

tac 3 сен 2025 в 08:51

У меня возник вопрос, вы математик или программист, или то и другое? В ваших рассуждениях есть важные слова про энтропию, но пока ничего о ИНС. Как вы делали свои эксперименты, у вас есть код для LLM?

На дворе LLM, а книгу о перцептроне так никто и не открыл!?

tac 3 сен 2025 в 08:40

Вы не правы дважды. Перцептрон не то, что может описывать иерархии, ему достаточно для этого одного слоя. Так же перцептрон имеет архитектуры и с большим числом слоев, только они ему как собаке пятая нога, но возможность есть, для тех кто не понимает для чего слои у ИНС. Во-вторых, в данном случае, вы говорите не об иерархиях, а о рекуррентности ИНС, ваше d это число рекуррентных шагов . Впрочем, думаю, все же скоро опубликую вторую статью, что более точно расставить акценты, поэтому следите как говорится за обновлениями, убирать незнание с каждым отдельно - затратно по времени.

На дворе LLM, а книгу о перцептроне так никто и не открыл!?

tac 3 сен 2025 в 07:54

Так Вы и подкрепляйте, когда говорите глупости о перцептроне )) То что вы привели какие то графики - они вообще не понятны, о чем они и что доказывают не ясно совершенно.

На дворе LLM, а книгу о перцептроне так никто и не открыл!?

tac 2 сен 2025 в 17:53

Перцептрон в классическом виде не может обеспечить полноценную иерархию связей.

Совершенно не понятно откуда вы это взяли.

Вы в курсе, что перцептрон это не дерево с иерархическими связями? Перцептрон это система уравнений, неравенств если точнее. Вас совсем не смущает, что вы смешиваете совсем разные математические понятия?

Да ладно, оставьте вы перцептрон в покое, вы о нем ничего не знаете. Вы покажите как интерпретировать в простом MLP работу backpropagation. Откуда у вас взялись иерархические деревья в системе уравнений?

Вы понимаете, что система уравнений имеет большую вычислительную мощность, чем все ваши иерархии, которые вы придумываете из-за своего антропного фактора мат. аппарату, который совсем не про это.

На дворе LLM, а книгу о перцептроне так никто и не открыл!?

tac 1 сен 2025 в 13:29

Могу даже уточнить

Откуда вы это взяли?

Из оригинала, книги Розенблатта "Перцептроны", раздел 10.3, и следующий 10.4. , Перцептроны с нелинейными передающими функциями

Видимо вы боретесь с ветряными мельницами - никакой экспоненциальной проблемы в перцептронах нет и никогда не было, в отличии от поделок для аппроксимации. Да, и нелинейность - это не ответ на несуществующий вызов. Поэтому это дискуссия дважды пустая ..

На дворе LLM, а книгу о перцептроне так никто и не открыл!?

tac 1 сен 2025 в 11:41

Впрочем, я посмотрел упомянутую вами статью про MNIST. Странно, что вы не увидели там экспоненту (500 тыс нейронов)

Видимо не дальше аннотации? Иначе бы увидели, что 1000 A элементов ничем принципиально не отличается от 500 000 A элементов.

Это не верно. Зачем вы на этом настаивали, мне было не ясно, но

Неверно, что? Вы или говорите или молчите, отгадывать ваши ребусы у меня нет времени. работа от Poggio именно этот тезис и обосновывает, если вы этого не понимаете прочитайте еще раз, или скажите на чем еще вы акцентируете свое внимание в этой статье, что это перестаете видеть

Откуда вы это взяли?

Из оригинала, книги Розенблатта "Перцептроны"

На дворе LLM, а книгу о перцептроне так никто и не открыл!?

tac 31 авг 2025 в 21:47

Опять же единственно правильный ответ был бы: каждый следующий слой дает иерархическое выделение признаков. Но это общие слова, а кто-то когда то показал это в научной статье?

Благодаря Вашей ссылке, этот вопрос частично снят. И мне теперь нужно изменить формулировку на "делались попытки это показать" (если дойдет дело в Introduction я эту статью в своей статье так и упомяну). Ответ же в статье именно такой же, но якобы строже. Но авторы заблуждаются. Учитывая, что я не математик, а статья исключительно математическая, я пролистал мат. часть ... но честно говоря мне этого и не нужно, они строят отдельно математическую теорию оторванную от практики и говорят "Finally, we make some concluding remarks in Section 6, pointing out a quantitative measurement for three notions of sparsity which we feel may be underlying the superior performance
of deep networks."

т.е. они предложили теорию, и она может объяснять, а может не объяснять. Реальный пример, который демонстрировал бы их математические выкладки - они не представили.

Поэтому я с уверенностью, могу их послать бороться и опровергать других математиков, которые работали с Розенблаттом, которые тоже математически доказывали, что использование нелинейной функции активации не дает ничего особенного.

Что же касается сути - в чем они заблуждаются - тут нужно много букв. Это нужно объяснять не в комментариях, и нужно подумать как, т.к. такие детали вряд ли будут интересны "жителям хабра". Но если вкратце заблуждение в том, что они не знают как правильно интерпретировать работы сети, и что нейронные сети совсем не подчиняются правилам деревьев, на основе которых они строят свою теорию. Бинарные деревья любой вложенности возникают в одном слое, и для этого совсем не нужны несколько слоев.

Единственно, вопрос в инвариантности - это интересно, но так как другое смазано не верным посылом, эффект распыляется ... нужно подумать, где там есть рациональное зерно.

Но в целом вот этот посыл "Проклятие размерности", на который вы видимо пытались все время указать - ведет к заблуждениям, это фиктивная проблема.

На дворе LLM, а книгу о перцептроне так никто и не открыл!?

tac 31 авг 2025 в 16:27

Спасибо. Я предпочитаю читать с конца )), дайте мне недельку - две :)

На дворе LLM, а книгу о перцептроне так никто и не открыл!?

tac 31 авг 2025 в 15:25

Для MNIST не сложнее. И я дал бы следующую работу от Poggio, например.

Уже похоже на аргумент, поэтому уточните, что именно за работа Poggio. И какую тогда задачу, для которой может быть эффект "экспоненциально сложнее" вы или как я понял, с ваших слов, вы ссылаясь на Poggio имеете введу?

Я же тоже не исключительно MNIST имею введу, или для вас задача четности, о которой тут шла речь, тоже частный случай? Если так, то назовите эту задачу, она классическая? Имеется введу задача на которой хорошо видно, что бэкпроп экспоненциально лучше перцептрона Розенблатта? Пойдем от обратного теперь, хоть одну? (только не нужно ссылок на Минского :) - бэкпроп ничего не сделал лучше по отношению к критике Минского, который конечно же был во всем прав - поэтому мы можем лишь обсуждать лишь сравнимые вещи, скажем так в области возможного, что оставил нам Минский)

Вы их не читали (ещё), но уже уверены, что они противоречат фактам. Не странно ли так утверждать?

Они противоречат фактам, которые мне известны, но раз мы наконец то перестали утверждать о всеобщности (с обоих сторон, как я теперь полагаю?), то найти область применения одного и другого (без вот таких вот выпадов, что бэкпро это некст левел, экспоненциально лучше всегда и т.п.) уже похоже на конструктив и я готов продолжать такого рода дискуссию.

Разве?

Конечно, нет. Потому что один глас в пустыне не слышен, да и он не уровня Исуса )

На дворе LLM, а книгу о перцептроне так никто и не открыл!?

tac 31 авг 2025 в 12:49

С работами выше я ознакомлюсь, не скажу, что быстро, но посмотрю. Но сразу могу ответить на это

Да, мы можем что угодно* сделать однослойной сетью при наличии бесконечных ресурсов. Если ресурсы конечны, мы всегда хотим использовать многослойную, это гарантировано лучше (в теории, если мы можем решить все проблемы, связанные с обучением). Не чуть-чуть лучше, а экспоненциально лучше. Существенная разница.

Это не соответствует фактам. Про экспоненциально лучше это просто глупость, если вам не нравится мое авторство (да, в отличии от вашего признания, я пишу научные статьи), то могу сослаться и на других:

Kussul E., Baidyk T., Kasatkina L., Lukovich V. Перцептроны Розенблатта для распознавания рукописных цифр

Дальше зависит от задач, где то чуть-чуть лучше, где то чуть-чуть хуже, но всегда существенно быстрее, естественно, для перцептрона. И с kuza2000 началось конструктивное обсуждение в личке и мы это в очередной раз проверяем. Но т.к. для kuza2000 неизвестна другая сторона - перцептрон, нужно время. (да, наоборот, опыта с бэкпропом у меня меньше, т.к. он теоретически не перспективен, и я на нем поставил крест (научными работами) еще во время магистратуры). Поэтому да, спустя 20 лет я уверен в том, что говорю. И ничего, не изменилось бы, если бы не LLM. Но как и написал тут в статье на хабре, а она имеет статус "мнение", если бы не массовые фейк ньюс о LLM (это послужило даже поводом, дать нобелевку за бэкпроп), то это не стоило бы моего внимания. Но тем не менее допускаю, что какие то тонкости с бэкпропом не знаю.

На дворе LLM, а книгу о перцептроне так никто и не открыл!?

tac 31 авг 2025 в 11:20

Вы их не спрашивали ... Почему вы решили, что я не заметил?

Вы уж выберите или не заметили, или нет аргументов. Потому что ровно в этой фразе я их и спрашиваю. Ну и потом вы вроде претендуете на научный диалог, а там ничего кроме аргументов и быть не может, поэтому "спрашивать аргументов" - это нонсенс, они или у вас есть или нет? Видимо, все же нет. Мне было на секунду, показалось, что вы сможете родить мышь, но нет даже этого.

И можете сделать вывод, что я не разбираюсь, потому что содержательных аргументов я избегал и это выглядит, будто их нет

Пожалуй я так и сделаю. Хорошо, что признались в намеренном позерстве.

На дворе LLM, а книгу о перцептроне так никто и не открыл!?

tac 31 авг 2025 в 10:19

Так может быть вместо того, чтобы строить свои догадки обо мне и том как я якобы отношусь к исследователям (хотя я нигде про это не написал, а вы сделали выводы на голом месте; к исследователям у меня претензий нет, т.к. они в отличии от тех о которых я писал в статье, таких глупостей про перцептрон не пишут, разве что один - Ф. Уосермен) - лучше привести те аргументы, которые вы знаете? И заметить другие мои слова в статье и прочитать их буквально, а не придумывать за меня?

Но это общие слова, а кто-то когда то показал это в научной статье? Подскажите если знаете, я лично таких статей не знаю.

"И если бы кто-то спросил, в чём [фундаментальные] проблемы нейросети с одним слоем, я был бы рад ответить "

Пока не вижу вашего желания, вижу лишь то, что Вы начали с позерства.

И нет о сверточных сетях я не знаю, было бы интересно узнать, что именно вы имеете введу. Вы или оппонируйте, приводя аргументы, или не позёрствуйте, пока выглядит совсем наоборот, что вы цепляетесь за какие то поверхностные представления. А то что вы считаете якобы строгим, на проверку оказывается простым балабольством? Может говоря о сверточных сетях вы имеете введу ровно то ,что я и написал: "каждый следующий слой дает иерархическое выделение признаков"? Ну тогда внимательнее читайте и если отвечаете, то по сути.

P.S. И да - это вопли, перестаньте вопить.

1 2

4 5 ...

106 107

В рейтинге: Не участвует

Зарегистрирован: 14 февраля 2012

Активность: 2 декабря 2025 в 15:29

Разработчик игр, Архитектор программного обеспечения

Ведущий

ООП

ASP.NET

Microsoft SQL

Разработка игр

C++

Программирование микроконтроллеров

Разработка программного обеспечения

WPF

Unity3d

Информация

Специализация