Comments / Profile of alexey

User

Ваш текст написан в духе просвященческого (18-19 век: Эпоха просвещения) оптимизма. Более поздняя философия его раскритиковала (к середине 20 века точно, начала в конце 19). "Оптимизм" уперся в потолок и частично обратился в свою противоположность, в пессимизм насчет светлого будущего науки.

Магия и наука имеют один и тот же корень: достижение власти над природой. С помощью заклинаний или с помощью формул (похожих на заклинания). Можно сказать, что Наука - это магия, вооруженная методом (тем самым “научным методом”).

В чем же тогда “магичность сознания”? Ответ: в отходе от научного метода. В чем суть научного метода? В экспериментальном характере. Т. е. научное знание базируется на эксперименте, если научная теория “истинная”, то сколько бы мы раз не поставили эксперимент, результат опыта будет ей соответствовать. Что такое “эксперимент” - это очень сложное явление, которая включает в себя в том числе “обратную связь” от испытуемого объекта. Это принципиально важно. Вообще любой процесс обучения в обязательном порядке подразумевает наличие обратной связи. Например, в математике, чтобы убедиться, что ученик понял теорему (овладел ей - опять отсылка к “власти”), надо ее применить для решения задачи (и проверить себя через ответ в учебнике, что задача решена верно, а значит теория усвоена правильно).

Ему для вождения вовсе не обязательно знать устройство автомобиля во всех деталях, но крупными мазками он знает как оно устроено, зачем руль, педали, коробка передач, аккумулятор, двигатель внутреннего сгорания. Если надо - может сделать некоторый ремонт, например заменить колесо.

У вас собрано в один абзац: “Знание как устроен” и “умение пользоваться”. В цирке медведь выезжает на автомобиле на арену, т. е. умеет пользоваться, но не имеет никакого представления о “коробке передач”. Человек много чем умеет пользоваться, понятия не имея, как оно устроено (хорошо, если 0,1% пользователей смартфонов хотя бы в общих чертах расскажут об его устройстве). Но проблема глубже. Вот это вот “знаю как устроено в общих чертах”, это не “знание” (власть над объектом знания), это вера в то, что прочитанное в “инструкции к автомобилю” или в Википедии, в статье про устройство смартфона, человеку изложили что-то, имеющее отношение к действительному устройству этих приборов.

Но и это не все, кроме “правильного изложения” должно быть “правильное понимание”, т. е. получение той самой ожидаемой обратной связи от объекта исследования. Если обратной связи нет, то нет никакой уверенности, что человек “понял правильно” и вообще “понял хоть что-то”. Кому-то “коробка передач” (после прочтения инструкции) представляется в виде шестеренок в масле, цепляющихся друг за другу, а кому-то в виде треугольничков и квадратиков, а то и “вихрей”, кому-то в виде электрического мотора, сдвигающего рычаг, и т. д. вплоть до эльфа, сидящего в коробке. Правильным будет то представления (с точки зрения научного метода), которое будет давать ожидаемый результат при эксперименте над этим объектом.

Но человек не может ставить бесконечные эксперименты над всем, что его окружает. Никакой жизни не хватит. Поэтому для него эквивалентно “синяя ли это магия, уходящая в трубу” или магия “коробки передач, аккумулятора и двигатель внутреннего сгорания” и то и другое - вопросы веры, а не знания. До того момента, когда ему вдруг не понадобится проявить свою власть и что-то предсказуемо для него изменить внутри автомобиля. Если с автомобилем это теоретически возможно в очень узких пределах, типа аккумулятор подзарядить (хотя большинство автовладельцев в городах открывают капот только чтобы залить омывайку), то для смартфона, залезть и что-то сделать с “процессором” не реально.

Т. е. смартфон (ну или процессор смартфона или компьютера) является чисто магическим прибором, про который мы ничего не знаем, но умеем пользоваться. “Глубина познания” определяется только набором слов (можно выбирать, верите ли вы в “магический кристалл” или в “кремниевый кристалл”). И верой. Вы можете прочитать статью в википедии про процессор и поверить, в то, что вам там напишут. Вас могут легко обмануть, нарисовав какую-нибудь схему не имеющую никакого отношения к реальному процессору. Ваше представление мало будет отличаться от представления о магическом кристалле внутри черной коробочки, управляемым "вселенской энергией” (если вы не работаете, например, в Qualcomm)

Большая LLM с сотнями миллиардов параметров работает точно также, как и малая на несколько сотен миллионов параметров, если у них аналогичная архитектура.

наш опыт каждодневный (кто пользуется LLM) говорит, что нет. Т. е. это утверждение противоречит опыту (а значит элементу “научного знания”). Т. е. это строго не научное утверждение (утверждение веры в “магию подобия”)))

создание проекций с помощью UMAP, дают возможность из отдельных частей складывать представление о том, что происходит с данными, попадающими в модель, какую "форму" (топологию) они принимают (кластеров, циклов, мостов, связностей и т.д.)

Это фантазии. Может могут привести, может нет. Пока наваливают больше слоев, больше параметров и получают лучший результат (не всегда).

Это в перспективе может привести нас к новому уровню, на котором мы будем проектировать и работать с моделями не как чёрным ящиком, а полностью спроектированными нами до последнего винтика "думающими машинами", с такими параметрами и свойствами, которые требуются для выполнения конкретной задачи.

Пока не получалось, движение в обратную сторону (со второй “весны ИИ”) - наваливаем параметров, наваливаем данные, получаем лучший результат. Кстати, этот подход разорил Абби (компанию), они пытались сделать универсальную модель языка и на ее базе универсальный переводчик, очень красивая идея. Но их замочили нейросетевые переводчики, которые не заморачивались “моделями” (устройством языка, его описанием) наваливали параметры и тексты для обучения. И вуа-ля “магия”. Работает. И второе "мы" это те маги (ученые), которые сидят в компаниях, перечисляемые по пальцам и получают обратную связь при обучении LLM, меняя входные параметры и алгоритмы. С нами они делятся очень скупо. У нас только "общие представления", как обучены современные LLM. Для нас с вами это черные ящики (если вы не в Яндексе или Сбере среди тех нескольких десятков человек, которые плотно занимаются этими технологиями).

Нужно всё время стремиться проникнуть в суть на ещё большую глубину. Для этого не нужно становиться киборгами. Нужно углублять технические знания человечества, сделав думающие машины внешним продолжением нашего мозга - множителем его возможностей проникновения в тайны материи.

Оставив за скобками обсуждение наивности такого лозунга (из цикла “за все хорошее”), повторю, что технически про то, как устроена LLM все досконально известно (статья “Внимание это все что нужно” 2017 или 2018 года). сложение и умножение матриц, нелинейная функция, аргументом которой являются векторы. Тривиальщина. Но чтобы понять, какая модель лучше (например) модели гоняют по тестам, которые больше похожи на тесты по проверки IQ человека, вместо того, чтобы получить какую-то численную характеристику “хорошести”. Нет такой характеристики, нет такой модели модели. Можно ли ее построить - неизвестно (никто не построил математическую модель психики или исторического процесса).

Нам нужны технические знания в том числе чтобы делать более совершенные модели ИИ, потому что текущий уровень - не вершина эволюции. И любой другой нами достигнутый не будет вершиной. А будет только приближением.

Опять лозунги. Будет ли достигнут другой? Нами (или допустим уже неким искусственным разумом?) Будет ли только приближение или скачком перепрыгнет человеческий разум и ворвется в синергию? Неизвестно и никто не может предсказать. Курцвел, например, в 2014 году ждал к 2030 или 2035 "синергию"

Это один аспект (вы утверждаете: “прогресс неостановим”, и “прогресс вечен”, оба спорные)

Есть другой аспект, не важно, каков прогресс, важно, как он будет на нас влиять. процитирую самого себя (из другого комментария):

не надо AGI (ИИ равного или превышающего человеческий), надо, чтобы технология могла делать то, что делают люди. Она это может, осталось только "довести до ума".
А дальше включатся механизмы "рынка труда". И если допустим, вы работаете на должности, которая (пока) защищена, например, мастерите какую-нибудь "звезду смерти" (программный проект настолько большой, что не в один контекст не влезет с кучей интеграций и т. п.) или наоборот, таскаете компьютеры в офисе и втыкаете в них всякие провода. Вашей проблемой будет не LLM, а те люди из соседних офисов, которых она оставила без работы и которые умеют примерно тоже самое, что и вы.

Или по другому - нам бы тот, который есть переварить.