Comments / Profile of Kreastr / Habr

User

В Сенате США посчитали, что ИИ и автоматизация угрожает до 97 млн рабочих мест. Решение — налог на роботов

А что кто-то ожидал от Берни Сандерса и его аппарата других выводов и предложений? В чем собственно новость? Я понимаю, если бы вот это все предложил бы Трамп или хотя бы кто-то видный от республиканцев.

В Сенате США посчитали, что ИИ и автоматизация угрожает до 97 млн рабочих мест. Решение — налог на роботов

Kreastr Oct 8 at 20:52

Весь мир уже смотрит с попкорном на финансовые "успехи" контор которые посокращали 30% процентов офисных сотрудников и заменили их ИИ, а в Виллабаджо только домывают посуду и собираются сокращать.

+12

Где поток ненужного софта? Почему заявления об ИИ-ассистентах не сходятся

Kreastr Sep 8 at 00:45

А падение производительности в связи с гораздо более легким скатыванием в прокрастинацию потому что:
а) осознал, что теперь "ассистент" больше не может сам исправить простейший баг и теперь надо перечитать 500 строк говнокода.
б) достало ждать по 30 секунд чтобы поправить две строчки, но сам не хочешь нажимать на кнопки а так же теперь надо перечитать 500 строк говнокода.
в) код эволюционирует сам по себе и требует полного ревью 500 строк говнокода после каждого изменения.

Думаю найдутся еще причины для прокрастинации, если устроить опрос.

+24

На дворе LLM, а книгу о перцептроне так никто и не открыл!?

Kreastr Aug 29 at 00:25

Ну по большому счету гарантированая сходимость не нужна. Скорее она даже будет мешать, потому что гарантировать она будет минимум по обучающей выборке, а нужен совместный "минимум" по обучающей и контрольной для того чтобы обеспечииь хороший уровень обобщения.

Проблема LLM КМК все же не в бакпропе а в том, что есть в общем-то случайное деление на обучающую и контрольную выборки и от того как поделить + начальных значений бэкпропа очень сильно меняется результат. Поэтому просто глядя на сеть никто не может гарантировать как она работает. Но это только в отдельном кейсе без направленного изучения.

Что касается послойного выделения фич в целом, то есть работы которые косвенно, но убедительно эту гипотезу подтверждают. Вот тут, например, в цитируемых работах раздолье по этому поводу https://arxiv.org/html/2406.10868v2 Вообще ищут и нейроны (отдедбные и группы) по темам и по задачам. Да и в принципе процесс дистилляции изучают и оптимизируют потому что хочется эффективных узконаправленых специалистов получить. А дистиляция по-сути и есть выделение важных для темы нейронов и редукция остальных.

Разработчик Pwnagotchi предложил использовать бейдж Human Coded для проектов, которые созданы без помощи нейросетей

Kreastr Aug 25 at 23:12

Без компилятора и без ассемблера

Почему LLM не мыслят как люди

Kreastr Aug 2 at 21:12

В цитате написано не то, что ее обучали на математике. Если бы все этим ограничивалось, то как раз было бы правильно. Там написано, однако, что обученой на чем-то еще сети дали для этой задачи базу даннных по математическим проблемам и дополнительные инструкции как отвечать на вопросы которые видимо составлял человекз, знающий как попасть в заветные топ 8% для получения золота.

Для сравнения в 2024 году те же компании выставили сеть которй для участия требовался человек-интерпретатор задачи в специальную нотацию которую видимо уже сеть может понять или скормить вспомогательному тулу или по которой можно найти данные в специализированной бд-шпоргалке. В этом году интерпретатор уже не потребовался, но думаю что суть поддержки, которую получает сеть "общего назначения", чтобы начать решать математические задачи можно оценить.

Почему LLM не мыслят как люди

Kreastr Aug 2 at 21:00

Потому что аддоны не часть ЛЛМ. Это внешние интерфейсы. Суть аргументации автора и цитируемых статей в том и состоит - ЛЛМ невозможно считать полноценной самодостатояной архитектурой, потому что ей требуются "аддоны" чтобы дойти в тестах на "спосбность думать" даже до уровня одаренного школьника. Поэтому предложено искать другие архитектуры, а не пытаться увеличить размер сети еще в 10, 100, 1000 раз.

Умение обощать и находить аналогии свойственно не только ЛЛМ. А вот отсутствие способности инвертировать отношения между объектами это дефект для устранения котрого и предложено искать альтернативы.

Почему LLM не мыслят как люди

Kreastr Aug 2 at 20:48

Кажется я лучше понииаю Вашу позицию, но тут проблема с моей точки зрения в системе координат. У нас нет эталонного теста на разумность, а только мешок из суррогатов. Школьники тестируются на одном наборе, ЛЛМ в основном на других, но иногда вот совпадают метрики. Но они очень несовершенны. И автор приводит примеры задач с которыми ЛЛМ фундаментально не справляются, а школьники (большинство, но не обязательно все) справились бы. Вы в свою очередь приводите в пример метрику по которой отличить ЛЛМ от школьника больше нельзя. Но это не отменяет существования тех по которым можно. И суть этих метрик врядли можно назвать тривиальной или несущественной. Поэтому пока, если верить сути цитируемх публикаций, нет проблемы двух стульев. Есть отличия и по этим отличиям пока можно считать, что ЛЛМ пока не умеют думать на уровне школьника.

Это по сути Вашего сравнения со школьниками.

А по сути моего утверждения, то оно все еще про чистые ЛЛМ без созданных человеком данных или систем. По этому определнию Ваш контрпример не подходит.

И суть статьи как я понимаю про то же - нам нужны альтернативы именно ЛЛМ чтобы улучшить результаты всей систесы в целом.

Почему LLM не мыслят как люди

Kreastr Aug 2 at 17:40

Но мы то обсуждаем способность ЛЛМ без "аддонов" решать такие задачи, а не способность ЛЛМ с такой помощью решать школьные задачи повышеной сложности. Эта шпоргалка и есть локальная база, да еще и качественно подобраная человеком, чтобы решать конкретный класс задач на котром сеть будут "проверять". Без нее очевидно ожидаемый результат был очень грустным и не интересным в качестве пиара.

Я не отрицаю способность ЛЛМ с внешними костылями которые пристроил человек решать и более сложные задачи. Но Вы же говорите про способность ЛЛМ думать. Маловероятно, что эта способность появляется от добавления в систему поиска по интернету. Про такое "думание" и у школьниуов вам любой школьный учитель расскажет много хорошего.

Почему LLM не мыслят как люди

Kreastr Aug 2 at 15:24

"To make the most of the reasoning capabilities of Deep Think, we additionally trained this version of Gemini on novel reinforcement learning techniques that can leverage more multi-step reasoning, problem-solving and theorem-proving data. We also provided Gemini with access to a curated corpus of high-quality solutions to mathematics problems, and added some general hints and tips on how to approach IMO problems to its instructions."
И вручили воооооот такую шпоргалку по решению задач этой олимпиады ну так, на всякий случай.

Почему LLM не мыслят как люди

Kreastr Aug 2 at 13:36

LLM без костылей вообще мало что могут. Архитектура ChatGPT это уже давно не только LLM. Это и интергация со статическими базами фактов и с динамическими источниками вроде поиска в интернете или по локальным документам. Это куча вспомогательных вычислительных средств, которые расширяют очень грустные математические способности LLM. И, вероятно, еще куча разных проприетарных хаков и скрытых инструкций о которых мы не догадываемся.

Люди которые «едят и не толстеют», в реальности мало едят или много двигаются

Kreastr Jul 19 at 23:48

Например так. 50 лет назад болезни сопутствующие избыточному весу приводили к очень ранним смертям. Для примера у женщин повышеный вес при беременности создает огромные риски развития временного диабета и других побочек не считая размер плода. Вот 50 лет назад на эту половину населения действоали эффекты дичайшего отбора по Дарвину.
Не думаю что это единственный компонент, но генетика вполне может быть фактором именно в силу резкого роста генетического разнообразия под влиянием медицинских достижений.

Люди которые «едят и не толстеют», в реальности мало едят или много двигаются

Kreastr Jul 19 at 23:38

К тому что уже ответили добавлю. Еще есть очень неприятный эффект адаптации. Как только калорий становится мало организм начинает оптимизировать внутреннюю кухню чем снидает суточный расход калорий. Эти оптимизации потом очень медленно откатываются если вообше. Плюс в том что неоптимизирлванный расход энергии на внутренние дела (в первую очередь на иммунитет) приводит к хроническим болезням из-за например избыточной активности того же иммунитета. Так что даже сбросив 10 кг Вы сделали себе большую пользу в долгосрочной перспективе.

ChatGPT предложил научные идеи «на грани»: от лечение старения до континуума когнитивности

Kreastr Jun 13 at 01:02

Кстати недавно была волна популяризации имени Веритасиума о том, что свет на самом деле ни по какому кратчайшему пути не идет, а по всем вощможным сразу. Просто для большинства путей сумма из-за фазового сдвига стремится к нулю и только пути рядом с кратчайшим дают ненулевое значение.

В статистике Steam доля Linux достигла 2,69 %

Kreastr Jun 3 at 06:41

Замер PewDiePie эффекта удался. Неплохой такой эффект на 0.42% рынка. Ему бы инфлуэнсером работать. А хотя погодите.

Энтузиаст добавил предохранители в кабель питания GeForce RTX 4090 для предотвращения оплавления контактов

Kreastr May 24 at 20:51

И как оно у них, нормально тепло отводило? Не мешало процессору остывать?

Джон Кармак: мы все могли бы работать на старом компьютерном оборудовании, если бы оптимизация ПО была приоритетом

Kreastr May 14 at 05:53

И как они, хорошо оптимизируют порядок независимых команд, чтобы выжать максимум из пайплайнового параллелизма современных процессоров в которых микроархитектура это в общем черный ящик да еще и такой, который от варианта к варианту и от версии к версии процессора меняется? Или они топорно меняю цикл на векторные инстрцкции везде где видят и на этом все?

Я могу поверить в хорошую оптимизацию, когда вендор поставляет свой компилятор под свое железо потому что у них (возможно) есть внтуренние доки и качественные эмуляторы для тестов. Но тогда возникают вопрос, а достаточно ли один вендор может выдедить ресурсов на разработку своего компилятора.

Kreastr May 14 at 05:23

А это точно не логи ради логов? Была когда-то вроде даже на хабре прохладная история о том как в пятницу вечером пытались понять почему падает производительность системы добавляя и добавляя новые логи. Пока в конечном итоге просто не грохнули их все и заработало как должно.

Так то судя по всему Кармак именно о том и говорит, что модульная микросервисная архитектура пораждает оверхеды (в том числе на логирование потому что как иначе разбираться что там сломалось) и без вот этого всего можно было бы жить гораздо эффективнее.

Хочешь успешно продавать ИТ-продукт? Прекрати тыкать фичами

Kreastr May 2 at 00:33

Мне кажется конверсия в просмотры видео (и качество просмотров) будет больше, если Вы покажете суть этого четвертого этапа в статье. КМК одной интригой тут не отделаетесь. За остальное - спасибо. Было интересно, хоть начало и ощущается хамовато. Но это, видимо, специфика профсреды.

Процессоры ARM: смешиваем NEON с SVE — и забава, и польза

Kreastr Apr 25 at 18:58

А что принципиально невозможного? Если SIMD блоки отключаются флагами, то всегда просто можно выбрать, что Вам нужно. Не считая этого Армы как раз и эффективны потому что у них почти всегда есть деление на энергоэффективные ядра без этих вот наворотов вообще да и еще и с маленьким кэшем, урезаным пайплайном и почти без спекуляций и на производительные для тех кейсов, где либо время критично либо тех, где использование SIMD даст больше FLOPS/W

Настоящая дихотомия это энергоэффективность (много кусков которые работают попеременно каждый эффективно и на низких частотах) vs пиковая производительность (энергоэффективность важна, но фокус на выжимаем каждый флопс производительности из доступного теплопакета). Вот со вторым Армы даже не пытаются.

2 3 ...

18 19