Comments / Profile of buriy / Habr

Юрий Бабуров@buriy

Web, AI, Deep Learning, Python

Subscribers

TSMC: почему 90% передовых чипов в мире делают на одном взрывоопасном острове

рисовать деньги нельзя, иначе будет инфляция, но можно печатать согласно количеству имущества, на которое есть расписки в банках ;) а вот про причинение демократии тут все верно, но если бы не было развитой экономики, не было бы и обеспечения экспорта, и почему-то у других экономику развивать не так хорошо получается, неужели это АНБ везде успевает всем всё испортить?

TSMC: почему 90% передовых чипов в мире делают на одном взрывоопасном острове

buriy Apr 26 at 23:11

постойте, здесь возможна подмена понятий, мы говорим о фабриках, располагающихся в америке или работающих на америку? ;)

TSMC: почему 90% передовых чипов в мире делают на одном взрывоопасном острове

buriy Apr 24 at 13:24

у США не было и не будет столько людей готовых работать за небольшую зарплату, так что не могли, это как "сырьевая страна" -- у кого-то сырье есть, а ктто-то зарабатывает на перепродаже

Claude стал «меньше думать» и чаще ошибаться по данным анализа логов

buriy Apr 14 at 21:04

https://t.me/datastorieslanguages/636:

Про качество: link (https://github.com/anthropics/claude-code/issues/42796#issuecomment-4194007103). В начале марта дефолтное значение thinking effort/budget было уменьшено с high/max до medium. Это прям сильно ударило по качеству, я даже на работе заметил. К счастью, это решается просто: достаточно запускать claude --effort max или проставить это в настройках.

---
https://t.me/tired_glebmikheev/2608:
Поставь вот эти настройки в переменные окружения

export CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1 export CLAUDE_REASONING_EFFORT=max

---
https://t.me/agent_coding/5247 :
В ответ на гипотезу о том, что виноват свежий 1M‑контекст и работа без /compact после 200k токенов, Борис предложил решения, которыми можно вернуть прежнее поведение:

🟢 /effort high или /effort max — поднять максимальный бюджет thinking‑токенов на задачу;

🟢CLAUDE_CODE_AUTO_COMPACT_WINDOW=400000 — принудительно укоротить рабочее окно контекста.

🟢CLAUDE_CODE_SIMPLE=1 — упрощенный режим для проверки гипотезы об интерференции системного промпта.

Дополнительно есть CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1, он отключает адаптивный режим и возвращает фиксированный бюджет рассуждений.

Галлюцинации LLM — это артефакты сжатия. И это объясняет вообще всё

buriy Apr 5 at 16:36

Нейросеть одновременно учится предсказывать продолжения с учётом того, как бы на вопросы отвечали разные люди. И "настройками кодека" в промпте вы выбираете шаблон "того человека, который отвечает". Если вы его не укажете, то будут настройки создателей (с третьего этапа обучения, RLHF. Вряд ли вы даже пользовались в последний год сетями без -instruct и -rlhf донастроек.)

И вот вам шаблон от создателей заходит больше чем ваши дополнительные настройки.

MiniMax представила M2.7 — модель, которая участвовала в собственной разработке

buriy Mar 18 at 19:48

вот только люди задают модели критерии правильности, без них модель не может улучшаться в правильную сторону.
правила эти текстом нормально не описать, а если и можно описать, то в половине случаев модель на них забивает и делает по-своему, поэтому ~~пожилой китаец с палкой~~ программист за этим следит и исправляет генерацию.

Первый в мире коммерческий мозговой имплант: Китай обошел Neuralink в нейротехнологической гонке

buriy Mar 15 at 23:54

Там же вроде была проблема не в подключении, а в том, что имплант через 1-2 года переставал работать из-за отторжения. Китайцы это решили?

Семантический поиск vs полнотекстовый: сравниваем три embedding-модели на 10 000 категорий Ozon

buriy Mar 15 at 23:47

Я думаю надо попробовать еще расшифровывать строчку классификатора перед взятием эмбеддинга с ЛЛМ. Вдруг индексы начнут гораздо лучше работать. Также и описание товара тоже расшифровывают, бывает.

Tesla Optimus: реальность против обещаний

buriy Feb 14 at 13:39

разрешающая способность не даст поток в 1 гбит потом,
и вообще, у нас передается сжатый поток, несжатого потока на 1 гбит не передается, о чем и спорит ЗанЗи.

А вы всегда пьёте коньяк на завтрак или только по выходным?

buriy Jan 26 at 22:55

>21. Эффект Даннинга — Крюгера (Dunning–Kruger Effect)

>Люди с низким уровнем компетенции склонны переоценивать свои способности, а профи — наоборот, сомневаться в себе (привет, синдром самозванца).

Вот только это не так...
Пометьте там у себя в списке, пожалуйста, что знать это надо, но надо знать и то, что это не так, и работа была убедительно опровергнута (и это разбиралось на хабре).

28. Слепо доверять авторитетам
Людям лень перепроверять информацию.

INTELLECT-2: Первая большая (32B) параметрическая модель с распределенным обучением

buriy May 14 2025 at 15:38

Прикольно, конечно, но RL это от силы 10% от всей тренировки, а временами и 0.1-1%. То есть, добровольцев надо в 100 или 1000 раз больше, чтобы реально обучить модель с нуля, а не затюнить её. И ещё датасет всем надо раздать, а это терабайты. Хотя, конечно, тут можно сделать одного сидера и раздавать всем только нужные им куски датасета.

13 млрд счётчиков и 220 000 RPS на запись: проектируем Key-Value-хранилище для Спамообороны

buriy Oct 25 2024 at 20:26

1) ну я бы сказал что Lucene с его сегментами медленный, и LSM базы получше будут, но на 220к запросов в секунду я конечно не тестировал.
2) а так в целом всё это напоминает наивный байесовский подход, потому что все фичи независимые друг от друга и не коррелируют друг с другом.
3) для массовой фильтрации писем технология хорошая, но что если конкретному пользователю надо больше писем помечать как спам (не из-за редкости, а из-за въедливости и раздражительности)? Будете его разметку игнорировать, потому что глобально большинство спама не такое? Или же у вас ещё есть мини-байес для этого конкретного пользователя для донастройки?

Самый быстрый фреймворк на Диком Западе: ускоряем Django-rest-framework вместе с Rust

buriy Aug 20 2024 at 11:27

ну как? :)

Самый быстрый фреймворк на Диком Западе: ускоряем Django-rest-framework вместе с Rust

buriy Jul 28 2024 at 16:52

а я всё равно не понял, где там циклы. максимум -- поиск по индексу там должен быть, с ним 100к небольших объектов сериализовать должно быть реально за секунду.

Манифест Киберправды

buriy Mar 23 2024 at 16:01

Ничего секретного в вашей технологии нет, а не используется она потому что никому в таком виде не нужна. Сделать расширения для браузеров, рисующих эту иконку -- дело пары часов, но никто в интернете не будет писать эти опровержения, комментарии и всё прочее, никто не будет индексировать все комментарии в интернете -- и для вашей системы не будет информации, чтобы записывать в этот миллион-терабайтный блокчейн, на хранение которого у вас ещё и нет денег.

Ваш продукт должен создавать ценности больше, чем стоить денег для поддержания работоспособности. Иначе он умрет.

Нейропластичность: как развивать свой мозг после 25 лет

buriy Feb 11 2024 at 19:10

У человека в гиппокампе тоже предположительно происходит нейрогенез (только исследовать его сложно даже на приматах. поэтому я вставляю "предположительно").
https://en.wikipedia.org/wiki/Adult_neurogenesis

Нет, в лобных долях коры нейрогенеза нет, и нейроны у взрослого туда не прорастут и не переместятся, там есть нейропластичность -- это когда дендриты (и нейроны в целом тоже) могут поменять назначение, чтобы заместить выполняемые соседними клетками и зонами коры функции. Про нейропластичность как раз и написана большая часть статьи. И нейропластичность как раз и основана на тренировках.

Нейропластичность: как развивать свой мозг после 25 лет

buriy Feb 6 2024 at 18:23

>Новые нейроны у взрослых людей не появляются, разве что у раковых больных.
Ваши знания устарели минимум на 20 лет, новые нейроны появляются, 700 новых нейронов образуется в гиппокампе в день, ещё есть несколько зон поменьше с нейрогенезом.
Вот скажем первая попавшаяся статья: https://rtvi.com/news/oni-vosstanavlivayutsya-chto-uchenye-uznali-pro-nervnye-kletki/

>Гиппокамп - это источник веществ (вроде гармонов, нейромедиаторов) для нормальной работы мозга
Увы, это так не работает.
Гормоны -- это общее название для всех управляющих веществ организма.
Нейромедиаторы -- вид гормонов для нейронов, и любой нейрон вырабатывает нейромедиаторы, а не только нейроны гиппокампа.
Поэтому ваше утверждение неверно по сути, хотя по факту вы верно всё говорите. Сравните ваше утверждение с "видеопамять это источник веществ (вроде элементарных частиц, электронов) для нормальной работы компьютера".

Сказ о том, как я за год решил более 600 leetcode задач

buriy Jan 17 2024 at 05:38

Состояние потока получить легко -- это когда вы сделали что-то (лёгкое), мозг это запомнил, и теперь вы с энтузиазмом продолжаете делать дела. Нужно поставить какую-то очень простую и лёгкую задачу для разгона, и нужно чтобы потом наготове была задачка посложнее + отсутствие отвлечений, и вы не переключились из-за ваших вредных привычек на развлечения. Исключение -- если у вас ADHD (пройдите скажем тест) и так просто сконцентрироваться не получается физиологически, тогда лучше посоветоваться с врачами, сейчас есть много разных веществ в небольших дозировках.

Вероятно, вы неправильно используете метод __init__ в Python

buriy Dec 1 2023 at 02:13

Статью можно свести к тому, что вместо

class Configuration:
    def __init__(self, filepath):
        self.filepath = filepath
        self._initialize()

следует использовать

class Configuration:
    def __init__(self, filepath=None):
        self.filepath = filepath
        if filepath:
            self._initialize_with_filepath()

Но это меняет контракт класса, и теперь возможно сделать конфигурацию без пути.

Контракт класса определяется архитектором, если он считает, что конфигурация без пути не должна существовать, то значит так оно и есть. А вариант "класс может иметь любое внутреннее состояние" (в т.ч. недопустимое с точки зрения бизнес логики) приводит потом к трудноуловимым ошибкам в дебаге.
Например, мы заложились на то, что путь у конфигурации всегда есть, а потом словим NoneType error при попытке по этому пути обратиться.
Или же потом присвоим объекту filepath, забыв сделать инициализацию.
Получится глупо и больно.
Так что не надо такой категоричности.

Разоблачаем Эффект Даннинга-Крюгера. Статистический артефакт, пример автокорреляции

buriy Nov 26 2023 at 16:20

Переранжировка -- это когда мы берём результаты теста, и наихудшему даём значение 1, следующему -- значение 2, дальше 3, 4, и так далее до 100.
Если человек 5, а не 100, то чисел на всех не хватает, поэтому они берут равноудалённые точки на прямой линии от 0 до 100, например, если у них 4 когорты, то одной когорте они приписали значение 15, второй 40, третьей 65, четвёртой 90 ( то есть, 10 + 25*n ).

2 3 ...

41 42

Information

Specialization