рисовать деньги нельзя, иначе будет инфляция, но можно печатать согласно количеству имущества, на которое есть расписки в банках ;) а вот про причинение демократии тут все верно, но если бы не было развитой экономики, не было бы и обеспечения экспорта, и почему-то у других экономику развивать не так хорошо получается, неужели это АНБ везде успевает всем всё испортить?
у США не было и не будет столько людей готовых работать за небольшую зарплату, так что не могли, это как "сырьевая страна" -- у кого-то сырье есть, а ктто-то зарабатывает на перепродаже
Про качество: link (https://github.com/anthropics/claude-code/issues/42796#issuecomment-4194007103). В начале марта дефолтное значение thinking effort/budget было уменьшено с high/max до medium. Это прям сильно ударило по качеству, я даже на работе заметил. К счастью, это решается просто: достаточно запускать claude --effort max или проставить это в настройках.
--- https://t.me/agent_coding/5247 : В ответ на гипотезу о том, что виноват свежий 1M‑контекст и работа без /compact после 200k токенов, Борис предложил решения, которыми можно вернуть прежнее поведение:
🟢 /effort high или /effort max — поднять максимальный бюджет thinking‑токенов на задачу;
Нейросеть одновременно учится предсказывать продолжения с учётом того, как бы на вопросы отвечали разные люди. И "настройками кодека" в промпте вы выбираете шаблон "того человека, который отвечает". Если вы его не укажете, то будут настройки создателей (с третьего этапа обучения, RLHF. Вряд ли вы даже пользовались в последний год сетями без -instruct и -rlhf донастроек.)
И вот вам шаблон от создателей заходит больше чем ваши дополнительные настройки.
вот только люди задают модели критерии правильности, без них модель не может улучшаться в правильную сторону. правила эти текстом нормально не описать, а если и можно описать, то в половине случаев модель на них забивает и делает по-своему, поэтому пожилой китаец с палкой программист за этим следит и исправляет генерацию.
Я думаю надо попробовать еще расшифровывать строчку классификатора перед взятием эмбеддинга с ЛЛМ. Вдруг индексы начнут гораздо лучше работать. Также и описание товара тоже расшифровывают, бывает.
разрешающая способность не даст поток в 1 гбит потом, и вообще, у нас передается сжатый поток, несжатого потока на 1 гбит не передается, о чем и спорит ЗанЗи.
>21. Эффект Даннинга — Крюгера (Dunning–Kruger Effect)
>Люди с низким уровнем компетенции склонны переоценивать свои способности, а профи — наоборот, сомневаться в себе (привет, синдром самозванца).
Вот только это не так... Пометьте там у себя в списке, пожалуйста, что знать это надо, но надо знать и то, что это не так, и работа была убедительно опровергнута (и это разбиралось на хабре).
28. Слепо доверять авторитетам Людям лень перепроверять информацию.
Прикольно, конечно, но RL это от силы 10% от всей тренировки, а временами и 0.1-1%. То есть, добровольцев надо в 100 или 1000 раз больше, чтобы реально обучить модель с нуля, а не затюнить её. И ещё датасет всем надо раздать, а это терабайты. Хотя, конечно, тут можно сделать одного сидера и раздавать всем только нужные им куски датасета.
1) ну я бы сказал что Lucene с его сегментами медленный, и LSM базы получше будут, но на 220к запросов в секунду я конечно не тестировал. 2) а так в целом всё это напоминает наивный байесовский подход, потому что все фичи независимые друг от друга и не коррелируют друг с другом. 3) для массовой фильтрации писем технология хорошая, но что если конкретному пользователю надо больше писем помечать как спам (не из-за редкости, а из-за въедливости и раздражительности)? Будете его разметку игнорировать, потому что глобально большинство спама не такое? Или же у вас ещё есть мини-байес для этого конкретного пользователя для донастройки?
а я всё равно не понял, где там циклы. максимум -- поиск по индексу там должен быть, с ним 100к небольших объектов сериализовать должно быть реально за секунду.
Ничего секретного в вашей технологии нет, а не используется она потому что никому в таком виде не нужна. Сделать расширения для браузеров, рисующих эту иконку -- дело пары часов, но никто в интернете не будет писать эти опровержения, комментарии и всё прочее, никто не будет индексировать все комментарии в интернете -- и для вашей системы не будет информации, чтобы записывать в этот миллион-терабайтный блокчейн, на хранение которого у вас ещё и нет денег.
Ваш продукт должен создавать ценности больше, чем стоить денег для поддержания работоспособности. Иначе он умрет.
У человека в гиппокампе тоже предположительно происходит нейрогенез (только исследовать его сложно даже на приматах. поэтому я вставляю "предположительно"). https://en.wikipedia.org/wiki/Adult_neurogenesis
Нет, в лобных долях коры нейрогенеза нет, и нейроны у взрослого туда не прорастут и не переместятся, там есть нейропластичность -- это когда дендриты (и нейроны в целом тоже) могут поменять назначение, чтобы заместить выполняемые соседними клетками и зонами коры функции. Про нейропластичность как раз и написана большая часть статьи. И нейропластичность как раз и основана на тренировках.
>Новые нейроны у взрослых людей не появляются, разве что у раковых больных. Ваши знания устарели минимум на 20 лет, новые нейроны появляются, 700 новых нейронов образуется в гиппокампе в день, ещё есть несколько зон поменьше с нейрогенезом. Вот скажем первая попавшаяся статья: https://rtvi.com/news/oni-vosstanavlivayutsya-chto-uchenye-uznali-pro-nervnye-kletki/
>Гиппокамп - это источник веществ (вроде гармонов, нейромедиаторов) для нормальной работы мозга Увы, это так не работает. Гормоны -- это общее название для всех управляющих веществ организма. Нейромедиаторы -- вид гормонов для нейронов, и любой нейрон вырабатывает нейромедиаторы, а не только нейроны гиппокампа. Поэтому ваше утверждение неверно по сути, хотя по факту вы верно всё говорите. Сравните ваше утверждение с "видеопамять это источник веществ (вроде элементарных частиц, электронов) для нормальной работы компьютера".
Состояние потока получить легко -- это когда вы сделали что-то (лёгкое), мозг это запомнил, и теперь вы с энтузиазмом продолжаете делать дела. Нужно поставить какую-то очень простую и лёгкую задачу для разгона, и нужно чтобы потом наготове была задачка посложнее + отсутствие отвлечений, и вы не переключились из-за ваших вредных привычек на развлечения. Исключение -- если у вас ADHD (пройдите скажем тест) и так просто сконцентрироваться не получается физиологически, тогда лучше посоветоваться с врачами, сейчас есть много разных веществ в небольших дозировках.
class Configuration:
def __init__(self, filepath):
self.filepath = filepath
self._initialize()
следует использовать
class Configuration:
def __init__(self, filepath=None):
self.filepath = filepath
if filepath:
self._initialize_with_filepath()
Но это меняет контракт класса, и теперь возможно сделать конфигурацию без пути.
Контракт класса определяется архитектором, если он считает, что конфигурация без пути не должна существовать, то значит так оно и есть. А вариант "класс может иметь любое внутреннее состояние" (в т.ч. недопустимое с точки зрения бизнес логики) приводит потом к трудноуловимым ошибкам в дебаге. Например, мы заложились на то, что путь у конфигурации всегда есть, а потом словим NoneType error при попытке по этому пути обратиться. Или же потом присвоим объекту filepath, забыв сделать инициализацию. Получится глупо и больно. Так что не надо такой категоричности.
Переранжировка -- это когда мы берём результаты теста, и наихудшему даём значение 1, следующему -- значение 2, дальше 3, 4, и так далее до 100. Если человек 5, а не 100, то чисел на всех не хватает, поэтому они берут равноудалённые точки на прямой линии от 0 до 100, например, если у них 4 когорты, то одной когорте они приписали значение 15, второй 40, третьей 65, четвёртой 90 ( то есть, 10 + 25*n ).
рисовать деньги нельзя, иначе будет инфляция, но можно печатать согласно количеству имущества, на которое есть расписки в банках ;) а вот про причинение демократии тут все верно, но если бы не было развитой экономики, не было бы и обеспечения экспорта, и почему-то у других экономику развивать не так хорошо получается, неужели это АНБ везде успевает всем всё испортить?
постойте, здесь возможна подмена понятий, мы говорим о фабриках, располагающихся в америке или работающих на америку? ;)
у США не было и не будет столько людей готовых работать за небольшую зарплату, так что не могли, это как "сырьевая страна" -- у кого-то сырье есть, а ктто-то зарабатывает на перепродаже
https://t.me/datastorieslanguages/636:
Про качество: link (https://github.com/anthropics/claude-code/issues/42796#issuecomment-4194007103). В начале марта дефолтное значение thinking effort/budget было уменьшено с high/max до medium. Это прям сильно ударило по качеству, я даже на работе заметил. К счастью, это решается просто: достаточно запускать claude --effort max или проставить это в настройках.
---
https://t.me/tired_glebmikheev/2608:
Поставь вот эти настройки в переменные окружения
export CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1 export CLAUDE_REASONING_EFFORT=max
---
https://t.me/agent_coding/5247 :
В ответ на гипотезу о том, что виноват свежий 1M‑контекст и работа без /compact после 200k токенов, Борис предложил решения, которыми можно вернуть прежнее поведение:
🟢 /effort high или /effort max — поднять максимальный бюджет thinking‑токенов на задачу;
🟢CLAUDE_CODE_AUTO_COMPACT_WINDOW=400000 — принудительно укоротить рабочее окно контекста.
🟢CLAUDE_CODE_SIMPLE=1 — упрощенный режим для проверки гипотезы об интерференции системного промпта.
Дополнительно есть CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1, он отключает адаптивный режим и возвращает фиксированный бюджет рассуждений.
Нейросеть одновременно учится предсказывать продолжения с учётом того, как бы на вопросы отвечали разные люди. И "настройками кодека" в промпте вы выбираете шаблон "того человека, который отвечает". Если вы его не укажете, то будут настройки создателей (с третьего этапа обучения, RLHF. Вряд ли вы даже пользовались в последний год сетями без -instruct и -rlhf донастроек.)
И вот вам шаблон от создателей заходит больше чем ваши дополнительные настройки.
вот только люди задают модели критерии правильности, без них модель не может улучшаться в правильную сторону.
правила эти текстом нормально не описать, а если и можно описать, то в половине случаев модель на них забивает и делает по-своему, поэтому
пожилой китаец с палкойпрограммист за этим следит и исправляет генерацию.Там же вроде была проблема не в подключении, а в том, что имплант через 1-2 года переставал работать из-за отторжения. Китайцы это решили?
Я думаю надо попробовать еще расшифровывать строчку классификатора перед взятием эмбеддинга с ЛЛМ. Вдруг индексы начнут гораздо лучше работать. Также и описание товара тоже расшифровывают, бывает.
разрешающая способность не даст поток в 1 гбит потом,
и вообще, у нас передается сжатый поток, несжатого потока на 1 гбит не передается, о чем и спорит ЗанЗи.
>21. Эффект Даннинга — Крюгера (Dunning–Kruger Effect)
>Люди с низким уровнем компетенции склонны переоценивать свои способности, а профи — наоборот, сомневаться в себе (привет, синдром самозванца).
Вот только это не так...
Пометьте там у себя в списке, пожалуйста, что знать это надо, но надо знать и то, что это не так, и работа была убедительно опровергнута (и это разбиралось на хабре).
28. Слепо доверять авторитетам
Людям лень перепроверять информацию.
Прикольно, конечно, но RL это от силы 10% от всей тренировки, а временами и 0.1-1%. То есть, добровольцев надо в 100 или 1000 раз больше, чтобы реально обучить модель с нуля, а не затюнить её. И ещё датасет всем надо раздать, а это терабайты. Хотя, конечно, тут можно сделать одного сидера и раздавать всем только нужные им куски датасета.
1) ну я бы сказал что Lucene с его сегментами медленный, и LSM базы получше будут, но на 220к запросов в секунду я конечно не тестировал.
2) а так в целом всё это напоминает наивный байесовский подход, потому что все фичи независимые друг от друга и не коррелируют друг с другом.
3) для массовой фильтрации писем технология хорошая, но что если конкретному пользователю надо больше писем помечать как спам (не из-за редкости, а из-за въедливости и раздражительности)? Будете его разметку игнорировать, потому что глобально большинство спама не такое? Или же у вас ещё есть мини-байес для этого конкретного пользователя для донастройки?
ну как? :)
а я всё равно не понял, где там циклы. максимум -- поиск по индексу там должен быть, с ним 100к небольших объектов сериализовать должно быть реально за секунду.
Ничего секретного в вашей технологии нет, а не используется она потому что никому в таком виде не нужна. Сделать расширения для браузеров, рисующих эту иконку -- дело пары часов, но никто в интернете не будет писать эти опровержения, комментарии и всё прочее, никто не будет индексировать все комментарии в интернете -- и для вашей системы не будет информации, чтобы записывать в этот миллион-терабайтный блокчейн, на хранение которого у вас ещё и нет денег.
Ваш продукт должен создавать ценности больше, чем стоить денег для поддержания работоспособности. Иначе он умрет.
У человека в гиппокампе тоже предположительно происходит нейрогенез (только исследовать его сложно даже на приматах. поэтому я вставляю "предположительно").
https://en.wikipedia.org/wiki/Adult_neurogenesis
Нет, в лобных долях коры нейрогенеза нет, и нейроны у взрослого туда не прорастут и не переместятся, там есть нейропластичность -- это когда дендриты (и нейроны в целом тоже) могут поменять назначение, чтобы заместить выполняемые соседними клетками и зонами коры функции. Про нейропластичность как раз и написана большая часть статьи. И нейропластичность как раз и основана на тренировках.
>Новые нейроны у взрослых людей не появляются, разве что у раковых больных.
Ваши знания устарели минимум на 20 лет, новые нейроны появляются, 700 новых нейронов образуется в гиппокампе в день, ещё есть несколько зон поменьше с нейрогенезом.
Вот скажем первая попавшаяся статья: https://rtvi.com/news/oni-vosstanavlivayutsya-chto-uchenye-uznali-pro-nervnye-kletki/
>Гиппокамп - это источник веществ (вроде гармонов, нейромедиаторов) для нормальной работы мозга
Увы, это так не работает.
Гормоны -- это общее название для всех управляющих веществ организма.
Нейромедиаторы -- вид гормонов для нейронов, и любой нейрон вырабатывает нейромедиаторы, а не только нейроны гиппокампа.
Поэтому ваше утверждение неверно по сути, хотя по факту вы верно всё говорите. Сравните ваше утверждение с "видеопамять это источник веществ (вроде элементарных частиц, электронов) для нормальной работы компьютера".
Состояние потока получить легко -- это когда вы сделали что-то (лёгкое), мозг это запомнил, и теперь вы с энтузиазмом продолжаете делать дела. Нужно поставить какую-то очень простую и лёгкую задачу для разгона, и нужно чтобы потом наготове была задачка посложнее + отсутствие отвлечений, и вы не переключились из-за ваших вредных привычек на развлечения. Исключение -- если у вас ADHD (пройдите скажем тест) и так просто сконцентрироваться не получается физиологически, тогда лучше посоветоваться с врачами, сейчас есть много разных веществ в небольших дозировках.
Статью можно свести к тому, что вместо
следует использовать
Но это меняет контракт класса, и теперь возможно сделать конфигурацию без пути.
Контракт класса определяется архитектором, если он считает, что конфигурация без пути не должна существовать, то значит так оно и есть. А вариант "класс может иметь любое внутреннее состояние" (в т.ч. недопустимое с точки зрения бизнес логики) приводит потом к трудноуловимым ошибкам в дебаге.
Например, мы заложились на то, что путь у конфигурации всегда есть, а потом словим NoneType error при попытке по этому пути обратиться.
Или же потом присвоим объекту filepath, забыв сделать инициализацию.
Получится глупо и больно.
Так что не надо такой категоричности.
Переранжировка -- это когда мы берём результаты теста, и наихудшему даём значение 1, следующему -- значение 2, дальше 3, 4, и так далее до 100.
Если человек 5, а не 100, то чисел на всех не хватает, поэтому они берут равноудалённые точки на прямой линии от 0 до 100, например, если у них 4 когорты, то одной когорте они приписали значение 15, второй 40, третьей 65, четвёртой 90 ( то есть, 10 + 25*n ).