Да чаще бывает наоборот, вот эти А Б, вот твоя задача, ты берешь А и копаншься копаешься копаешься в нем, неделю или день и в итоге пишешь под либу какой то код, недостающий функционал и к концу работы осознаещь, что велосипед ты бы сделал в 10 раз быстрее, и задача была бы в далеком прошлом, а вместо этого ты пилишь никому, кроме тебя, ненужный функционал обложившись доками и гитхабом "удобного инструмента"
если у вас такой большой синхронный цикл с таким множественным выделением памяти, то вы что-то делаете не так (например неправильно выбрали платформу для реализации проекта).
в том, что 4bit модель с настройками, которые должны подходить для использования и создания lora, загрузить не получается :) А для запуска не квантованной модели нет железа.
ну я говорил про "так, мелкие скрипты" в том смысле что такое отношение и приводит к подобным случаям. А серверного ПО на баше овермного :) в том смысле что в пайплайне баш часто конечно.
Я че то не понял, хостинг для форума станет дороже 20 баксов? В смысле что (кроме конкретной нищеты) может помешать держать человеку сайт, да, он не будет коммерческим (хотя почему бы и нет, если будет аудитория, которая предпочитает контент постабильнее), но вы знаете, интернет давно наполнен маркетинговым мусором (примерно с того времени, как вы стали замечать примечания о пользе яиц в рецептах яишницы), так что принципиально хуже уже не станет, к тому же контент создаваемый ии будет улучшаться. (Stable diffusion зарелизилась чуть меньше года назад, посмотрите во что они превратились сейчас)
А как дообучать квантованую int4 llama-подобную модель ? Т.к. кажется способ через llama-gptq и monkeypatch больше не работает, ошибка которую я не смог победить - нет модуля autograd-int4 ;) а fp16 в 24g не влазят. (Да я пробовал ставить llama-gptq с версии из мануала, это помогло пройти предыдущего босса)
Может это и полезно, но если там участвовали разработчики Next, то я не хотел бы таким пользоваться. Мне не нравятся их решения, в частности диктат на файловую структуру.
Мне кажется дело в программистах, вот например популярный фреймворк (или либа?) gradio - за каждым чихом идет на сервер, имеет какие то безумные расшаренные объекты, я не питонщик, и не копал, может его неправильно используют, но такое впечатление, что об "отзывчивости" товарищи не слышали. Статья так себе, сравнение win3.5 и win11 не имеет смысла. Про Linux кстати тож неправда, за все 20 лет, я помню действительно отзывчивый интерфейс только в нач 2000 - dm enlightenment, 2.2 ядро кажется тогда было, остальное - постоянные внезапные лаги в gui из за конкуренции в io.
Я обычно юзаю ls -lhrt --sort size , непонятно зачем всякие classify, если сортировка прямая, всё самое большое далеко вверху окажется. -t тут лишнее, но просто удобнее помнить, чтобы без sort была сортировка по времени
А где можно почитать про этот новый своп ? Быстрое гугление че-то ничего не дало.
я когда копался в erlang находил Chicago Boss, ничего сейчас про него не помню, но выглядело интересно.
Без "воздуха свободы", такие товарищи товарищами не считались.
Да чаще бывает наоборот, вот эти А Б, вот твоя задача, ты берешь А и копаншься копаешься копаешься в нем, неделю или день и в итоге пишешь под либу какой то код, недостающий функционал и к концу работы осознаещь, что велосипед ты бы сделал в 10 раз быстрее, и задача была бы в далеком прошлом, а вместо этого ты пилишь никому, кроме тебя, ненужный функционал обложившись доками и гитхабом "удобного инструмента"
Как узел системы. :) Но я согласен с таким подходом, зачем изобретать что то для человеков особенное, если уже это что то уже посчитано.
Я знаю ответ покороче, - потому что CAP
Hidden text
Теорема
может есть натрейненые лоры или textual-inversion модели, которые конкретно 1girl считают кейвордом с большим весом.
если у вас такой большой синхронный цикл с таким множественным выделением памяти, то вы что-то делаете не так (например неправильно выбрали платформу для реализации проекта).
в том, что 4bit модель с настройками, которые должны подходить для использования и создания lora, загрузить не получается :) А для запуска не квантованной модели нет железа.
а какие мессенджеры сливают ботам страны юзеров ?
ну я говорил про "так, мелкие скрипты" в том смысле что такое отношение и приводит к подобным случаям. А серверного ПО на баше овермного :) в том смысле что в пайплайне баш часто конечно.
А для чего создан этот API ?
https://developer.mozilla.org/en-US/docs/Web/API/Web_Crypto_API
Я че то не понял, хостинг для форума станет дороже 20 баксов? В смысле что (кроме конкретной нищеты) может помешать держать человеку сайт, да, он не будет коммерческим (хотя почему бы и нет, если будет аудитория, которая предпочитает контент постабильнее), но вы знаете, интернет давно наполнен маркетинговым мусором (примерно с того времени, как вы стали замечать примечания о пользе яиц в рецептах яишницы), так что принципиально хуже уже не станет, к тому же контент создаваемый ии будет улучшаться. (Stable diffusion зарелизилась чуть меньше года назад, посмотрите во что они превратились сейчас)
А как дообучать квантованую int4 llama-подобную модель ? Т.к. кажется способ через llama-gptq и monkeypatch больше не работает, ошибка которую я не смог победить - нет модуля autograd-int4 ;) а fp16 в 24g не влазят. (Да я пробовал ставить llama-gptq с версии из мануала, это помогло пройти предыдущего босса)
Сплит тесты конечно же. Остаток от hash(userId+expirementName) дает номер бакета в заданном интервале.
Может это и полезно, но если там участвовали разработчики Next, то я не хотел бы таким пользоваться. Мне не нравятся их решения, в частности диктат на файловую структуру.
Мне кажется дело в программистах, вот например популярный фреймворк (или либа?) gradio - за каждым чихом идет на сервер, имеет какие то безумные расшаренные объекты, я не питонщик, и не копал, может его неправильно используют, но такое впечатление, что об "отзывчивости" товарищи не слышали. Статья так себе, сравнение win3.5 и win11 не имеет смысла. Про Linux кстати тож неправда, за все 20 лет, я помню действительно отзывчивый интерфейс только в нач 2000 - dm enlightenment, 2.2 ядро кажется тогда было, остальное - постоянные внезапные лаги в gui из за конкуренции в io.
демонстрация внезапного смещения точки сборки словом святого кастанеды :)
Треды придуманы в Тветтере ? А как же golded ?
Я обычно юзаю ls -lhrt --sort size , непонятно зачем всякие classify, если сортировка прямая, всё самое большое далеко вверху окажется. -t тут лишнее, но просто удобнее помнить, чтобы без sort была сортировка по времени