Заменить requestBody на мистралевский по их докам (deepseek подскажет как поменять), добавить паузу между запросами секунд 5. Возможно, внести небольшие правки в функцию разбора ответа.
И да, Gemini из РФ можно пользоваться, но это другая история.
Gemma-3 неплохо читает скриншоты, следует промптам, хорошо говорит по-русски, можно ее приспособить, но нужно железо.
Странно, что Qwen2.5 не прошел проверку, подозреваю, что температуру и промпт надо покрутить для лучшего результата.
Попробуйте подробнее описать задачу, роль, цель, что на входе, что на выходе, посулите денежное вознаграждение/угрозу жизни - это существенно поднимает качество работы сеток.
Телесуфлер нужен, чтобы взгляд был направлен в сторону камеры? Если да, то в Nvidia Broadcast есть такая функция "Eye contact". С ней глаза всегда смотрят в камеру, даже если надеты очки.
К сожалению, API Gemini в РФ без ухищрений недоступно. Но можно взамен по API подключить бесплатный Mistral Large. Или локально запустить Gemma-3/Qwen2.5. Результат будет не сильно хуже Gemini.
И я был удивлен, узнав из статьи, что Vimeo не заблокирован.
Предполагаю, что будет использоваться парковочный механизм. Он не даст опрокинуться в нештатной ситуации и позволит обеспечить автоматический старт-стоп в штатной.
Задал вопрос: "Что такое хтонь?". Версия Про кратко ответила, что это слово жаргонное и неформальное, не вдаваясь в детали. Версия Лайт YandexGPT-5-Lite-8B-pretrain-Q4_K_M-GGUF и вовсе переключилась на английский, рассудив, что это неизвестный английский термин. К слову, Qwen2.5-14B-Instruct-Q5 грамотно и по-русски ответила на этот вопрос.
Блок питания виноват в том, что 5090 запросил мощности сверх спецификации?
В соседней теме 5090 в пике потреблял 900Вт.
PS Похоже, покупателям нового монстра нужно сразу ограничивать Power maximum, благо такая возможность появилась в драйверах Nvidia. Хотя оптимальнее настроить undervolting кривой напряжения в Afterburner, чтобы не сильно просесть в производительности, но снизить потребляемую мощность.
Не уверен, что математика и рассуждения - сильная сторона гигачата. Есть взрослые LLM, которые способны правильно решать подобные задачи.
Математики: 10/5 = 2
Программисты: 10/5 = 2.00000000000000003
Excel: 10/5 = 5-Oct-2022 0:00:00AM
Роман, было бы здорово увидеть модели insctruct переходного размера - 14B и 27B.
Для истории. Все еще не работает. Седьмой час полной недоступности.
По Python не подскажу. Но план-минимум правок такой:
Заменить API endpoint на:
url = "https://api.mistral.ai/v1/chat/completions"Model = "mistral-large-latest"api_key = "your-api-key"Заменить requestBody на мистралевский по их докам (deepseek подскажет как поменять), добавить паузу между запросами секунд 5. Возможно, внести небольшие правки в функцию разбора ответа.
И да, Gemini из РФ можно пользоваться, но это другая история.
Gemma-3 неплохо читает скриншоты, следует промптам, хорошо говорит по-русски, можно ее приспособить, но нужно железо.
Странно, что Qwen2.5 не прошел проверку, подозреваю, что температуру и промпт надо покрутить для лучшего результата.
Попробуйте подробнее описать задачу, роль, цель, что на входе, что на выходе, посулите денежное вознаграждение/угрозу жизни - это существенно поднимает качество работы сеток.
Предположу, что у 4070 GDDR6X выше частота разгона. Штатная - 2625, в разгоне целых 3125 МГц.
Телесуфлер нужен, чтобы взгляд был направлен в сторону камеры? Если да, то в Nvidia Broadcast есть такая функция "Eye contact". С ней глаза всегда смотрят в камеру, даже если надеты очки.
Для моих кейсов Gemma-3 27b очень хороша в VL, даже 12b качественно распознает и описывает картинки. В обоих случаях использовал Q6_K.
Спасибо за проект!
К сожалению, API Gemini в РФ без ухищрений недоступно. Но можно взамен по API подключить бесплатный Mistral Large. Или локально запустить Gemma-3/Qwen2.5. Результат будет не сильно хуже Gemini.
И я был удивлен, узнав из статьи, что Vimeo не заблокирован.
Вилами по воде написано? Я еще не читал.
Предполагаю, что будет использоваться парковочный механизм. Он не даст опрокинуться в нештатной ситуации и позволит обеспечить автоматический старт-стоп в штатной.
У кого возникает ошибка парсера QWQ в LM-Studio, то вот лекарство https://github.com/lmstudio-ai/lmstudio-bug-tracker/issues/479#issuecomment-2701947624
Расскажите? Не боитесь ошибки выжившего?
Или просто педаль тормоза отключить.
Там еще вторая часть есть - про американский английский.
Где подробно объясняется из чего hotdogs.
Интересно. У меня намного ленивее ответил в этом же режиме.
Зато в продвинутом режиме ответ действительно выглядит полным.
Как это объясняет ответ версии Про?
Задал вопрос: "Что такое хтонь?". Версия Про кратко ответила, что это слово жаргонное и неформальное, не вдаваясь в детали. Версия Лайт YandexGPT-5-Lite-8B-pretrain-Q4_K_M-GGUF и вовсе переключилась на английский, рассудив, что это неизвестный английский термин. К слову, Qwen2.5-14B-Instruct-Q5 грамотно и по-русски ответила на этот вопрос.
Блок питания виноват в том, что 5090 запросил мощности сверх спецификации?
В соседней теме 5090 в пике потреблял 900Вт.
PS Похоже, покупателям нового монстра нужно сразу ограничивать Power maximum, благо такая возможность появилась в драйверах Nvidia. Хотя оптимальнее настроить undervolting кривой напряжения в Afterburner, чтобы не сильно просесть в производительности, но снизить потребляемую мощность.