Обновить
1

Пользователь

0,4
Рейтинг
Отправить сообщение

Не уверен, что математика и рассуждения - сильная сторона гигачата. Есть взрослые LLM, которые способны правильно решать подобные задачи.

Математики: 10/5 = 2

Программисты: 10/5 = 2.00000000000000003

Excel: 10/5 = 5-Oct-2022 0:00:00AM

Роман, было бы здорово увидеть модели insctruct переходного размера - 14B и 27B.

Для истории. Все еще не работает. Седьмой час полной недоступности.

По Python не подскажу. Но план-минимум правок такой:

Заменить API endpoint на:
url = "https://api.mistral.ai/v1/chat/completions"

Model = "mistral-large-latest"

api_key = "your-api-key"

Заменить requestBody на мистралевский по их докам (deepseek подскажет как поменять), добавить паузу между запросами секунд 5. Возможно, внести небольшие правки в функцию разбора ответа.

И да, Gemini из РФ можно пользоваться, но это другая история.

Gemma-3 неплохо читает скриншоты, следует промптам, хорошо говорит по-русски, можно ее приспособить, но нужно железо.

Странно, что Qwen2.5 не прошел проверку, подозреваю, что температуру и промпт надо покрутить для лучшего результата.

Попробуйте подробнее описать задачу, роль, цель, что на входе, что на выходе, посулите денежное вознаграждение/угрозу жизни - это существенно поднимает качество работы сеток.

Предположу, что у 4070 GDDR6X выше частота разгона. Штатная - 2625, в разгоне целых 3125 МГц.

Телесуфлер нужен, чтобы взгляд был направлен в сторону камеры? Если да, то в Nvidia Broadcast есть такая функция "Eye contact". С ней глаза всегда смотрят в камеру, даже если надеты очки.

Для моих кейсов Gemma-3 27b очень хороша в VL, даже 12b качественно распознает и описывает картинки. В обоих случаях использовал Q6_K.

Спасибо за проект!

К сожалению, API Gemini в РФ без ухищрений недоступно. Но можно взамен по API подключить бесплатный Mistral Large. Или локально запустить Gemma-3/Qwen2.5. Результат будет не сильно хуже Gemini.

И я был удивлен, узнав из статьи, что Vimeo не заблокирован.

Вилами по воде написано? Я еще не читал.

Предполагаю, что будет использоваться парковочный механизм. Он не даст опрокинуться в нештатной ситуации и позволит обеспечить автоматический старт-стоп в штатной.

У кого возникает ошибка парсера QWQ в LM-Studio, то вот лекарство https://github.com/lmstudio-ai/lmstudio-bug-tracker/issues/479#issuecomment-2701947624

Или просто педаль тормоза отключить.

Там еще вторая часть есть - про американский английский.

Где подробно объясняется из чего hotdogs.

Интересно. У меня намного ленивее ответил в этом же режиме.

Зато в продвинутом режиме ответ действительно выглядит полным.

Как это объясняет ответ версии Про?

Задал вопрос: "Что такое хтонь?". Версия Про кратко ответила, что это слово жаргонное и неформальное, не вдаваясь в детали. Версия Лайт YandexGPT-5-Lite-8B-pretrain-Q4_K_M-GGUF и вовсе переключилась на английский, рассудив, что это неизвестный английский термин. К слову,  Qwen2.5-14B-Instruct-Q5 грамотно и по-русски ответила на этот вопрос.

Блок питания виноват в том, что 5090 запросил мощности сверх спецификации?

В соседней теме 5090 в пике потреблял 900Вт.

PS Похоже, покупателям нового монстра нужно сразу ограничивать Power maximum, благо такая возможность появилась в драйверах Nvidia. Хотя оптимальнее настроить undervolting кривой напряжения в Afterburner, чтобы не сильно просесть в производительности, но снизить потребляемую мощность.

Информация

В рейтинге
2 681-й
Зарегистрирован
Активность