Pull to refresh
3
0.1
Send message

Можно было бы начать с полноценного промпта и с тонких настроек каждой из моделей. Плюс фото с нескольких ракурсов с кратким контекстом. Прописать структуру ответа. Свести результаты в таблицу с балльной оценкой относительно эталона. Без этого сравнение моделей вряд ли возможно.

Да, конечно можно, 2*16 VRAM + XX RAM. Дешево и сердито.

Через LM-Studio настройки производятся в два клика.

Hardware Unboxed пишет: одним из требований Nvidia было не сравнивать RTX 5060 с RTX 4060 в этих «предварительных» обзорах. Поэтому в подобных публикациях новинку сравнивают с RTX 3060 и RTX 2060 прошлых поколений. Более того, Nvidia поставила условие проводить тесты RTX 5060 с включённым мультикадровым генератором в режиме x4, что значительно «раздувает» количество выдаваемых ею кадров в секунду, большая часть которых является ненастоящими. В таких условиях видеокарты RTX предыдущего поколения без поддержки этого пресловутого мультикадрового генератора выглядят значительно хуже на графиках сравнений, где старые видеокарты в 3–4 раза отстают от новичка.

И она сейчас на Озоне мелькает по 46к р. Взять парочку таких и уже Qwen3 30B Q8/Gemma3 27B Q8 помещаются. Хороший вариант для локальных сеток вместо старичка 3090.

Интересно было бы посмотреть на сиспромпты Гигачата и Яндекса.

Там столько удивительного и необычного должно обнаружиться.

Перевели всех на Teams. Обнаружили, что в нем нет записи звонков, нельзя процитировать выделенную часть сообщения, нельзя переслать сообщение в соседнюю группу. Картинки пережимает как будто сильнее, чем Скайп. В общем, неуютный этот тимс.

На HF полно сеток с тегом abliterated.

Под регулированием понимается глубокое цензурирование?

Не уверен, что математика и рассуждения - сильная сторона гигачата. Есть взрослые LLM, которые способны правильно решать подобные задачи.

Математики: 10/5 = 2

Программисты: 10/5 = 2.00000000000000003

Excel: 10/5 = 5-Oct-2022 0:00:00AM

Роман, было бы здорово увидеть модели insctruct переходного размера - 14B и 27B.

Для истории. Все еще не работает. Седьмой час полной недоступности.

По Python не подскажу. Но план-минимум правок такой:

Заменить API endpoint на:
url = "https://api.mistral.ai/v1/chat/completions"

Model = "mistral-large-latest"

api_key = "your-api-key"

Заменить requestBody на мистралевский по их докам (deepseek подскажет как поменять), добавить паузу между запросами секунд 5. Возможно, внести небольшие правки в функцию разбора ответа.

И да, Gemini из РФ можно пользоваться, но это другая история.

Gemma-3 неплохо читает скриншоты, следует промптам, хорошо говорит по-русски, можно ее приспособить, но нужно железо.

Странно, что Qwen2.5 не прошел проверку, подозреваю, что температуру и промпт надо покрутить для лучшего результата.

Попробуйте подробнее описать задачу, роль, цель, что на входе, что на выходе, посулите денежное вознаграждение/угрозу жизни - это существенно поднимает качество работы сеток.

Предположу, что у 4070 GDDR6X выше частота разгона. Штатная - 2625, в разгоне целых 3125 МГц.

Телесуфлер нужен, чтобы взгляд был направлен в сторону камеры? Если да, то в Nvidia Broadcast есть такая функция "Eye contact". С ней глаза всегда смотрят в камеру, даже если надеты очки.

Для моих кейсов Gemma-3 27b очень хороша в VL, даже 12b качественно распознает и описывает картинки. В обоих случаях использовал Q6_K.

Спасибо за проект!

К сожалению, API Gemini в РФ без ухищрений недоступно. Но можно взамен по API подключить бесплатный Mistral Large. Или локально запустить Gemma-3/Qwen2.5. Результат будет не сильно хуже Gemini.

И я был удивлен, узнав из статьи, что Vimeo не заблокирован.

Вилами по воде написано? Я еще не читал.

Information

Rating
3,863-rd
Registered
Activity