Комментарии / Профиль softel / Хабр

Программирую, паяю и управляю.

Локальная модель vs Гигачат: мой опыт и выводы

У gpt-oss:120b у меня выставлено максимальное контекстное окно для нее в 128К токенов. Она мне больше всего нравится. Есть еще Qwen3:235b, она не лезет в видеопамять, думает долго, но некоторые вопросы решает более детально. Кроме них есть еще 6 моделей, но их не использую почти.

Локальная модель vs Гигачат: мой опыт и выводы

softel 31 янв в 18:30

А почему бы не сравнивать? В жизни вообще то все познается в сравнении.

Вот я сравнил суперкомпьютер Christofari от Сбера со своим сервером и Сбер проиграл.

Локальная модель vs Гигачат: мой опыт и выводы

softel 31 янв в 18:22

Еще подобной задачей проверил Grok и GPTChat. GPTChat начал рассуждать и не закончил. Grok ответил мгновенно НО неправильно.

Но, со второго раза на пару минут задумался и ответил правильно.

Локальная модель vs Гигачат: мой опыт и выводы

softel 31 янв в 18:07

Такая конфигурация обошлась почти в 1 млн.

Сейчас наверное дороже будет.

Локальная модель vs Гигачат: мой опыт и выводы

softel 31 янв в 18:05

Нет, не по одной. основные сравнения были по написанию кода, гигачат слишком много нужно поправлять, так как делает много ошибок. И иногда что то проще самому написать, чем редактировать его код.

Локальная модель vs Гигачат: мой опыт и выводы

softel 31 янв в 17:57

Тут только путь ножками в Китай если там нет того кому вы можете доверить и отправить большую кучу денег на покупку таких комплектух.

Есть только одна проблема с этими картами, нужно будет их на водянку переводить, а разбирать боязно.

При нагрузке шумят как взлетающий самолет.

Локальная модель vs Гигачат: мой опыт и выводы

softel 31 янв в 10:47

Финальная конфигурация обошлась почти в 1 млн.

Результат использования меня вполне удовлетворяет.

Над переобучением (finetuning) или RAG я пока думаю и собираю необходимый мне датасет. Или вы что то другое имели в виду?

Локальная модель vs Гигачат: мой опыт и выводы

softel 30 янв в 22:44

Я создаю север техподдержки своей продукции, сторонние сети меня не интересуют, во первых это дорого, а во вторых я не смогу иметь полный контроль.

Локальная модель vs Гигачат: мой опыт и выводы

softel 30 янв в 21:27

Возможно, но что делать когда хочется попробовать здесь и сейчас? А тем более что это еще и приносит результат. Да дорого, но если допустим, гипотетически предположить то что через пару лет 32b модели будут круче чем сейчас 120b, то высока вероятность того что и железо для их запустка кратно будет дороже.

Задача Эйнштейна — большой тест LLM нейросетей на логическое мышление

softel 30 янв в 11:21

Мой локальный сервер с GPT-OSS:120B (120 миллиардов параметров ) решил загадку за 59 секунд

Пиццу ест плотник.
Крокодила держит программист.

Характеристика сервера: 2 видеокарты RTX4090 по 48Gb VRAM каждая (итого 96Гб видеопамяти), проц Core I9 14900 и 192Гб DDR5.

Кому интересно потестировать такой сервер, могу дать временный доступ, пишите в личку, установлено 15 разных моделей ИИ.

Как собрать компьютер для нейросетей: ИИ на службе у человека

softel 4 авг 2025 в 13:54

А что можете сказать про сборку - плата Z790, i9 14900, 192Gb Ram, 2 карты RTX 4090 по 48Gb vRAM и ssd 2Tb со скоростью более 14 Гб/сек.?

1 2 3

Информация

Специализация