Comments / Profile of nikulin

@nikulin_krd

User

2,5

Rating

Subscribers

ProfileArticlesPostsNewsComments259

Определитель номера «Яндекса» предупредит пользователей о звонках мошенников их близким

nikulin_krd 3 hours ago

<sarcasm>Вот! А говорят, что блокировки не работают!</sarcasm>

Определитель номера «Яндекса» предупредит пользователей о звонках мошенников их близким

nikulin_krd 4 hours ago

А товарищ-майор как будет рад))

Selectel представил AI-Сервер с поддержкой до 16 GPU

nikulin_krd 4 hours ago

Новая аппаратная платформа обеспечит стабильную, быструю и предсказуемую работу AI-моделей в реальных условиях с полным контролем над данными и производительностью

О каком полном контроле за данными можно говорить, если мы используем сторонние сервера?

Практическое руководство по Qwen: установка, настройка vLLM и работа через API

nikulin_krd 4 hours ago

Я выше уже писал, что дешевле собрать комп на 5080 за месяц аренды их решения. При этом получая скорость работы на уровне облака Alibaba

Дуров сообщил, что ему пришла повестка «для подозреваемого» — в его российскую квартиру, где он жил 20 лет назад

nikulin_krd 21 hours ago

А сколько террористов использовало инфраструктуру наших ОПСоСов и не счесть, но что-то уголовных дел на их дирекцию нет за "пособничество терроризму"

+11

Практическое руководство по Qwen: установка, настройка vLLM и работа через API

nikulin_krd 21 hours ago

Я правильно понял что Selectel предлагает на А100 запускать древнюю MoE модель всего на 30B параметров и 3В активных, да еще и платить за это 317рублей в час? Серьезно? За цену в месяц работы в облаке можно собрать компьютер с 5080, который будет эту модель крутить с 50 токенами в секунду и она будет реально локальной.... На А100 спокойно развернется модель на 122B параметров с 10В активных, если использовать квантованную модель Q4_K_M и сжатие KV-кэша турбоквант и иметь вполне рабочие 50-80Ток/с

Разработчикам Pioner заблокировали счета на 13 млн рублей, сотрудники не получают зарплату с февраля

nikulin_krd Apr 21 at 19:07

Потому что 99% всех вакансий с условиями типа "Договор ГПХ", "самозанятость", "Договор с ИП" и в этом случае при не выплате ЗП ты сосешь бибу

+17

Лучшие LLM в 2026 году: Какую нейросеть выбрать сегодня?

nikulin_krd Apr 20 at 21:10

Gemma 4 использует гибридный механизм: локальное скользящее окно внимания (1024 токена) чередуется с полным глобальным вниманием, всегда заканчиваясь на глобальном слое. Это делает модель эффективной для длинных контекстов без потери глубины понимания.

Именно этот механизм делает ее хуже, чем Qwen3.6-35B-A3B

Лучшие LLM в 2026 году: Какую нейросеть выбрать сегодня?

nikulin_krd Apr 20 at 21:07

Вы можете зарегистрироваться и получить 300 000 бонусных капсов ➪

Зарегистрировался))) на счету 28000, а в чатах запрос которого я не делал)))

Как я тестировал локально новый Qwen 3.6 и Gemma 4

nikulin_krd Apr 20 at 15:09

Забудьте про модельки с квантовкой ниже 4-бит. Все что ниже мусор полный.

Как я тестировал локально новый Qwen 3.6 и Gemma 4

nikulin_krd Apr 20 at 07:42

Автор отключил размышление, а у 3.6 оно является главной фишкой. С размышлениями Qwen3.6 дает существенно лучший результат нежели gemma4

Как я тестировал локально новый Qwen 3.6 и Gemma 4

nikulin_krd Apr 20 at 07:40

Смысл от такой настройки? Вы отключили все ГЛАВНЫЕ фишки модели! -ngl 999 бесполезен, лучше его удалить, по дефолту стоит автооффладинг. --jinja -b 2048 бесполезны, они используются по-умолчанию. -ub лучше не трогать. Добавьте --no-mmap и --flash-attn и уберите --mlock. Также, если вы качали mmproj файл помимо основной модели, то лучше его удалить, чтобы убрать мультимодальность, т.к. она отжирает 1.2-1.5Гб памяти карты

Как я тестировал локально новый Qwen 3.6 и Gemma 4

nikulin_krd Apr 20 at 07:34

Это надо форк собирать. В офф репозитории его нет

Как я тестировал локально новый Qwen 3.6 и Gemma 4

nikulin_krd Apr 19 at 23:59

Qwen 3.6 35B A3B прекрасно справляется с разработкой с 0. Просто не надо ее засирать всякими токсичными промтами. Сначала планирование с ответами на вопросы, а потом код. Я выше скинул результаты работы этой модели с рассуждениями и нормальной агентной ide. За 15 минут получил потрясающий результат для локальной модели

Как я тестировал локально новый Qwen 3.6 и Gemma 4

nikulin_krd Apr 19 at 23:20

OpenCode или KiloCode

Как я тестировал локально новый Qwen 3.6 и Gemma 4

nikulin_krd Apr 19 at 18:55

Их там действительно нет. Нужно выбрать или удобство LMStudio или голый llama.cpp, который есть форкнутый и с TurboQuant

Как я тестировал локально новый Qwen 3.6 и Gemma 4

nikulin_krd Apr 19 at 18:07