Comments / Profile of Johny23 / Habr

User

NVIDIA CMP – микроскопы для забивания гвоздей? Копаем глубже…

Ошибка в статье про amd, у amd в профессиональных картах работают вычисления матриц начиная от amd instinct mi100, и скорость токенов там выше любой игорой Nvidia и майинговой темболее, но все же главное в вычисления ИИ это скорость памяти HBM2 даёт прикупить gddr6 и GDDR7

Запускаем настоящую DeepSeek R1 671B на игровом ПК и смотрим вменяемая ли она на огромном контексте (160к)

Johny23 Aug 31 at 04:33

Amd mi50 32G ( при стоимости 30к.р.) + VLLM, работает быстрее чем llama, ollama, что то на уровне 4090

Пишем персонального AI-ассистента на Python

Johny23 Jun 20 at 18:34

Слишком медленно для такого простого, тут работаты на 10 часов за компом без перерыва, смысл тянуть время? Ещё и Вcе это нужно завернуть в контейнеры и апи допилить для универсальности, но это все равно изобретение велосипеда, уже есть готовые проекты открытые причем с gpu ускорением, а не работа на cpu

Мне как то нужно было срочно защитить код в контейнерах, я систему привязки к железу в контейнерах с учётом шифрования сигнатур, и генератор лицензий, + замуровать доступ в контейнер на глухо, чтоб не взломать систему и не украсть код за 12 часов запилил 30 версий приложений защиты выпустил, пока финалку не сделал:)))) и все это автоматизировал скриптами. С учётом того, что пришлось ещё закрытый код компилировать:))

Локальный DeepSeek-R1: Когда скорость улитки – не приговор, а точка старта

Johny23 Jun 13 at 19:29

Всем привет мой сервер 2686v4, 4шт gpu amd mi50 16G, Deepseek R1, 70B, GPTQ квантовние, скорость 42ток. В секунду быстрее чем 4090, как тебе Такое "илон Маск", qwen3 32b AWQ, 38-40 токенов, тоже быстре 4090:). Так что фуфло ваше нвидиа и цпу:) если соберу в сеть через infinity bend 100G, много серверов то можно макисмальный дипсик гонять. С большой скоростью

15 одновременных запущенных чатов на генерации:)

Microsoft обновила GitHub Copilot: поддержка MCP, режим ИИ-агента в VS Code и тариф Pro+

Johny23 Apr 6 at 14:04

Если ты не умеешь работать с ними и не знаешь какие умеют делать рабочий код, то ты не шаришь в этой теме:))

Deepseek v3: Как скачать китайскую нейросеть Дипсик AI, все способы

Johny23 Feb 4 at 05:33

Ставь lama.cpp если ты на винде сидит там есть запкск моделей через vulkan, все работает прекрасно, если ты с rocm не дружишь