Комментарии / Профиль DjPhoeniX / Хабр

Юрий Попов@DjPhoeniX

Hardcore IoT fullstack dev & CTO

Подписчики

ПрофильСтатьи2ПостыНовостиКомментарии770

Привет. У меня вопрос к разработчикам LLM. Периодически...

А разработчики LLM про него в курсе?

Это настройка декодирования - там много режимов, пользователь (точнее, оператор) может выбирать и настраивать их самостоятельно. Проблема в том, что такой режим довольно "дорогой" и пользуются им на практике довольно редко.

> Почему бы хотя бы итоговое score ответа юзерам не сообщать?

В API довольно часто доступны logprobs (их надо явно запрашивать), и в целом это и есть score ответа с точки зрения модели (правда, они скорее отражают perplexity, но с некоторыми допущениями это можно считать "качеством" в попугаях).

Привет. У меня вопрос к разработчикам LLM. Периодически...

DjPhoeniX 19 фев в 19:51

Вы изобрели (почти) Beam Search.

30 лет без проводов: Wi-Fi готовится к юбилею. Часть 2

DjPhoeniX 28 ноя 2025 в 22:33

Полагаю, что все эти ускорения до сих пор упираются в обратную совместимость...

Вышел Osaurus — нативный LLM-сервер для Mac на базе Apple Silicon

DjPhoeniX 5 сен 2025 в 07:46

LM Studio умеет в MLX backend. Возможно, за счёт каких-то дополнительных оптимизаций, osaurus смогли уменьшить оверхед - надо тестить. Но вряд ли там разница в разы...

Измеряйте качество интернет-соединения с помощью сервиса...

DjPhoeniX 30 июл 2025 в 18:30

Как самореклама в корпоративном блоге - имеет место быть. Вот только хотелось бы услышать не только "пользуйтесь нашим", но и "мы работаем над улучшением". Так как сейчас непонятно - используется ли многопоточный режим? Какой из серверов используется? Нет графика, показывающего "вариативность" скорости. Нет loss. К тому же, скорость upload явно занижена - может, как раз по причине отсутствия "многопоточного" режима.

В общем, хотите хайпануть на (принудительном) уходе конкурента - сделайте лучше чем у него было.

Меньше — лучше: как Polaris-4B обошёл Qwen3-32B

DjPhoeniX 30 июл 2025 в 18:22

Если вопрос мне - то не знаю, перестал следить за "красными" (да и за "синими" тоже) в какой-то момент времени.

Меньше — лучше: как Polaris-4B обошёл Qwen3-32B

DjPhoeniX 12 июл 2025 в 22:21

Я в последнее время ~~задол~~ устал рассказывать любителям локальных нейронок мантру "возьми мак, возьми мак, возьми мак..."

MacBook (или даже Mac Mini) - это просто имба для нейронщиков. Потому что Unified Memory внезапно выстрелил там где не ждали, и по цене "зелёной" видеокарты на 32ГБ можно взять полноценный рабочий компьютер/ноутбук с 64+ГБ RAM, и (почти) всю эту RAM можно отдать той же LM Studio. Ну и варианты подешевле всё ещё перевешивают в пользу Apple...

Про то, что Mac Studio с 512GB RAM за 15к$ выигрывает по всем фронтам любому набору от NVIDIA (для начала соберите такой набор с поправкой на NVLink+NVSwitch) - говорить даже стыдно.

Меньше — лучше: как Polaris-4B обошёл Qwen3-32B

DjPhoeniX 4 июл 2025 в 12:31

Помимо весов самой модели, в VRAM должен влезть контекст (для RL-моделей его нужно много).

Трамп представил смартфон золотого цвета за $499 и нового мобильного оператора T1 Mobile

DjPhoeniX 19 июн 2025 в 13:57

Почему камера не 47мп? И батарейка не 4745mAh? Недоработочка...

DeepSeek выпустила мультимодальную нейросеть Janus-Pro-7B

DjPhoeniX 6 фев 2025 в 13:27

Честно, да для всего подряд. Код сложнее шаблонного она, как и любая другая, пишет отвратительно. Но вот по алгоритмам её гонять одно удовольствие. Даже если прямой ответ не совсем то, что надо - в рассуждениях можно найти отсылки к тому что стоит загуглить. Если покрутить температуру - можно попробовать что-то накреативить (у меня с этим бывают проблемы, а "прикольную идею в контексте Х" иногда надо достать здесь и сейчас). В противоположную сторону - иногда закидываю что-то "на правах бредовой идеи" и читаю размышления, куда это можно развить или почему это не сработает. В общем, такой "утёнок на максималках".

DeepSeek выпустила мультимодальную нейросеть Janus-Pro-7B

DjPhoeniX 28 янв 2025 в 08:46

Активно использую 14B Q6, очень нестыдно себя показывает.

Контрибьютор C++ забанен за использование слова «question» в названии своей статьи

DjPhoeniX 8 дек 2024 в 14:13

Не такие уж и дебри

ИИ приближает климатический кризис, согласно ведущему эксперту

DjPhoeniX 15 сен 2024 в 16:55

создание изображения высокой четкости с помощью искусственного интеллекта потребляет столько же энергии, сколько полная зарядка аккумулятора мобильного телефона.

Бред, причём слишком откровенный. Берём мобильный телефон (iPhone 14 Pro), ставим на него Diffusers, генерим десятки изображений последними версиями моделей, заряд батареи уменьшается процентов на 10… уже на этом этапе физика с математикой выходят из чата.

Замедление YouTube с технической стороны: ограничение и обход

DjPhoeniX 31 июл 2024 в 11:53

Уверены, что другие?

-4

Самопаркующийся авто за 500 строк кода

DjPhoeniX 24 июл 2024 в 17:54

О чём я и писал в предыдущем переводе…

Есть ли жизнь на arm'е?

DjPhoeniX 18 мая 2024 в 22:55

А как же FEX?

Есть ли жизнь на arm'е?

DjPhoeniX 18 мая 2024 в 09:08

Вам все пункты перечислить?)

Есть ли жизнь на arm'е?

DjPhoeniX 16 мая 2024 в 07:08

Пользуюсь Fedora на MBP16 M2Max ещё с момента когда 39 была в бете.

По поводу виртуализации ~~вы просто не умеете их готовить у меня всё работает~~ проблем не замечал, но вообще сообщество рекомендует использовать krunvm и FEX, с патчами от товарища slp (Sergio Lopez) запускал там Steam и прошёл (в очередной раз) Portal 2 с полноценным видеоускорением на максимальных настройках. Proton отрабатывает штатно и win-only игры тоже играбельны.

Нативным софтом пользоваться приятно, приколы 16k-страниц ощутил только в отсутствии chrome и wine, в целом krunvm меня достаточно спас в этом плане.

Fedora Asahi Remix 40: Linux на железе Mac становится все более совершенным. Что нового в релизе?

DjPhoeniX 11 мая 2024 в 20:49

https://github.com/AppleWOA

Майские одноплатники, на которые стоит обратить внимание: 5 моделей для разных проектов и задач

DjPhoeniX 11 мая 2024 в 19:59

Про Debian не уверен, чипы такого уровня обычно расчитаны на embedded-варианты, то-есть buildroot / poky (yocto) / openwrt. Конкретно вот такую (на T113-s3) я лично собирал на yocto с некоторыми доработками напильником.

2 3 ...

38 39