Comments / Profile of ShadF0x / Habr

@ShadF0x

Пользователь

ProfileArticlesPostsNewsComments494

Глава Hugging Face обеспокоен влиянием китайских опенсорс моделей AI

ShadF0x Dec 4 2024 at 15:02

другая модель той же Alibaba, QwQ-32B, явно избегает определенных диалогов

То ли дело когда свободно-демократический ChatGPT отваливается посреди ответа про Дэвида Майера [де Ротшильда].

+20

Look

Вышла QWQ 32b — только без цензуры

ShadF0x Dec 2 2024 at 15:42

Так оно есть, с оговорками: https://github.com/exo-explore/exo

Look

Вышла QWQ 32b — только без цензуры

ShadF0x Dec 1 2024 at 20:54

Есть добровольные бесплатные хостеры: https://aihorde.net/

Но ввиду того, что это всё добровольно-индивидуально, то доступность моделей и размеры очередей соответствующие. Ну и никаких гарантий, что по ту сторону API действительно модель работает, а не группа специально обученных индусов.

Look

Raspberry Pi представила Compute Module 5 и дополнительные платы для неё

ShadF0x Nov 27 2024 at 21:07

Попробовал сделать замеры через hdparm, получилось... странно.

mmcblk0 - eMMC, mmcblk1 - SD-карта.

Ощущение, будто оно какие-то пятна на солнце "замеряет".

Look

Raspberry Pi представила Compute Module 5 и дополнительные платы для неё

ShadF0x Nov 27 2024 at 20:29

Грузиться с секундомером не стал, вместо этого ради интереса потыкал dd на OrangePi, благо что моя модель оснащена тремя типами дисков.

Контекст: nvme - это просто папка (ОС запущена с NVMe), emmc и flash - это маунты на eMMC и Samsung PRO Plus microSDXC соответственно.

Look

Raspberry Pi представила Compute Module 5 и дополнительные платы для неё

ShadF0x Nov 27 2024 at 14:23

eMMC - это, вроде бы, те же SD, только припаянные.

Look

AI copilot программист приличного уровня теперь оффлайн — Qwen 2.5.1 Coder 7B

ShadF0x Nov 25 2024 at 17:35

Про ферму сказать не могу, но при прочих "условно равных", 1070 заметно медленее условной 6900XT.

В LLM многое решает пропускная способность памяти. По карточкам с Techpowerup, у 1070 эта цифра - 256.3 GB/s, у 4060Ti - 288 GB/s, у 6900ХТ - 512 GB/s, у 4090 - 1.01 TB/s.

Look

Разработчик запустил рендеринг «современных» скинов Winamp в браузере после реверс-инжиниринга байт-кода MAKI

ShadF0x Nov 23 2024 at 10:09

Спортивный интерес или какой-то другой смысл?

"After tackling classic Winamp skins it was only natural that I should be curious about modern skins, and I was! Could I get modern skins to run in the browser?"

Look

Я наконец понял, что не так с ЕГЭ…

ShadF0x Nov 20 2024 at 15:48

Вот захочу я поступить куда-нибудь в свои 45 лет, разве мне не профильный для ВУЗа ЕГЭ сдать надо?

Для вас будет не ЕГЭ, по-идее, а внутренние экзамены ВУЗа. Хотя они их как-то сравнивают с результатами тех, кто по ЕГЭ поступал.

Look

Умелец создал голосового ассистента на базе Raspberry Pi и ChatGPT

ShadF0x Nov 13 2024 at 16:26

Генерацию текста я б малине доверять не стал, тут как раз можно использовать облако\runpod. А вот анализ голоса и синтез TTS - это запросто. У spchat заявлена поддержка RPi4, Piper как раз изначально под малину делали.

Look

AI copilot программист приличного уровня теперь оффлайн — Qwen 2.5.1 Coder 7B

ShadF0x Nov 12 2024 at 15:27

Отредактировать комментарий уже не могу, поэтому раскрою мысль отдельно.

llamacpp - позволяет запускать GGUF-модели. Основной плюс - умеет делить модель между VRAM и RAM, и запускать модели целиком из RAM, хоть и с огромным ударом по скорости. На маках М-серии удар не такой сильный, там вполне можно использовать для запуска +70B.

KoboldCPP - питоний гуй поверх llamacpp, в основном удобен именно тем, что настройки можно нащёлкать вместо написания простыней в командной строке. Бонусом интегрирует в себя веб-интерфейс, Whisper STT (преобразование речи в текст) и SD.cpp (переделка StableDiffusion на крестах). Есть форк с интеграцией ROCm для запуска на Radeon.

TabbyAPI - реализация EXL2. Работает быстрее, чем llama, и не тормозит при большом размере контекста. Главный минус - жёстко ограничен размерами VRAM, не умеет отгружать "лишние" части модели в RAM.

vLLM - почти чистый Transformers, умеет загружать "оригинальные" модели. Вроде как умеет отгружать лишнее в RAM, но в целом больше заточен под работу с GPU-фермами. Главный минус - модели на FP16 зело жирные (Llama 3 8B в FP16 весит 16 гигабайт сама по себе, а ведь ещё память под контекст нужна). Есть методы "сжатия" NF4 и bitsandbytes, но они сильно бьют по "умственным" способностям модели. Насколько мне известно, это единственный способ запустить vision-модели не прибегая к костылям с подгрузкой внешнего mmproj.

oobabooga - огромный комбайн из всего и вся, позволяет запускать модели, смешивать их, перетренировывать, писать бенчмарки и ещё по мелочи. Сам по себе модели не запускает, но в комплекте идут несколько разных движков (AWQ, GPTQ, EXL2, Llamacpp и чистый Transformers) и REST API для генерации текста.

Look

AI copilot программист приличного уровня теперь оффлайн — Qwen 2.5.1 Coder 7B

ShadF0x Nov 12 2024 at 13:37

ComfyUI тут не при чём, гуглите TabbyAPI, KoboldCCP и oobabooga.

Look

Apple — главный провайдер цензуры в мире

ShadF0x Oct 31 2024 at 21:50

Магазин приложений вроде как работает, а вот обновления прошивки с сервера стянуть - это уже проблема. Причём на шлеме это ещё можно обойти через андроидовский WireGuard, а вот с Touch Pro такой фокус уже не катит.

Look

Apple — главный провайдер цензуры в мире

ShadF0x Oct 31 2024 at 14:44

Вроде того. Разработчик может повесить заглушку типа "у вас приложение некошерное, скачайте из GP", насколько я понимаю. Вполне себе usecase для приложений от банков, например, чтоб пользователей отучить ставить версии с APKPure.

Look

Торвальдс прокомментировал исключение российских разработчиков из списка мейнтейнеров Linux по указанию юристов

ShadF0x Oct 24 2024 at 02:10

Т.е. давайте под шумок выпилим меинтейнеров из всех тех стран, которые волею судьбы оказались в составе СССР на момент Финской войны? Нравы и идеи-то общие, получается.

Look

ShadF0x Oct 24 2024 at 01:54

Может, и можно. Просто в сообщении выглядит как ни к селу, ни к городу.

Личное ИМХО - для меня это на том же уровне, что и "бывшие" россияне, которые уехали в условную Латвоманию, а потом оттуда рассказывают, какая Россия на самом деле замечательная страна, и как они ею гордятся изо всех щелей. Вот только обратно что-то ехать не хотят.

+12

Look

ShadF0x Oct 23 2024 at 22:34

Эк у него душа-то болит за Карелию, будучи гражданином США, проживающим в США, последние лет 14.

+23

Look

Монолитный бэкенд на Java и Vue-фронтенд: практические решения для эффективной разработки опенсорса

ShadF0x Oct 23 2024 at 14:28

Более того, у openjdk в репо написано, что их образы помечены как deprecated. Вместо них предлагают использовать образы amazoncorretto, они сделаны на базе образа amazonlinux, который собран от alpine 3.17.

Look

Платформа Guilded (аналог Discord) закрыла доступ к ресурсу для пользователей из РФ

ShadF0x Oct 11 2024 at 20:23