Comments / Profile of ShadF0x / Habr

Пользователь

ProfileArticlesPostsNewsComments494

15 минут — и у тебя бесплатная ИИ-модель для генерации кода, текста, чтения иллюстраций

ShadF0x Jun 25 at 07:39

Не "ещё", LCPP - это "бэкенд" поверх которого работает Ollama. Сама Ollama - это репозиторий сконвертированных моделей и конфигов к ним, чтоб голову не надо было включать.

Для "печальных владельцев AMD" есть https://github.com/YellowRoseCx/koboldcpp-rocm, либо поддержка Vulkan Compute.

+2

Найм в IT всё-таки мёртв

ShadF0x Jun 20 at 11:15

+10

Локальный DeepSeek-R1: Когда скорость улитки – не приговор, а точка старта

ShadF0x Jun 10 at 10:45

K80 - это бутерброд из двух ГПУ на 12ГБ, больно геморройно на ней модели запускать.

0

Британия становится центром развития ИИ: от идентификации личности до создания кластеров под руководством Воложа

ShadF0x Jun 9 at 14:00

Он не смог решить какой вариант будет выгоднее, поэтому сыграл в обе стороны.

https://web.archive.org/web/20240222094115/https://volozh.com/

+3

Минцифры: подтвердите официально свои знания в ИТ по Python, Java, SQL, C#, PHP, HTML, ООП и PostgreSQL, а также Linux

ShadF0x Jun 4 at 23:00

Причем тут в целом дефрагментация

В доках по G1 есть такое упоминание:

Humongous Object Fragmentation

A Full GC could occur before all Java heap memory has been exhausted due to the necessity of finding a contiguous set of regions for them. Potential options in this case are increasing the heap region size by using the option -XX:G1HeapRegionSize to decrease the number of humongous objects, or increasing size of the heap. In extreme cases, there might not be enough contiguous space available for G1 to allocate the object even if available memory indicates otherwise. This would lead to a VM exit if that Full GC can not reclaim enough contiguous space. As a result, there are no other options than either decreasing the amount of humongous object allocations as mentioned previously, or increasing the heap.

Полагаю, у автора вопроса просто глаз зацепился за знакомое слово.

0

Минцифры: доля трафика VPN-сервисов увеличивается, ведомство намерено определиться с политикой в отношении VPN

ShadF0x May 30 at 08:48

Ещё остаётся RFC 1149! /s

+3

За полчаса установил DeepSeek 1.5B, пока вы искали GPT подешевле

ShadF0x May 15 at 07:39

А 1,5B даже и не знаю кому и зачем может пригодиться

Мелкие модели (1.5-3B) - это, как правило, draft-модели для спекулятивного декодинга. Пока большая модель (от 70B) рожает ежа, draft-модель быстро подкидывает наиболее вероятные токены.

0

После укрепления рубля внутриигровые товары в Steam резко подешевели

ShadF0x May 7 at 15:14

Некоторые издатели (в частности SEGA и Sony) блокируют возможность дарить игры на аккаунты RU\BY. Steam ещё и Family Share "улучшил", теперь нельзя пригласить в "семью" пользователя из другого региона.

Конкретно с Sega, кстати, там довольно забавно получается - игры по Persona российским аккаунтам можно дарить, а игры по Yakuza - нет.

0

Meta* выпустила Llama 4, новую серию флагманских моделей AI

ShadF0x Apr 6 at 15:33

Насчёт цензуры, так её не просто уменьшили, её фактически убрали.

Мету, видимо, оповестить забыли.

0

Демо-версия ремейка Half-Life 2 RTX вышла в Steam

ShadF0x Mar 18 at 17:31

CryEngine же.

+4

Демо-версия ремейка Half-Life 2 RTX вышла в Steam

ShadF0x Mar 18 at 16:36

не важных для нас в настоящий момент

Осталось только придумать, как это ловить при игре с обычного монитора, на обычном компьютере. В VR либо отслеживание взгляда для этого есть, либо просто считают от центра линзы.

+4

В «Ростехе» запустили новое производство мини‑компьютеров для нейросетей

ShadF0x Mar 17 at 12:52

Ну вот в хотелках как раз было не жрать, что дают, а запускать своё без геморроя. Например, что-нибудь из 14B, плата на 16\32 ГБ вроде бы должна осилить.

0

В «Ростехе» запустили новое производство мини‑компьютеров для нейросетей

ShadF0x Mar 17 at 00:58

На RK3588 можно LLM-ки запустить

А можно по-подробнее? Пробовал запустить LLM на OrangePi 5 Plus, и нормально "работал" только MLC, но процесс конвертации моделей больно муторный. LCPP\KCPP тоже запустились, но это был мрак по скорости. Пробовал ковыряться с RKNN, но там всё выглядит как "короч, мы тут сделали, а вы сами *битесь как с этим работать" (вообще, по опыту, довольно типичный подход китайцев к одноплатникам).

+1

Teensy 4: Arduino на скорости 600 МГц (почувствуй себя властелином вселенной)

ShadF0x Feb 23 at 15:16

Интересно, а решения ~~в поисках проблемы~~ типа SG2002 - это ещё микроконтроллер или таки уже одноплатник?

0

DLSS 4 делает 240 fps в 4К: Как и на каких видеокартах работает новый апскейлер от NVIDIA

ShadF0x Feb 11 at 17:02

я не понимаю почему её там не используют

Здрасьте, это ещё в 2016 было.

+1

Открыт предзаказ на Minimal Phone с QWERTY-клавиатурой, E-Ink экраном и ОС Android

ShadF0x Feb 1 at 18:30

Так ведь уже было

+7

В аэропорту Шереметьево напомнили об официальной Wi-Fi-точке аэровокзала и просят не подключаться к мошенническим ТД

ShadF0x Feb 1 at 16:46

Не понял связи между казахстанской симкой и "иностранным" IP. Автор хотел сказать, что симка стучится в домашний регион, а оттуда сервер опсоса услужливо подтягивает страницу?

+1

Разработчики заметили, что библиотеки DeepSeek полностью совместимы с библиотеками OpenAI

ShadF0x Jan 28 at 23:54

делать его не compatible - дурной тон

Поэтому то и дело встречается compatible*.

* - ваши поля - не поля; необязательныe поля не необязательны; порядок полей неправильный; структура поля неправильная; мы такое поле не знаем, а потому идите лесом; у вас в сообщении весь контекст вместо одного сообщения - идите лесом; сообщения от system нельзя, идите вслед за предыдущими двумя.

0

Как установить и использовать ИИ модель DeepSeek R-1 на вашем компьютере

ShadF0x Jan 27 at 17:04

Можно, но скорость упадёт. У меня нет R1 под рукой, но Mistral NeMo 12B на RTX4090 выдаёт 50 токенов в секунду, а на Ryzen 9 5900X - 2.5 ток/с. С DDR5 будет чуть быстрее, но не сильно.

+1

Как установить и использовать ИИ модель DeepSeek R-1 на вашем компьютере

ShadF0x Jan 27 at 16:51

Суть R1, скорее, в том, что у ней внутре ~~неонка~~ рассуждения. Приделать Chain of Thought можно почти к любой модели, но у R1 CoT прям в датасете, похоже.

+1

2

3 4 ...