daniilshat Jan 28 at 11:07

Исследователи из Unsloth сжали DeepSeek R1 на 80% от оригинального размера

2 min

27K

Machine learning*Artificial Intelligence

+24

Comments 21

lczero Jan 28 at 12:52

😈🤗

shellenberg Jan 28 at 14:57

В олламу можно конвертнуть?

zizop Jan 29 at 02:32

Уже конвертнули - https://ollama.com/library/deepseek-r1

yppro Jan 29 at 10:48

Разбирали на Хабре недавно. 7b несёт ахинею, в простой код не умеет, бесполезная игрушка

Anti-antivakser Jan 28 at 15:55

Скоро эти нейронки начнут работать на смартфонах таким темпом👍

Lev3250 Jan 28 at 16:35

Они уже работают в новых айфонах и самсунгах (может ещё где-то, но не следил)

Jacov911 Jan 28 at 16:42

Разве там не серверные ?

Lev3250 Jan 28 at 17:18

Последние модели телефонов имеют ускорители для локальных моделей. Не уровня 1о, конечно

Jacov911 Jan 28 at 17:44

Но вопрос не в том, что имеют ускорители, а в том, что большая часть обработки вроде северная пока.

Говорю как юзер пикселя

Graid Jan 28 at 21:36

На айфоне есть MLC Chat, пользуюсь уже около года еще до выхода последнего айфона с продвинутым процом работало. Все модели полностью локальные, загружаются только сами веса.

yppro Jan 29 at 11:19

Качество?

Graid Jan 29 at 17:08

Там видно какие модели доступны, ни deepseek ни 4o конечно

Victor64 Jan 29 at 10:00

А как это работает в новых пикселях? Я как раз присматриваюсь к ним. Как увидел что в девятом три гига оперативки зарезервировано под ии - принял это как аргумент за восьмой, потому что памяти пользователю остаётся столько же, а умещать полезную модель в три гига кажется ещё не научились. Или какие-то этапы обработки запроса правда разумно выполнять локально?