mefdayy 20 янв в 21:48

DeepSeek утверждает, что его модель рассуждений превосходит o1 от OpenAI по некоторым показателям

3 мин

9.8K

Блог компании BotHubИскусственный интеллектМашинное обучение*

Комментарии 29

Dhwtj 20 янв в 23:32

Deepseek v3 (базовый, не "рассуждающий") доступен из России бесплатно и без ограничений.

Но он всё же слабее чем open ai, Google, Anthropic

Ingref 21 янв в 01:17

И рассуждающий R1 тоже доступен, если слева снизу нажать DeepThink:

Dhwtj 21 янв в 06:29

Попробую. Но там видимо ограничения. Первый раз не сработал, сказал что вы исчерпали чего-то

perfect_genius 25 янв в 00:18

Спасибо, я и не заметил. Без неё чат не смог правильно посчитать количество "о" в слове "котовасия".

pfr46 20 янв в 23:34

Новости AI, AI, AI..,AI,AI... Больше совсем ничего не происходит?

Hardcoin 21 янв в 00:03

Инаугурация Трампа ещё, но на Хабре таких новостей не публикуют. Так что да, остается только ИИ.

CBET_TbMbI 21 янв в 00:05

Так, а кто новости-то пишет?))

numark 21 янв в 03:17

Рассуждающий AI agent.

XFree2 22 янв в 14:54

Дык люди обленились и просят AI сделать новости, а он пиарит сам себя =)

akuli 20 янв в 23:55

И тем не менее модели OpenAI на мой взгляд превосходит большинство других моделей на данный момент.

Dhwtj 21 янв в 06:32

И как с ним работать из России? Только не надо про покупку виртуального номера телефона, VPN и прочие извращения

А deepseek доступен напрямую

Belking 21 янв в 07:08

>> и прочие извращения

Когда думал, что комментарии на Хабре достигли дна, но снизу постучали.

gfiopl8 21 янв в 07:20

Покупать через "казаха посередине", есть куча удобных сайтов-сервисов которые выросли на этой потребности.

Впн и прокси не нужен, есть вариант попроще.

mracobes281 21 янв в 08:29

Вроде бы как отвечае про площадь

Belking 21 янв в 19:20

И в тиктоке нагугливаются видео про площадь, высмеивающие цензуру. Классика, свести всё представление о цензуре и тоталитаризму к одной конкретной вещи, и замусоливанием её добиться, что всем станет пофиг. Зато все кто не "актуализировался" будут "убиваться" об неё...

eineless 21 янв в 09:01

Кто уже сравнивал ответы DeepSeek. Есть мысли на сей счет?

capfsb 21 янв в 12:47

Зайдите у ним в гитхаб, там есть бенчмарки моделей

Nizhegorodets 21 янв в 14:25

Сначала захожу в ChatGpt и с ним всё устраивает. Когда лимит кончается и он переключается на младшую модель, то мне её ответы не очень, поэтому подключаюсь к DeepSeek. Средненькие ответы и бывает иногда, что что-то мешает ему хорошо отвечать (не пойму что). Иногда один и тот же вопрос решаю, включив сразу три-четыре чата: Ллама 3.3 (нравится, но объём разговора короткий), Мистрал (как DeepSeek, средне), Копилот (средне), Грог (детский лепет), в Джемени редко захожу, на днях появилось Hailuo чат (аудио с чужими голосами у них ничтяк!) тоже средне.

Ах, да. У меня писательская деятельность и вопросы серьёзные, политические.

Egres 21 янв в 11:52

Врёт точно так же как и все остальные.
Правда, есть кнопка search, которая берёт и обощает ответ из инета.

capfsb 21 янв в 12:52

Особенно интересным мне этот релиз показался из-за облегченных квантированных моделей, их можно запускать на домашнем компьютере(с игровой видюхой). При этом данные модели значительно превосходят другие опенсорс модели со схожим количеством параметров из-за того что они применили новые подходы для их обучения.

Судя по всему через пару тройку лет иметь относительно умную (как сегодняшний чатГПТ) модель на домашнем компьютере будет нормой.

Кому интересны подробности у них в гитхабе про это много написано

gfiopl8 22 янв в 04:52

Эти модели уже есть в ollama. Любой желающий может сам проверить, в обычном разговоре р1 8б сливает лламе 8б, он просто не говорит по русски. Может быть сможет дать лучше ответы на "олимпиадные задачки" если спросят по английски и китайски но кому это нужно?

Killan50 27 янв в 05:35

Оно немного криво работает с рассуждениями, гонял 32b модель в 4 кванте(на английском само собой), периодически выдавал теги /think не к месту, либо дублировал ответ столько раз столько я ставил лимит токенов. Возможно конечно кривой квант, потестирую ещё, но пока не сильно впечатлен, +- то же самое я получал от gemma-2-27b + плагин на принудительные рассуждения.

Shannon 27 янв в 14:50

Потому что это не R1, версии на 70B или 32B и ниже ошибочно называют R1, хотя это R1 Distill. R1 Distill - это файнтюн на выходных данных R1 для qwen или llama, они не обучались как оригинальная R1 и их качество не соответствует R1.

Killan50 28 янв в 05:55

Почитал, да так и есть. Чуда не случилось. Для нормального R1 готовьте майнинг ферму. Впрочем крупным компаниям это не должно составить проблем, для них деньги на запуск полноценной версии не большие.

pitspb 21 янв в 14:25

На мой взгляд китайский аи из серии французской аи, giga chat что касается то модели chat gpt и gemeni 1.5 и от google. их явно превосходят.

mithdradates 22 янв в 00:17

Лол, Gigachat и рядом с Мистралем/DeepSeek/Qwen не валялся.

DeepSeekV3 на английском мне куда больше нравится по сравнению с 4o или Gemini 1.5 Pro, но меньше Claude 3.5 Sonnet. Новый R1 по ощущениям пока где-то на уровне o1 с low compute - т.е. лучше o1-mini, но до o1 pro пока недотягивает. С учетом цены токенов, это убер мощно.

На русском DeepSeek так себе, они прямо в тех. репорте пишут что упор на английский и китайский.

Dhwtj 22 янв в 22:29

R1 рассуждающая, но облегченная чтобы совсем не тормозила.

Аналог о1 мини, Gemini 2.0 flash thinking

Если не нужны рассуждения, то лучше не не пользоваться

VpsK 21 янв в 14:25

Пока ошибается он(как и гемини) вопросы задавали по бухгалтерии он ответил абсолютно не правильно с включенным режимом поиска. Лучше всех ответил мистрал но слишком короткий ответ был. И чат гпт с одной попытки дал очень правильный четкий ответ. Так что пока веры китайскому нет

mithdradates 22 янв в 00:18

Так и не надо верить, есть факты в виде кучи бенчмарков. Таргетные языки у модели - английский и китайский, если на русском не очень работает, то увы, ничего не поделаешь. Он как раз от o1 на livebench сильно отстает именно в плане языков.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий