Как стать автором
Обновить

Комментарии 29

Deepseek v3 (базовый, не "рассуждающий") доступен из России бесплатно и без ограничений.

Но он всё же слабее чем open ai, Google, Anthropic

И рассуждающий R1 тоже доступен, если слева снизу нажать DeepThink:

Попробую. Но там видимо ограничения. Первый раз не сработал, сказал что вы исчерпали чего-то

Спасибо, я и не заметил. Без неё чат не смог правильно посчитать количество "о" в слове "котовасия".

Новости AI, AI, AI..,AI,AI... Больше совсем ничего не происходит?

Инаугурация Трампа ещё, но на Хабре таких новостей не публикуют. Так что да, остается только ИИ.

Так, а кто новости-то пишет?))

Рассуждающий AI agent.

Дык люди обленились и просят AI сделать новости, а он пиарит сам себя =)

И тем не менее модели OpenAI на мой взгляд превосходит большинство других моделей на данный момент.

И как с ним работать из России? Только не надо про покупку виртуального номера телефона, VPN и прочие извращения

А deepseek доступен напрямую

>> и прочие извращения

Когда думал, что комментарии на Хабре достигли дна, но снизу постучали.

Покупать через "казаха посередине", есть куча удобных сайтов-сервисов которые выросли на этой потребности.

Впн и прокси не нужен, есть вариант попроще.

Вроде бы как отвечае про площадь

И в тиктоке нагугливаются видео про площадь, высмеивающие цензуру. Классика, свести всё представление о цензуре и тоталитаризму к одной конкретной вещи, и замусоливанием её добиться, что всем станет пофиг. Зато все кто не "актуализировался" будут "убиваться" об неё...

Кто уже сравнивал ответы DeepSeek. Есть мысли на сей счет?

Зайдите у ним в гитхаб, там есть бенчмарки моделей

Сначала захожу в ChatGpt и с ним всё устраивает. Когда лимит кончается и он переключается на младшую модель, то мне её ответы не очень, поэтому подключаюсь к DeepSeek. Средненькие ответы и бывает иногда, что что-то мешает ему хорошо отвечать (не пойму что). Иногда один и тот же вопрос решаю, включив сразу три-четыре чата: Ллама 3.3 (нравится, но объём разговора короткий), Мистрал (как DeepSeek, средне), Копилот (средне), Грог (детский лепет), в Джемени редко захожу, на днях появилось Hailuo чат (аудио с чужими голосами у них ничтяк!) тоже средне.

Ах, да. У меня писательская деятельность и вопросы серьёзные, политические.

Врёт точно так же как и все остальные.
Правда, есть кнопка search, которая берёт и обощает ответ из инета.

Особенно интересным мне этот релиз показался из-за облегченных квантированных моделей, их можно запускать на домашнем компьютере(с игровой видюхой). При этом данные модели значительно превосходят другие опенсорс модели со схожим количеством параметров из-за того что они применили новые подходы для их обучения.

Судя по всему через пару тройку лет иметь относительно умную (как сегодняшний чатГПТ) модель на домашнем компьютере будет нормой.

Кому интересны подробности у них в гитхабе про это много написано

Эти модели уже есть в ollama. Любой желающий может сам проверить, в обычном разговоре р1 8б сливает лламе 8б, он просто не говорит по русски. Может быть сможет дать лучше ответы на "олимпиадные задачки" если спросят по английски и китайски но кому это нужно?

Оно немного криво работает с рассуждениями, гонял 32b модель в 4 кванте(на английском само собой), периодически выдавал теги /think не к месту, либо дублировал ответ столько раз столько я ставил лимит токенов. Возможно конечно кривой квант, потестирую ещё, но пока не сильно впечатлен, +- то же самое я получал от gemma-2-27b + плагин на принудительные рассуждения.

Потому что это не R1, версии на 70B или 32B и ниже ошибочно называют R1, хотя это R1 Distill. R1 Distill - это файнтюн на выходных данных R1 для qwen или llama, они не обучались как оригинальная R1 и их качество не соответствует R1.

Почитал, да так и есть. Чуда не случилось. Для нормального R1 готовьте майнинг ферму. Впрочем крупным компаниям это не должно составить проблем, для них деньги на запуск полноценной версии не большие.

На мой взгляд китайский аи из серии французской аи, giga chat что касается то модели chat gpt и gemeni 1.5 и от google. их явно превосходят.

Лол, Gigachat и рядом с Мистралем/DeepSeek/Qwen не валялся.

DeepSeekV3 на английском мне куда больше нравится по сравнению с 4o или Gemini 1.5 Pro, но меньше Claude 3.5 Sonnet. Новый R1 по ощущениям пока где-то на уровне o1 с low compute - т.е. лучше o1-mini, но до o1 pro пока недотягивает. С учетом цены токенов, это убер мощно.

На русском DeepSeek так себе, они прямо в тех. репорте пишут что упор на английский и китайский.

R1 рассуждающая, но облегченная чтобы совсем не тормозила.

Аналог о1 мини, Gemini 2.0 flash thinking

Если не нужны рассуждения, то лучше не не пользоваться

Пока ошибается он(как и гемини) вопросы задавали по бухгалтерии он ответил абсолютно не правильно с включенным режимом поиска. Лучше всех ответил мистрал но слишком короткий ответ был. И чат гпт с одной попытки дал очень правильный четкий ответ. Так что пока веры китайскому нет

Так и не надо верить, есть факты в виде кучи бенчмарков. Таргетные языки у модели - английский и китайский, если на русском не очень работает, то увы, ничего не поделаешь. Он как раз от o1 на livebench сильно отстает именно в плане языков.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий