MrRjxrby Aug 9 at 10:14

GigaChat 2.0 от Сбера: как пользоваться российским аналогом ChatGPT

Easy

10 min

8.7K

BotHub corporate blogArtificial IntelligenceThe future is hereIT-companies

Review

+11

Comments 35

dazran Aug 9 at 11:41

Интересные результаты выдает GigaChat в мессенджере max по запросу: "Нарисуй русский алфавит в порядке от А до Я, рядом с каждой буквой будет животное, чье название начинается с этой буквы"

morosov_a_s Aug 9 at 19:35

Ощущения от гигачата следующие - он вполне вменяем как собеседник, неплохо справляется с программированием, общие технические задачи решает уже так себе, что же касается художественных задач, то тут полный провал.

Дипсик - так себе кодер, общая техника на высоте, художественные задачи - достойно.

Джемини - хорош в научных исследованиях и разработках, кодерство и общая техника, терпимо, но посредственно, художественные вопросы - провал.

Neon7Blade Aug 10 at 15:02

Кто бы мог подумать, что на Хабре им в первую очередь художественных задач не хватило

qiper Aug 9 at 21:09

Разумеется, многим бросится в глаза само название сети — кому‑то покажется слегка кликбейтом, но GigaChat действительно стал российским аналогом ChatGPT. Пользователям больше не нужно использовать VPN‑приложения

Не нужен VPN => Российский аналог ChatGPT

Sindyashkin Aug 10 at 02:19

Пару месяцев назад Гигачат уходил в бесконечную генерацию на задаче ниже, потому что предлагал неподходящие числа и генерировал с каждой попыткой один и тот же набор. Сейчас проверил- исправили, справляется. Из 10 примеров только один неподходящий выдал как годный. А дипсик и тогда и сейчас убеждает, что 900 это валидный ответ. Ему незачет.

Придумай два двузначных числа, произведение которых будет давать число строго с одним нулем в любом разряде. Проверь, чтобы результат содержал только один ноль. Приведи 3 разных примера

Провалили другую задачу все 3 ИИ (гигачат, чатГПТ, и дипсик). Проверял физическую задачу: посчитать глубину колодца если известно что в него бросили камень, и звук падения услышали через 7 секунд. Все три дали верные формулы, но с числами разошлись и все - неверные. Wolframalpha был эталоном вычислений.

Neon7Blade Aug 10 at 15:53

А Яндекс Алиса или как их там, миллион подвидов, - хуже или лучше, оно вообще свое приложение имеет?

DaytonCavalet Aug 10 at 20:11

Алиса - это, грубо говоря, скорее «умный поисковик». И он очень сильно задушен цензурой, что мешает им пользоваться. Есть ощущение, что «на всякий случай» - выкручено очень много чего из-за чего даже безобидный вопрос может быть отклонен.

Kwisatz 3 hours ago

Алиса? Негодный мусор, более бесполезную фигню трудно придумать. Врет, хамит, не ищет что ее просишь. Работает как голосовой асистент из 2000

Neon7Blade 2 hours ago

А ты по каким темам в пользовании это понял? А то многих же все устраивает и даже больше, судя по комментам на Гугл плее

Kwisatz 1 hour ago

Ну давайте чисто сегодняшнее:

Алиса, хочу послушать фильм "Иван Васильевич меняет профессию" на 10 разных ладов пачкой разных промтов, результаты от "я не могу воспроизводить видео" до "включаю альбом" (саундтреки)
Алиса, включи песню "Ведьмина вода" и сходное из кф, включая прямое указание на исполнителя и кф: включает всякую дичь которая с промтом связана лишь опосредовано.

Мало? Заведите ребенка. У меня дочка как то почти до истерики дошла, потому что вчера сказка была и находилась, а сегодня нет, и алиса ей включает какую то дичь которая с промтом не имеет пересекающихся слов. Тоже самое слышал по песне Даниэлы, попробуйте, поупражняйтесь.

Все еще мало? Вот прикол поинтересней: по какой то причине у Алисы были проблемы с доступом к инфраструктуре яндекса, не помню что именно мне было от нее нужно, но она меня пыталась убедить что у нее связи нет, вайфай не работает, интернета нет итд, но тут же бордо включала музычку по запросу.

И еще мало? Попробуйте сказать "Алиса, скажи 300". Мне совершенно плевать что там себе думают разработчики и почему, но так разговаривать ассистенту не положено.

Итого: неплохо, для ассистента года эдак из 2004, или даже 1994

PS если кому то нравится, пусть едят, мне не жалко

PSPS Ну все же не ты а вы?)

FemboyEnjoyer Aug 11 at 01:06

>как пользоваться российским аналогом ChatGPT

таки подавляя рвотный рефлекс

Hopenolis Aug 11 at 02:27

Доделайте тг бота хотя бы до уровня среднестатистического циганского бота, у вас там 1.5млн уников в месяц а бот не может даже маркдаун от ллм адекватно в маркдаун тг перевести.

Neon7Blade Aug 11 at 17:07

Где ты видел боты лучше в тг?

pol_pot Aug 12 at 00:47

Миллион их. Тех кто может более менее с маркдауном работать по крайней мере.

Neon7Blade Aug 12 at 15:32

Что это за выделенный текст "Миллион их"?

pol_pot Aug 13 at 01:35

Это ссылка на пример который ты просил. Я видел лучше, и не раз.

Neon7Blade Aug 13 at 14:20

А как мне убедиться, что это ссылка безопасная?

pol_pot Aug 13 at 14:31

Отправь кого не жалко на разведку.

Neon7Blade Aug 13 at 14:32

Уже все проверили - и что ты хотел сказать этим?

pol_pot yesterday at 00:44

Этот нормальный, там в настройках есть современные размышляющие модели, они должны решать математику на 100% если их специально не запутывать.

Neon7Blade 13 hours ago

Как запутывать? Я его вчера спрашиваю, какой самый лучший бот из твоей статьи, а он ее просто перессказал. И зачем мне надо было остальные тогда кидать время тратить, если этот нормальный

Neon7Blade Aug 13 at 14:41

Это был один пример, а где ещё недостающие?

pol_pot Aug 13 at 14:47

Их миллионы, ты гуглить не умеешь? Вот тебе свежая "статья" на хабре https://habr.com/ru/articles/936542

Neon7Blade Aug 13 at 15:41

Мне нужно с текстом связанное

pol_pot Aug 13 at 15:47

А там что?

Neon7Blade Aug 13 at 15:47

Там написано, что это цыганские бесполезные боты

pol_pot Aug 13 at 16:00

Ну да. У при этом у них лучше реализована работа с тг маркдауном чем у великого сбера. Ж(

Neon7Blade Aug 13 at 16:02

Ну назови мне лучший из них по тексту и математике

Floridov Aug 11 at 05:07

Можно поподробнее про задачу с автоматами? Почему если выдаст чай - автомат с ярлыком "Чай" Должен выдавать кофе, а не может быть рандомом?

Kollubov Aug 12 at 15:09

Можно. Если автомат с надписью "рэндом" выдал чай, а автомат с надписью "чай" будет рэндомом, то автомат с надписью "кофе" будет таки выдавать кофе, а это противоречит условиям задачи.

Gradotechnic Aug 11 at 05:46

"как пользоваться" - никак. Есть нормальные LMM.

Barnaby Aug 12 at 08:44

Обратите внимание на тесную связь всех компонентов ансамбля именно с русским языком. По сути, GigaChat оптимизирован для восприятия запросов на русском языке, хотя возможность работы с другими языками сохраняется.

Но в EN бэнчах у него больше баллов, что как бы намекает откуда ноги растут :)

Mike_666 Aug 12 at 12:53

Был бы он открытым - мог бы быть интересным, а вот когда он доступен только в виде весьма недешевого API и при этом сильно зажат цензурой - не очень.
(Да в приложении или тг боте можно пользоваться бесплатно - но голая БЯM это уже не особо интересно, нужно инструменты, память - причем свои, а не те что провайдер модели предусмотрел)

Nurked Aug 13 at 01:02

У кого есть доступ к картинкогенерации, проверьте, пожалуйтса, он что, всё ещё на слово "родное" всё ещё генерирует индейцев?

А если честно, то как-то странно видеть модель на 13В (которые я могу на своём макбуке гонять ордами) ставится в один ряд с тяжеловесами на 200В+ параметров. И при этом выигрывает в синтетических тестах.

Либо тренировали на чём-то непонятном, чисто чтобы тесты проходили, либо под капотом что-то уже натренированое.

n0isy 22 hours ago

В таблице, если приглядеться, всё указано: цифры очень близкие к Qwen. ^-^ - вот такие китайские giga-ушки торчат...