Search
Write a publication
Pull to refresh

Comments 35

Интересные результаты выдает GigaChat в мессенджере max по запросу: "Нарисуй русский алфавит в порядке от А до Я, рядом с каждой буквой будет животное, чье название начинается с этой буквы"

Ощущения от гигачата следующие - он вполне вменяем как собеседник, неплохо справляется с программированием, общие технические задачи решает уже так себе, что же касается художественных задач, то тут полный провал.

Дипсик - так себе кодер, общая техника на высоте, художественные задачи - достойно.

Джемини - хорош в научных исследованиях и разработках, кодерство и общая техника, терпимо, но посредственно, художественные вопросы - провал.

Кто бы мог подумать, что на Хабре им в первую очередь художественных задач не хватило

Разумеется, многим бросится в глаза само название сети — кому‑то покажется слегка кликбейтом, но GigaChat действительно стал российским аналогом ChatGPT. Пользователям больше не нужно использовать VPN‑приложения

Не нужен VPN => Российский аналог ChatGPT

Пару месяцев назад Гигачат уходил в бесконечную генерацию на задаче ниже, потому что предлагал неподходящие числа и генерировал с каждой попыткой один и тот же набор. Сейчас проверил- исправили, справляется. Из 10 примеров только один неподходящий выдал как годный. А дипсик и тогда и сейчас убеждает, что 900 это валидный ответ. Ему незачет.

Придумай два двузначных числа, произведение которых будет давать число строго с одним нулем в любом разряде. Проверь, чтобы результат содержал только один ноль. Приведи 3 разных примера

Провалили другую задачу все 3 ИИ (гигачат, чатГПТ, и дипсик). Проверял физическую задачу: посчитать глубину колодца если известно что в него бросили камень, и звук падения услышали через 7 секунд. Все три дали верные формулы, но с числами разошлись и все - неверные. Wolframalpha был эталоном вычислений.

А Яндекс Алиса или как их там, миллион подвидов, - хуже или лучше, оно вообще свое приложение имеет?

Алиса - это, грубо говоря, скорее «умный поисковик». И он очень сильно задушен цензурой, что мешает им пользоваться. Есть ощущение, что «на всякий случай» - выкручено очень много чего из-за чего даже безобидный вопрос может быть отклонен.

Алиса? Негодный мусор, более бесполезную фигню трудно придумать. Врет, хамит, не ищет что ее просишь. Работает как голосовой асистент из 2000

А ты по каким темам в пользовании это понял? А то многих же все устраивает и даже больше, судя по комментам на Гугл плее

Ну давайте чисто сегодняшнее:

  1. Алиса, хочу послушать фильм "Иван Васильевич меняет профессию" на 10 разных ладов пачкой разных промтов, результаты от "я не могу воспроизводить видео" до "включаю альбом" (саундтреки)

  2. Алиса, включи песню "Ведьмина вода" и сходное из кф, включая прямое указание на исполнителя и кф: включает всякую дичь которая с промтом связана лишь опосредовано.

Мало? Заведите ребенка. У меня дочка как то почти до истерики дошла, потому что вчера сказка была и находилась, а сегодня нет, и алиса ей включает какую то дичь которая с промтом не имеет пересекающихся слов. Тоже самое слышал по песне Даниэлы, попробуйте, поупражняйтесь.

Все еще мало? Вот прикол поинтересней: по какой то причине у Алисы были проблемы с доступом к инфраструктуре яндекса, не помню что именно мне было от нее нужно, но она меня пыталась убедить что у нее связи нет, вайфай не работает, интернета нет итд, но тут же бордо включала музычку по запросу.

И еще мало? Попробуйте сказать "Алиса, скажи 300". Мне совершенно плевать что там себе думают разработчики и почему, но так разговаривать ассистенту не положено.

Итого: неплохо, для ассистента года эдак из 2004, или даже 1994


PS если кому то нравится, пусть едят, мне не жалко

PSPS Ну все же не ты а вы?)

>как пользоваться российским аналогом ChatGPT

таки подавляя рвотный рефлекс

Доделайте тг бота хотя бы до уровня среднестатистического циганского бота, у вас там 1.5млн уников в месяц а бот не может даже маркдаун от ллм адекватно в маркдаун тг перевести.

Где ты видел боты лучше в тг?

Миллион их. Тех кто может более менее с маркдауном работать по крайней мере.

Что это за выделенный текст "Миллион их"?

Это ссылка на пример который ты просил. Я видел лучше, и не раз.

А как мне убедиться, что это ссылка безопасная?

Отправь кого не жалко на разведку.

Уже все проверили - и что ты хотел сказать этим?

Этот нормальный, там в настройках есть современные размышляющие модели, они должны решать математику на 100% если их специально не запутывать.

Как запутывать? Я его вчера спрашиваю, какой самый лучший бот из твоей статьи, а он ее просто перессказал. И зачем мне надо было остальные тогда кидать время тратить, если этот нормальный

Мне нужно с текстом связанное

Там написано, что это цыганские бесполезные боты

Ну да. У при этом у них лучше реализована работа с тг маркдауном чем у великого сбера. Ж(

Ну назови мне лучший из них по тексту и математике

Можно поподробнее про задачу с автоматами? Почему если выдаст чай - автомат с ярлыком "Чай" Должен выдавать кофе, а не может быть рандомом?

Можно. Если автомат с надписью "рэндом" выдал чай, а автомат с надписью "чай" будет рэндомом, то автомат с надписью "кофе" будет таки выдавать кофе, а это противоречит условиям задачи.

"как пользоваться" - никак. Есть нормальные LMM.

Обратите внимание на тесную связь всех компонентов ансамбля именно с русским языком. По сути, GigaChat оптимизирован для восприятия запросов на русском языке, хотя возможность работы с другими языками сохраняется.

Но в EN бэнчах у него больше баллов, что как бы намекает откуда ноги растут :)

Был бы он открытым - мог бы быть интересным, а вот когда он доступен только в виде весьма недешевого API и при этом сильно зажат цензурой - не очень.
(Да в приложении или тг боте можно пользоваться бесплатно - но голая БЯM это уже не особо интересно, нужно инструменты, память - причем свои, а не те что провайдер модели предусмотрел)

У кого есть доступ к картинкогенерации, проверьте, пожалуйтса, он что, всё ещё на слово "родное" всё ещё генерирует индейцев?

А если честно, то как-то странно видеть модель на 13В (которые я могу на своём макбуке гонять ордами) ставится в один ряд с тяжеловесами на 200В+ параметров. И при этом выигрывает в синтетических тестах.

Либо тренировали на чём-то непонятном, чисто чтобы тесты проходили, либо под капотом что-то уже натренированое.

В таблице, если приглядеться, всё указано: цифры очень близкие к Qwen. ^-^ - вот такие китайские giga-ушки торчат...

Sign up to leave a comment.