LizzieSimpson 13 мар в 12:32

«Сбер» представил нейросетевую модель GigaChat 2.0

2 мин

5.1K

Искусственный интеллектМашинное обучение *

Комментарии 22

ainu 13 мар в 12:39

GigaChat 2 MAX занимает первое место среди AI-моделей

Но отстаёт от deepseek V3. Про R1 неизвестно. Про Соннет неизвестно.

denis-19 13 мар в 12:42

Тут подробнее есть информация.

askv 13 мар в 12:47

Меня этот Gigachat тупо забанил за неудобные вопросы, на которые он не захотел публично отвечать.

Moog_Prodigy 13 мар в 12:52

О, похоже Сбер приобрел новую видеокарту.

6yHTapb78RUS 13 мар в 14:06

Или видеокарта приобрела Сбер, если понимаете о чем я.

Nurked 13 мар в 13:23

Кстати, таки вопрос, а на чём они тренируются? Я так понимаю, они сливают откуда-то open-weights и доучивают её на своих картах? Тогда откуда карты? Или они просто умно пишут промпты. Наверное-таки карты, потому что всё-таки нелпохо натренировали.

У кого-нибудь есть ссылки на хороший обзор того, откуда ноги растут у русскоговорящих убивцев чатаГПТ?

6yHTapb78RUS 13 мар в 14:12

Были же тут на Хабре статьи, где сберовский гигабаян признавался, что он chatgpt3 (на тот момент).

mithdradates 13 мар в 14:37

Это обычные галлюцинации модели, частично лечатся тюном на подобных вопросах и системным промптом, но периодически может рандом проскользнуть. Не стоит их воспринимать всерьез. Недавно видел топик на реддите про то как Клод 3.7 утверждал что его создали OpenAI.

6yHTapb78RUS 13 мар в 17:02

Прекрасно лечится не вставлять в промт то, что не нужно вставлять. Понятно. Ну вы вроде взрослый человек.

mithdradates 13 мар в 19:25

Вообще не понял что вы пытались сказать. Модель сама по себе (без тюна) понятия не имеет кто она - GPT4o, Claude 3.7 или тот же GigaChat. Она выдаст наиболее вероятную последовательность токенов на основе своего претрейна - а это, в большинстве случаев, будет что-то связанное с ChatGPT, поскольку он наиболее популярный и чаще всех встречается в наскрэйпленных с интернета данных.

freeExec 13 мар в 14:25

Они же начинали еще до всяких проблем с картами. Думаю несколько тысяч карт то у них есть.

mithdradates 13 мар в 14:33

Вроде у GigaChat'а кастомная архитектура, т.е. они не дотюнивают open weight решения. Яндекс тоже этим раньше занимался (до YandexGPT 5), но у них совсем плохо получалось, в итоге сейчас используют Qwen 2.5 в качестве базы.

У Сбера карточки есть, не гигантские кластеры из десятков тысяч H100, конечно, но есть. Вроде после апгрейда у Кристофари где-то несколько тысяч A100.

Nurked 14 мар в 10:30

Спасибо. Хотел это узнать.

Moog_Prodigy 18 мар в 15:42

Судим по результатам. Карточки может и есть, только в аренду сдаются, по результатам там отдувается один комп в подсобке с безумно разогнанной 4090 и сверху большая нашлепка в виде цензуры.

mithdradates 19 мар в 17:20

Вы сильно недооцениваете кол-во ресурсов необходимое для тренировки с нуля (т.е. включая претрейн) даже 32/70 млрд моделей. Более чем уверен, что все эти гпушки активно юзаются, плюс подозревают что у них там и h100 есть, ввезенные окольными путями.

Hardcoin 13 мар в 22:50

Странный вопрос, откуда карты. Купили, конечно.

Вам интересно, как конкретно они обошли санкции? Подобную схему вам никто не расскажет, а примерная и так всем известна. Через третьи страны, например через Гонконг.

MrCina32 13 мар в 14:25

UI мое почтение. Зумеры ливнут сразу. Мне потребовалось 40 секунд войти в режим чата.

Antania 13 мар в 17:57

Неограниченно зацензуренная из-за чекистов модель..невозможно ничего обсуждать..почти на любой вопрос отказывается отвечать чуть копнешь в сексологи,психологию,историю и тд

vasiliy_moscow 19 мар в 04:38

Да, обсуждение не задалось… То есть получается, что любимое развлечение - добейся от модели галлюцинации или ответа экстремистского характера, чтобы публично похихикать и потыкать этим в разработчика, больше не доступно?! Досадно. Одно утешает, кожаные мешки остаются востребованными для общения, обсуждения и галлюцинаций!

feat_branch 14 мар в 06:28

У меня одного оно через десяток строк кода в ответе на любой промпт и при использовании любой модели останавливается с ошибкой "Что-то пошло не так. Проверьте интернет-соединение"?

mihmig 14 мар в 11:12

Вот где API-токен получали - туда и идите!

vasiliy_moscow 19 мар в 04:49

Уже выросло, наверное, поколение, которое не понимает в чем шутка, но все равно все еще смешно! )

Зарегистрируйтесь на Хабре, чтобы оставить комментарий