janvarev Oct 18 2023 at 14:19

Сайга-Мистраль — третья русская нейросеть после YaGPT и GigaChat, публично доступная по API

5 min

24K

Self Promo

+18

Comments 23

zartdinov Oct 18 2023 at 15:43

Интересно, действительно ли надо реализовывать свой API, может как-то с помощью LiteLLM или Oobabooga можно, пока не очень понимаю.

janvarev Oct 18 2023 at 16:04

Можно, но там проблемы с токенизацией. У Ильи сделаны спецсимволы на end message.

Впрочем, можно и обычным способом запустить, да - просто качество будет похуже без точного следованию паттерну, на котором тренировалась модель. Я видел, так запускают, результаты тоже есть.

zartdinov Oct 18 2023 at 16:36

Похоже у людей с Oobabooga такая же проблема:
https://github.com/oobabooga/text-generation-webui/issues/4111

janvarev Oct 18 2023 at 16:41

Мистраль, я думаю, допилят - уж очень популярна.

А вот у Сайги - опять же, по описанию что я видел у Ильи - вообще кастомные токены < /s >, так что вроде там их только ручками пока расставлять.

alex50555 Oct 19 2023 at 17:14

У MistralOrca такие токены видел. И она вроде немного лучше дефолтной Mistral, по крайней мере, участвовал в LLM examle на Kaggle, там она давала немного лучший скор.

wesker_96 Oct 18 2023 at 16:04

Круто, сервисом пользуюсь, спасибо! Какая GPU используется (и сколько)? Сервер на личных мощностях развернут или арендованные?

janvarev Oct 18 2023 at 16:07

Спасибо :) GPU арендованная серверная, A10. Пробовал гонять на старой Nvidia T4 - получилось почему-то оооочень медленно.

Вообще история с GPU - это так скажем, показать модель. Я не думаю, что я отобью её аренду при таких ценах на генерацию, это скорее про фан :)

wesker_96 Oct 18 2023 at 17:36

Да, это вам спасибо, можно сказать, что на практике с нейронками я познакомился с вашего проекта "Ирина":) Да, цены на сервера с GPU, скажем так, не радуют... Одно время сам присматривался, арендовать на поиграться, но по итогу отказался, для меня слишком дорогое удовольствие.

С такими ценами на генерацию, я полагаю, через модель нужно пропустить порядка 1М символов для достижения окупаемости.) Штош, кто знает, кто знает...

janvarev Oct 18 2023 at 17:49

Там 0.04 руб за 1000 символов - т.е. 40 р за 1М - это где-то 1.5 часа аренды сервера ))) так что по-моему, без шансов ) Вот если бы 1000М знаков, то да, но я что-то слабо себе представляю желающих столько генерировать.

С другой стороны, куча сетей вообще раздают генерации бесплатно ради набора пользователей, и приходится соответствовать. Правда, у OpenAI и Antropic инвестора...

wesker_96 Oct 18 2023 at 18:10

Упс, называется. В расчетах потерял три нуля, хех.))

iamoblomov Oct 19 2023 at 07:07

А сколько памяти надо? В 11 гигабайт реально уместить?

janvarev Oct 19 2023 at 10:29

Вроде да. GGUF 4 бит квантование точно, 8 бит вроде тоже да - но там впритык.

QtRoS Oct 18 2023 at 18:53

Есть ли GGML/GGUF версия этой модельки?

janvarev Oct 18 2023 at 19:05

Есть - https://huggingface.co/IlyaGusev/saiga_mistral_7b_gguf - только вроде классический запуск не учитывает специфичные токены модели, и поэтому качество может проседать.

UFO just landed and posted this here

Filipp42 Oct 19 2023 at 01:18

Скажите, есть ли у вас соображения, почему такая маленькая модель показала такие успехи? Можно ли масштабировать? Ходят слухи, что Open Assistant 70B должен будет обогнать ChatGPT. Это возможно?

janvarev Oct 19 2023 at 10:22

Сложно сказать, но пример Мистраль воодушевляющий.
Насчет обгона ChatGPT - думаю, в ближайшем будущем это будет сделано, так или иначе. Вот даже картинка из статьи Ильи: https://habr.com/ru/articles/759386/

Где показано, что Сайга2_70b уже выигрывает в оценках пользователей по сравнению с ChatGPT (turbo). Так что результат, в общем-то, не за горами.

UFO just landed and posted this here

janvarev Oct 19 2023 at 10:20

В целом, согласен - хотя более подробного сравнения с другими Мистраль-сетками не проводил. Но кроме Сайги у нас других сеток такого типа вроде нет )

Andrey_Epifantsev Nov 7 2023 at 14:27

А можно в следующий раз в ваших статьях указывать другие хабы кроме "Я пиарюсь"? А то я на этот хаб не подписан и пропустил эту статью. Но зато подписан на Искусственный интеллект. И вроде как эта статья как раз проходит по теме этого хаба.

janvarev Nov 7 2023 at 14:44

Я бы с удовольствием, и статья там и была, но согласно правилам Хабра была перенесена в "Я пиарюсь", потому что ~~видите ли~~ тут упоминается коммерческий сервис.

vova_sam Dec 29 2023 at 00:44

интересно, а можно дообучить эту модель под свои данные через QLoRa?

она вроде уже обучена через LoRa, а тут получается обучить модель с LoRa через QLoRa - непонятен результат

vova_sam Jan 5 at 12:23

LLM от Ильи считает его одним из самых известных ученых :-)