Pull to refresh
154
0
Роман Иванов @kukutz

User

Send message

Конечно. На странице модели описано, как запустить через HF Transformers https://huggingface.co/yandex/YandexGPT-5-Lite-8B-instruct

Мы выбрали архитектуру и размерности слоев в соотстветствии с внутренними замерами. Действительно, она довольно похожа на архитектуру Llama, как и многие другие трансформерные модели — если конкретная архитектура показывает SOTA качество, странно ее не использовать.

Кроме того, мы считаем, исходя из текста лицензии, что лицензия Llama распространяется на веса Llama и код, а не на архитектуру, то есть то, какой размерности матрицы и сколько слоев.

Именно YandexGPT 5 Lite и выложен в опенсорс, его размер 8B.

Претрейн поверх претрейна не называется файнтьюн.

Привет, pretrain отличается от instruct версии ровно тем, что не умеет отвечать на вопросы и вести диалог, он умеет, грубо говоря, продолжать начатый текст.

Как он будет отвечать на вопросы и вести диалог, зависит от alignment, ровно того, что отличает instruct версию от pretrain.

Ну вот так, сначала варили одну, потом другую, за это время появились новые идеи и эксперименты, которые нужно проверить, прежде чем финализировать версию.

Как минимум потому что instruct пока не готов, идут эксперименты с ним.

Вы поняли неправильно, рекомендую перечитать статью.

В статье речь про две разных модели, которые сварены разным образом и выложены сегодня в разных видах — опенсорс/по API/через веб.

Желаю вам хорошего дня и отличного настроения!

Строчки "нельзя модифицировать в любых целях" в лицензии нет.

Ограничение на использование в коммерческих целях, либо ограничение на использование для создания сервисов с аудиторией больше Х, либо ограничение на использование в незаконных/неэтичных целях есть в очень большом числе лицензий открытых моделей, и Gemma, и Llama, и у части Mistral моделей, и у Cohere, и у части Qwen моделей и так далее.

Привет, pretrain отличается от instruct версии ровно тем, что не умеет отвечать на вопросы, он умеет, грубо говоря, продолжать начатый текст. Как он будет отвечать на вопросы, зависит от alignment, ровно того, что отличает instruct версию от pretrain.

Почему вы решили, что нельзя модифицировать?

a. В соответствии с условиями Соглашения Яндекс предоставляет Вам неисключительную, всемирную, непередаваемую, не подлежащую сублицензированию, отзывную и безвозмездную лицензию в отношении права использования Материалов способами воспроизведения, распространения, переработки и создания Производных произведений в Исследовательских или Некоммерческих целях.

Но Алиса Про как раз имеет доступ в интернет — выберите в меню слева вверху не "голую" модель, а Алису, и получите ответы об актуальных событиях.

Простите, но Алиса это не YandexGPT 3, это продукт на его базе, с кучей изменений, дополнительных сценариев, поиском в интернете и т.п.

Если хотите тестировать YandexGPT 3, надо тестировать YandexGPT 3, вот тут: https://console.yandex.cloud/link/yandexgpt/chat

Кстати, для перевода веб-страниц я всё же рекомендую использовать переводчик в браузере, а не перевод экрана.

Во-первых, переводится вся страница.

Во-вторых, по крайней мере Яндекс Переводчик при переводе страниц понимает, где навигация, где заголовок, где тело страницы, и использует этот (и другой) контекст для улучшения перевода.

Главное, пользоваться переводчиком не в Safari, потому что переводчик от Apple пока, к сожалению, недотягивает: например, не переводит с армянского, грузинского, иврита и балтийских языков.

Возможно, Вы не в России?

Нейро доступен в Яндекс Браузере и приложении Яндекс с Алисой из любого региона мира, если в настройках мобильного приложения установлен регион Россия. Если не работает, попробуйте вручную установить регион (страну поиска) в настройках.

На скриншоте не просто список ссылок, правда?

Подняли лимит в несколько раз, пользуйтесь.

1
23 ...

Information

Rating
Does not participate
Location
Москва и Московская обл., Россия
Works in
Registered
Activity