Как стать автором
Обновить

Демократизация больших языковых моделей продолжается. Встречайте Dolly

Время на прочтение1 мин
Количество просмотров13K

Не успела прошуметь предыдущая новость https://habr.com/ru/news/t/723638/ так на горизонте замаячили новые альпакоподобные, натренированные по такому же принципу.

В этот раз, ребята из databricks взяли за основу не какую-то там полу-проприетарную Llama с непонятной лицензией, а вполне себе опенсорсовую gpt-j-6B от EleutherAI. Получилась эдакая instruction-following модель в стиле ChatGPT но уже пригодная к использованию в коммерческих продуктах.

Веса в databricks пока не выложили, но это не беда. Энтузиасты уже повторили. C моделькой можно поиграться в гугл коллабе (если у вас есть план, на бесплатном не хватает RAM) https://colab.research.google.com/drive/1O1JjyGaC300BgSJoUbru6LuWAzRzEqCz?usp=sharing

Ждем, надеюсь должна скоро появится в средах типа llama.cpp / alpaca.cpp чтобы можно было поиграться и на домашнем компьютере без видеокарты.

Ссылки:

Простым языком для тех, кто ничего не понял: появляется всё больше моделей, в стиле ChatGPT, которые не просто дополняют текст, а следуют инструкциям. Некоторые из этих моделей можно покрутить на своём домашнем компьютере или арендованном сервере уже сейчас. Проблема моделей Альпака и Ллама из предыдущей новости в том, что их лицензия под большим вопросом. А тут натренировали вполне себе open source модель.

Теги:
Хабы:
Всего голосов 14: ↑13 и ↓1+15
Комментарии19

Другие новости

Истории

Работа

Data Scientist
98 вакансий

Ближайшие события

27 августа – 7 октября
Премия digital-кейсов «Проксима»
МоскваОнлайн
28 – 29 сентября
Конференция E-CODE
МоскваОнлайн
28 сентября – 5 октября
О! Хакатон
Онлайн
30 сентября – 1 октября
Конференция фронтенд-разработчиков FrontendConf 2024
МоскваОнлайн
3 – 18 октября
Kokoc Hackathon 2024
Онлайн
7 – 8 ноября
Конференция byteoilgas_conf 2024
МоскваОнлайн