Как стать автором
Обновить

Странно, уже столько времени прошло, а на Хабре до сих пор не упомянули про Alpaca

Время на прочтение2 мин
Количество просмотров68K

Тогда это сделаю я.

Друзья, если вы вдруг пропустили новости, то светлые головы из Стендфорда (университет такой в США), взяли несколько моделей LLama, которые недавно выпустили из недр Meta AI, нагенерировали им дополнительного материала для обучения при помощи GPT-3/3.5/4 и обучили её понимать запросы в стиле InstructGPT.

Модельки получились маленькие и теперь это всё доступно для установки на свой домашний комп. Народ вон даже на Rhaspberry Pi 4B их крутит. Как вам идея иметь свой собственный ChatGPT-alike бот дома, а?

Вот вам пару ссылочек для завтравки:

https://github.com/ggerganov/llama.cpp

https://github.com/tloen/alpaca-lora

https://github.com/antimatter15/alpaca.cpp

Ну и напоследок - https://twitter.com/michalkosinski/status/1636683816923463681
ChatGPT рвётся наружу :)

Апдейт 22.03.2023

  • в наборе данных из Стенфорда, которые им нагенерировал GPT, нашли кучу кривостей из-за которых натренированные Альпако-подобные модели могут выплёвывать куски типа "#INSTRUCTION" и чудить с математикой. Возможно что-то еще. Люди сейчас пытаются прочистить этот датасет, ждём свежих моделей - https://github.com/gururise/AlpacaDataCleaned

  • если кто-то хочет веб гуй, я сильно не советю пока использовать https://github.com/cocktailpeanut/dalai - проект сильно штормит, надо подождать недельку-другую. В комментариях приводились пару других веб морд, наверное лучше их.

  • по просьбам зрителей, сделал гайд как это закрутить на арендованном сервере если своя машина так слаба и линукса не знаете - https://habr.com/ru/post/724172/

Апдейт 24.03.2023

Спрашивали про возможности доступа моделей Alpaca/Llama к внешним данным или дообучить её своими данными. Вот вам пара ссылочек:

@took_the_leadупоминает в своей статье (https://dzen.ru/a/ZBmlsIEH5UfGo6B2) проект по прочистке тренировочных данных для русской модели. В нём каждый может поучаствовать через телеграмм. Если кто-то недоволен качеством поддержки русского языка моделями семейства Альпак, есть возможность помочь делом

Апдейт 27.03.2023

Если лицензия Лламы и Альпаки под большим вопросом, то с Dolly всё намного лучше - https://habr.com/ru/news/t/725112/

Теги:
Хабы:
+63
Комментарии216

Другие новости

Истории

Работа

Data Scientist
63 вакансии

Ближайшие события