mr-pickles 24 июл 2023 в 12:30

Качественный набор данных от Microsoft для обучения компактных, но мощных языковых моделей, генерирующих код

Средний

4 мин

2.9K

Блог компании Wunder FundПрограммирование*Алгоритмы*Искусственный интеллект

Перевод

+13

Комментарии 4

ar1ur 24 июл 2023 в 22:03

Строго говоря, phi-1 не превосходит "то, на что способны самые совершенные большие языковые модели" - в одном тесте (HumanEval - Pass@1) результат хуже, чем у GPT-4 (51% vs 67%), а по другому тесту (MBPP - Pass@1) результаты GPT-4 отсутствуют.

anzay911 25 июл 2023 в 05:23

Смысл в том, что компактные модели ненамного хуже суперпуперских в хороших руках.

olegkusov 25 июл 2023 в 23:06

зачем передергивать. результат все равно офигеть какой. она превосходит 3.5 у которого 175 млрд

berng 27 июл 2023 в 11:34

Только я заметил, что промпт для создания программы значительно длиннее ее кода?

Зарегистрируйтесь на Хабре, чтобы оставить комментарий