Как стать автором
Обновить

Качественный набор данных от Microsoft для обучения компактных, но мощных языковых моделей, генерирующих код

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров2.9K
Всего голосов 13: ↑13 и ↓0+13
Комментарии4

Комментарии 4

Строго говоря, phi-1 не превосходит "то, на что способны самые совершенные большие языковые модели" - в одном тесте (HumanEval - Pass@1) результат хуже, чем у GPT-4 (51% vs 67%), а по другому тесту (MBPP - Pass@1) результаты GPT-4 отсутствуют.

Смысл в том, что компактные модели ненамного хуже суперпуперских в хороших руках.

зачем передергивать. результат все равно офигеть какой. она превосходит 3.5 у которого 175 млрд

Зарегистрируйтесь на Хабре, чтобы оставить комментарий