Pull to refresh

Comments 4

Строго говоря, phi-1 не превосходит "то, на что способны самые совершенные большие языковые модели" - в одном тесте (HumanEval - Pass@1) результат хуже, чем у GPT-4 (51% vs 67%), а по другому тесту (MBPP - Pass@1) результаты GPT-4 отсутствуют.

Смысл в том, что компактные модели ненамного хуже суперпуперских в хороших руках.

зачем передергивать. результат все равно офигеть какой. она превосходит 3.5 у которого 175 млрд

Sign up to leave a comment.