Comments 4
Строго говоря, phi-1 не превосходит "то, на что способны самые совершенные большие языковые модели" - в одном тесте (HumanEval - Pass@1) результат хуже, чем у GPT-4 (51% vs 67%), а по другому тесту (MBPP - Pass@1) результаты GPT-4 отсутствуют.
Только я заметил, что промпт для создания программы значительно длиннее ее кода?
Sign up to leave a comment.
Качественный набор данных от Microsoft для обучения компактных, но мощных языковых моделей, генерирующих код