Search
Write a publication
Pull to refresh
4
0
Дарина @darinka666

User

Send message

Обзор Llemma: новая математическая open-source модель

Level of difficultyMedium
Reading time6 min
Views12K

Привет! Меня зовут Дарина, и я занимаюсь фундаментальными исследованиями в MTS AI. Основной фокус нашей работы сейчас — обучение больших языковых моделей, их тестирование и оптимизация.

Сегодня хочу сделать обзор на недавно вышедшую статью LLEMMA: an open language model for mathematics. Расскажу про обучение модели, новый датасет Proof-Pile-2 и в конце сравню ее с ChatGPT и GPT-4 на ЕГЭ заданиях по профильной математике.

Читать далее

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Registered
Activity

Specialization

Data Analyst, Data Scientist
Junior
Git
Python
Linux
SQL