Специалисты из Центра искусственного интеллекта Т-банка открыли доступ к новой языковой модели в весовой категории 7-8 миллиардов параметров. Согласно внутренним и индустриальным бенчмаркам, модель обходит все существующие в своем классе аналоги. 

Сравнение бенчмарков

Модель T-lite была представлена в рамках первой конференции Т-Банка по машинному обучению Turbo ML Conf. T-lite — это инструмент разработки, с помощью которого компании смогут создавать LLM-приложения для собственного использования без передачи данных третьим лицам. В частности, это могут быть ассистенты поддержки для обработки запросов, ответов на вопросы и т.д. Пример работы LLM для голосового заказа.

Сравнение на офлайн бенчмарках

На тестах данная модель уже обогнала по показателям зарубежные llama3-8b-instruct и chat-gpt 3.5. При этом T-lite создана с использованием всего 3% вычислительных ресурсов, которые обычно требуются для такого типа моделей.

Сравнение на продуктовых бенчмарках

Сравнение на продуктовых бенчмарках T-lite является частью Gen-T — семейства языковых моделей, разработанных «Т-Банком». Они специализированы под задачи бизнеса. Ссылка на модель на HuggingFace.

Тут T-lite тоже в топе

Следите за крутыми AI новинками в моем телеграм канале - Data Feeling.