tablum Dec 12 2023 at 10:45

Как быстро выбирать языковые модели (LLM) под свои задачи

Medium

6 min

19K

EXTRACTUM.IO corporate blogMachine learning*Artificial IntelligenceNatural Language Processing*

Review

✏️ Technotext 2023

+27

Comments 27

stf555 Dec 12 2023 at 11:45

Очень хорошо! А можете добавить фильтр на <12 VRAM?

tablum Dec 12 2023 at 11:47

Да, можно добавить. У вас какой-то специфический кейс? Почему 12?

stf555 Dec 12 2023 at 11:48

Имя ему 3060 :)

tablum Dec 12 2023 at 11:49

Ага, тогда имеет смысл.

novoselov Dec 12 2023 at 20:48

GPU Spec Database в помощь

Lidms Dec 12 2023 at 11:46

Проведена большая работа. Вы молодец. А как бы я мог найти llm лучшие для создания кода на питоне?

tablum Dec 12 2023 at 11:48

Начните отсюда https://llm.extractum.io/list/?codegen
Справа есть поле для быстрого поиска, в него можно вписать python, отфильтруются те, что для python кода.

Lidms Dec 12 2023 at 12:05

Самую лучшую на сегодняшний день: Phind-CodeLlama-34B-v2 так не найти.
Есть еще варианты?

tablum Dec 12 2023 at 12:21

Она в рейтинге (в районе 34 ранка), просто сейчас сортировка по средней оценке бенчмарков. Чуть позже прикручу в этот раздел сортировку по humaneval-python. Из codegen моделей WizardCoder-Python-34B хорошая, она не только код умеет генерить, но и по остальным бенчмаркам хороша (равно как и квантизованная).

Lidms Dec 12 2023 at 14:27

Ок. Просьба еще добавить фильтр на <24 VRAM. Таких карт сейчас тоже много типа Tesla P40, M40 и т.д.

tablum Dec 12 2023 at 14:35

Добавлю

SlavikF Dec 12 2023 at 18:17

Извиняюсь, если это off-topic, но подходят ли LLM модели для задачи написания summary (резюме, краткое содержание)?

То есть чтобы я мог отдать на вход длинную статью на русском языке (приблизительно 30-60 минут выступления), а получить несколько предложений с кратким содержанием? Или в какую сторону копать?

tablum Dec 12 2023 at 19:46

Да, это задача саммаризации: скормить большой текст в модель и попросить её изложить кратко. Подойдут любые модели, которые хорошо работают с русским языком.

bynull Dec 27 2023 at 05:37

У саммари моделей ведь тоже такие же ограничения как у остальных? В среднем 32к токенов вместимость. Я так понимаю, человек спрашивал о модели которая может в себя вместить большие объемы, например 10мб, такие существуют?

tablum Dec 27 2023 at 20:52

Самый большой контекст, который сейчас поддерживается в некоторых моделях - 128K (это примерно 300 страниц книжного текста). Если нужны такие модели, то стоит сходить сюда https://llm.extractum.io/list/?ctx16 и посмотреть модели с большим размером контекста (>=100K). Или использовать gpt4-turbo, у которого input-контекст тоже 128K (но output контекст 4K). Или Antrophic Claude 2.1, там тоже 100K input context.

heartdevil Dec 13 2023 at 06:21

Извините за оффтопик, а можно ли LLM поднять на ноуте, где только cpu поддерживается? Оперативки 32гига. Или все будет жутко тормозить?

tablum Dec 13 2023 at 08:34

Можно попробовать 4bit кватизацию для модели и инференс через llama.cpp. Но, конечно, генерация будет небыстрой.

314159abc Dec 14 2023 at 07:25

7B 8bit q8_0 на intel core i7 ноутбучном около 2 токена/секунду выдает.

unih Dec 13 2023 at 20:46

Спасибо! прямо то, что доктор прописал

neowisard Dec 14 2023 at 13:00

Для тех кто не заметил - Support for Mixtral was merged into Llama.cpp on December 13th.

tablum Dec 14 2023 at 18:35

Да, они оперативно влили.

slivka_83 Dec 14 2023 at 19:53

Спасибо за очень полезный инструмент. Поисковик HF действительно ужасный :)

Есть несколько предложений/вопросов:

1. Планируется ли подключить русские бенчмарки RussianSuperGLUE или MERA?

2. Таблица сейчас полностью не влазит на экран (по крайней мере для ноута, fullhd). Постоянно приходится прокручивать вниз-вверх, влево-направо - очень не удобно. Предложения:

- Зафиксировать первый столбец с названием (и убрать из него maintainer, чтобы стал поуже - для него есть отдельный столбец)

- Заменить текст в заголовках колонок на иконки - это сильно уменьшит их ширину.

- Как-нибудь сделать горизонтальную прокрутку постоянно видной (даже если не докрутили до низа таблицы)

3. Сделать цвет кнопок глобальных фильтров однотонным. Текст на градиенте трудновато читать.

tablum Dec 14 2023 at 20:21

Спасибо за комментарий и предложения.

Пока не планирую, для начала появятся стандартные MMLU, ARC, TrustfulQA и аналогичные.
OK, хорошие предложения. Сделаю.
Здесь нужно пособирать больше обратной связи. Если действительно это так, то уберу градиент.

slivka_83 Dec 16 2023 at 12:22

Подскажите, как работает подписка? Несколько дней назад подписался. Вижу на графике обновления, но на почту ничего не приходит?

tablum Dec 16 2023 at 15:16

Апдейты по моделям на почту будут чуть позже.

lorz1k Dec 31 2024 at 09:29

Учитывая специфику статьи есть не 0 вероятность что её полностью написала какая-нибудь LLM(в.т.ч фотки)

Laryx Mar 8 at 05:44

Приветствую. Очень полезный ресурс. К сожалению, нажатие любой кнопки-фильтра у меня приводит к ошибке: Error: TypeError: Cannot read properties of undefined (reading 'oSort'). Я что-то неправильно делаю?