Комментарии / Профиль tablum / Хабр

Enthusiast, Bootstrapper and Irrational Man

Подписчики

ПрофильСтатьи11ПостыНовостиКомментарии35

Как быстро выбирать языковые модели (LLM) под свои задачи

tablum 27 дек 2023 в 20:52

Самый большой контекст, который сейчас поддерживается в некоторых моделях - 128K (это примерно 300 страниц книжного текста). Если нужны такие модели, то стоит сходить сюда https://llm.extractum.io/list/?ctx16 и посмотреть модели с большим размером контекста (>=100K). Или использовать gpt4-turbo, у которого input-контекст тоже 128K (но output контекст 4K). Или Antrophic Claude 2.1, там тоже 100K input context.

Как быстро выбирать языковые модели (LLM) под свои задачи

tablum 16 дек 2023 в 15:16

Апдейты по моделям на почту будут чуть позже.

Как быстро выбирать языковые модели (LLM) под свои задачи

tablum 14 дек 2023 в 20:21

Спасибо за комментарий и предложения.

Пока не планирую, для начала появятся стандартные MMLU, ARC, TrustfulQA и аналогичные.
OK, хорошие предложения. Сделаю.
Здесь нужно пособирать больше обратной связи. Если действительно это так, то уберу градиент.

Как быстро выбирать языковые модели (LLM) под свои задачи

tablum 14 дек 2023 в 18:35

Да, они оперативно влили.

Как быстро выбирать языковые модели (LLM) под свои задачи

tablum 13 дек 2023 в 08:34

Можно попробовать 4bit кватизацию для модели и инференс через llama.cpp. Но, конечно, генерация будет небыстрой.

Как быстро выбирать языковые модели (LLM) под свои задачи

tablum 12 дек 2023 в 19:46

Да, это задача саммаризации: скормить большой текст в модель и попросить её изложить кратко. Подойдут любые модели, которые хорошо работают с русским языком.

Как быстро выбирать языковые модели (LLM) под свои задачи

tablum 12 дек 2023 в 14:35

Добавлю

Как быстро выбирать языковые модели (LLM) под свои задачи

tablum 12 дек 2023 в 12:21

Она в рейтинге (в районе 34 ранка), просто сейчас сортировка по средней оценке бенчмарков. Чуть позже прикручу в этот раздел сортировку по humaneval-python. Из codegen моделей WizardCoder-Python-34B хорошая, она не только код умеет генерить, но и по остальным бенчмаркам хороша (равно как и квантизованная).

Как быстро выбирать языковые модели (LLM) под свои задачи

tablum 12 дек 2023 в 11:49

Ага, тогда имеет смысл.

Как быстро выбирать языковые модели (LLM) под свои задачи

tablum 12 дек 2023 в 11:48

Начните отсюда https://llm.extractum.io/list/?codegen
Справа есть поле для быстрого поиска, в него можно вписать python, отфильтруются те, что для python кода.

Как быстро выбирать языковые модели (LLM) под свои задачи

tablum 12 дек 2023 в 11:47

Да, можно добавить. У вас какой-то специфический кейс? Почему 12?

Как я «напрограммировал» себе скилл рисования диаграмм в скетч-стиле

tablum 18 янв 2022 в 15:02

Можете прислать примеры файлов на info@instad.io?

Загрузка, парсинг и визуализация данных без программирования

tablum 10 дек 2021 в 14:41

Замечание принимается, спасибо. Хотя в статье я постарался рассказать о том, как сделать загрузку, парсинг и визуализацию данных без кодирования. Ровно то, что указано в заголовке. Я не рассказываю историю создания продукта (это было в предыдущей статье), и в заголовке не обещаю сравнения продуктов, для этого бы назвал статью «Сравнение no-code сервисов для …».

Загрузка, парсинг и визуализация данных без программирования

tablum 10 дек 2021 в 12:53

Спасибо за развернутый и конструктивный комментарий, а также предложения. Мне это очень ценно. Отвечу по вашим пунктам ниже:

Есть речь о мониторинге, но нет соответствующих настроек, подсветки экстремумов на графиках или функции оповещения при выходе параметров за границы (вручную установленных, либо спрогнозированных).

Вы правы, сейчас нет алертов при выходе за граничные значения. Это будет добавлено чуть позже. Пока все это можно реализовать просто подзапросами на SQL с настройкой отправки данных в один из желаемых каналов (Telegram, Slack, Email). В данной версии это пока доступно как "low-code".

Настройка крайних значений оси.

Принял. Это достаточно легко добавить. Думаю, что смогу сделать в ближайшей версии.

Нет настройки типа аггрегации значений, по умолчанию это суммирование, что не всегда подходит. Нет настройки аггрегации по какому-либо параметру.

Для no-code агрегации есть функции в выпадающих меню столбцов таблицы. Там можно указать какую функцию применить и по какому полю выполнить группировку. В результате будет сформирован SQL запрос и новая выборка данных в отдельном вью (в отдельной таблице). Это включает в себя и GROUP BY, и популярные оконные функции, наподобие "суммы с накопительным итогом", или "скользящего среднего".

Понимаю, что это пока не очень удобно, так как данные в таблице нужно предварительно подготовить перед построением графика. Но в следующих версиях я это буду расширять. Сейчас можно использовать макросы для формирования SQL запросов для агрегации (своеобразный "Visual Query Builder").

Неочевидно назначение кнопок переключения состояния Y2, вероятно это включение вспомогательной оси.

Да, это включение второй оси Y. Подумаю, как это сделать более понятным.

Разницы при переключению между двумя из трех возможных цветовых схем не увидел. Белые лэйблы на белом фоне не читаются.

Разница будет заметна при 2 и более наборах данных, которые отображаются на графике. Например, можно выбрать несколько столбцов для отображения на оси Y, нарисуются два графика, и для них будет меняться цветовая палитра при переключении кнопками 1/2/3. Еще разницу можно посмотреть на Pie Chart'е или Donut Chart'е, там меняются цвета сегментов. Про белый на белом - не совсем понял, вроде бы цвета всегда отличные от белого (разве что где-то есть неизвестный мне баг).

Заделка на классный продукт есть, теперь нужен хороший продакт, каст-дев, проверки гипотез и поиск продакт/маркет фит.

Спасибо. Одна из целей подобных статей как раз и получить обратную связь, в рамках которой приходит более четкое понимание того, кто пользователь, что важно, что не важно, какие задачи продукт позволяет решать, и чего не хватает. Еще раз спасибо за комментарий.

«BI or not to BI»: небольшая история разработки небольшого BI-сервиса

tablum 28 ноя 2021 в 17:48

Сначала будет найм, а дальше - будет видно.

Как я «напрограммировал» себе скилл рисования диаграмм в скетч-стиле

tablum 18 ноя 2021 в 08:44

Пока только через соцаккаунты. Позже добавлю email.

Как я «напрограммировал» себе скилл рисования диаграмм в скетч-стиле

tablum 16 ноя 2021 в 11:44

Понимаю. Но пока так. Чуть позже сделаю регистрацию по email.

Как я «напрограммировал» себе скилл рисования диаграмм в скетч-стиле

tablum 16 ноя 2021 в 11:11

Чтобы попробовать сервис, нужно зайти под Google или FB аккаунтом. Регистрации нет, все сразу начинает работать. Два клика.

Как я «напрограммировал» себе скилл рисования диаграмм в скетч-стиле

tablum 14 ноя 2021 в 06:52

Возможно, когда-нибудь выложу.

Как я «напрограммировал» себе скилл рисования диаграмм в скетч-стиле

tablum 13 ноя 2021 в 08:01

Со шрифтами проблема может быть из-за исходного файла. Если шрифты изначально в «кривых» (например, такое может быть в некоторых PDF или если сохранить график из Google Sheets не в PDF, а в SVG), они станут отображаться непотребно. Вероятнее всего с этим проблема. Если вам будет интересно разобраться, напишите мне, я посмотрю, в чем причина. Спасибо.

Информация

Специализация