Как стать автором
Обновить
93
-1
Gregory @tablum

Enthusiast, Bootstrapper and Irrational Man

Отправить сообщение

Самый большой контекст, который сейчас поддерживается в некоторых моделях - 128K (это примерно 300 страниц книжного текста). Если нужны такие модели, то стоит сходить сюда https://llm.extractum.io/list/?ctx16 и посмотреть модели с большим размером контекста (>=100K). Или использовать gpt4-turbo, у которого input-контекст тоже 128K (но output контекст 4K). Или Antrophic Claude 2.1, там тоже 100K input context.

Апдейты по моделям на почту будут чуть позже.

Спасибо за комментарий и предложения.

  1. Пока не планирую, для начала появятся стандартные MMLU, ARC, TrustfulQA и аналогичные.

  2. OK, хорошие предложения. Сделаю.

  3. Здесь нужно пособирать больше обратной связи. Если действительно это так, то уберу градиент.

Да, они оперативно влили.

Можно попробовать 4bit кватизацию для модели и инференс через llama.cpp. Но, конечно, генерация будет небыстрой.

Да, это задача саммаризации: скормить большой текст в модель и попросить её изложить кратко. Подойдут любые модели, которые хорошо работают с русским языком.

Она в рейтинге (в районе 34 ранка), просто сейчас сортировка по средней оценке бенчмарков. Чуть позже прикручу в этот раздел сортировку по humaneval-python. Из codegen моделей WizardCoder-Python-34B хорошая, она не только код умеет генерить, но и по остальным бенчмаркам хороша (равно как и квантизованная).

Ага, тогда имеет смысл.

Начните отсюда https://llm.extractum.io/list/?codegen
Справа есть поле для быстрого поиска, в него можно вписать python, отфильтруются те, что для python кода.

Да, можно добавить. У вас какой-то специфический кейс? Почему 12?

Можете прислать примеры файлов на info@instad.io?

Замечание принимается, спасибо. Хотя в статье я постарался рассказать о том, как сделать загрузку, парсинг и визуализацию данных без кодирования. Ровно то, что указано в заголовке. Я не рассказываю историю создания продукта (это было в предыдущей статье), и в заголовке не обещаю сравнения продуктов, для этого бы назвал статью «Сравнение no-code сервисов для …».

Спасибо за развернутый и конструктивный комментарий, а также предложения. Мне это очень ценно. Отвечу по вашим пунктам ниже:

Есть речь о мониторинге, но нет соответствующих настроек, подсветки экстремумов на графиках или функции оповещения при выходе параметров за границы (вручную установленных, либо спрогнозированных).

Вы правы, сейчас нет алертов при выходе за граничные значения. Это будет добавлено чуть позже. Пока все это можно реализовать просто подзапросами на SQL с настройкой отправки данных в один из желаемых каналов (Telegram, Slack, Email). В данной версии это пока доступно как "low-code".

Настройка крайних значений оси.

Принял. Это достаточно легко добавить. Думаю, что смогу сделать в ближайшей версии.

Нет настройки типа аггрегации значений, по умолчанию это суммирование, что не всегда подходит. Нет настройки аггрегации по какому-либо параметру.

Для no-code агрегации есть функции в выпадающих меню столбцов таблицы. Там можно указать какую функцию применить и по какому полю выполнить группировку. В результате будет сформирован SQL запрос и новая выборка данных в отдельном вью (в отдельной таблице). Это включает в себя и GROUP BY, и популярные оконные функции, наподобие "суммы с накопительным итогом", или "скользящего среднего".

Понимаю, что это пока не очень удобно, так как данные в таблице нужно предварительно подготовить перед построением графика. Но в следующих версиях я это буду расширять. Сейчас можно использовать макросы для формирования SQL запросов для агрегации (своеобразный "Visual Query Builder").

Неочевидно назначение кнопок переключения состояния Y2, вероятно это включение вспомогательной оси.

Да, это включение второй оси Y. Подумаю, как это сделать более понятным.

Разницы при переключению между двумя из трех возможных цветовых схем не увидел. Белые лэйблы на белом фоне не читаются.

Разница будет заметна при 2 и более наборах данных, которые отображаются на графике. Например, можно выбрать несколько столбцов для отображения на оси Y, нарисуются два графика, и для них будет меняться цветовая палитра при переключении кнопками 1/2/3. Еще разницу можно посмотреть на Pie Chart'е или Donut Chart'е, там меняются цвета сегментов. Про белый на белом - не совсем понял, вроде бы цвета всегда отличные от белого (разве что где-то есть неизвестный мне баг).

Заделка на классный продукт есть, теперь нужен хороший продакт, каст-дев, проверки гипотез и поиск продакт/маркет фит.

Спасибо. Одна из целей подобных статей как раз и получить обратную связь, в рамках которой приходит более четкое понимание того, кто пользователь, что важно, что не важно, какие задачи продукт позволяет решать, и чего не хватает. Еще раз спасибо за комментарий.

Сначала будет найм, а дальше - будет видно.

Пока только через соцаккаунты. Позже добавлю email.

Понимаю. Но пока так. Чуть позже сделаю регистрацию по email.

Чтобы попробовать сервис, нужно зайти под Google или FB аккаунтом. Регистрации нет, все сразу начинает работать. Два клика.

Возможно, когда-нибудь выложу.

Со шрифтами проблема может быть из-за исходного файла. Если шрифты изначально в «кривых» (например, такое может быть в некоторых PDF или если сохранить график из Google Sheets не в PDF, а в SVG), они станут отображаться непотребно. Вероятнее всего с этим проблема. Если вам будет интересно разобраться, напишите мне, я посмотрю, в чем причина. Спасибо.

1

Информация

В рейтинге
Не участвует
Откуда
Россия
Зарегистрирован
Активность

Специализация

Fullstack Developer, Project Director
Lead
От 1 000 000 001 ₽
JavaScript
HTML
CSS
Adaptive layout
JQuery
Web development
Crossbrowser layout
SVG
Node.js