Indermove17 июн в 08:01

Работает ли Caveman? Тестируем модный скилл для экономии токенов

Простой

4 мин

9.4K

Искусственный интеллектOpen source * Программирование * GitHub *

Аналитика

+12

Комментарии 9

Scank 17 июн в 08:32

Спасибо за тесты.
Ждем тест rtk ;)

Genius_Russian_Coders 18 июн в 05:11

Тоже тестировал caveman — на генерации кода разницы почти нет, а на архитектурных задачах модель теряет нюансы. Сжатие промпта неизбежно lossy, вопрос в том что именно вы теряете.

nidalee 17 июн в 10:09

То есть, — не какая-то магия, а понятное и предсказуемое сокращение количества спецсимволов в читаемых нейронками данных. К примеру, библиотека rtk.

RTK постоянно вынуждает модель либо перезапускать его с грепами, либо вообще выполнять команды без него, потому что модель ожидает на понятный ввод понятный вывод, а получает кастрированный однострочник и думает, что что-то не так. Особенно claude от этого очень страдает, может один и тот же тул по 3-5 раз перезапускать.

Indermove 17 июн в 10:29

Спасибо!

Блин, вот тут тоже надо видимо тестировать все же. С этими зазвездёнными репами видимо со всеми такая проблема. Короче, потестирую тоже эту штуку пристально. Хотя вот вроде смотришь описание и такой: Ну вроде же логично, что если ты чутка вербозность подсократишь и вывода инструмента, то все должно стать лучше.

nidalee 17 июн в 11:05

С этими зазвездёнными репами видимо со всеми такая проблема.

Да. Я думаю, их фармят ради бесплатной подписки по программе осс.

nidalee 17 июн в 11:59

За примером далеко идти не пришлось:

● Now typecheck and run the affected tests before rebuilding:
● Bash(npm run lint 2>&1 | tail -8; echo “=== TESTS ===”; npx tsx --test server/test/static-routing.test.ts server/test/cloudflare-purge.test.ts server/test/missions-f…) ⎿ ESLint output (JSON parse failed: EOF while parsing a value at line 1 column 0)
● Tests pass (55/55). The lint output looks like RTK mis-parsing tsc output as ESLint JSON. Let me run the typecheck directly to confirm it’s clean.
● Bash(npx tsc -p tsconfig.json --noEmit; echo “tsc exit: $?”) ⎿ TypeScript: No errors found tsc exit: 0 ⎿ Allowed by auto mode classifier
● Typecheck clean, all tests pass.

Indermove 17 июн в 12:05

Ну это жёстко. Я если честно, не думал, что эта штука как-то так бездумно это все режет( Потестирую на дотнете тоже.

nidalee 17 июн в 12:06

Проблема не в бездумности. Она действительно из тех же npm test выкидывает 99% мусора. Остается пара строчек по делу, если на них глазами смотреть. Проблема в том, что модель ожидает увидеть мусор, и когда не видит - думает, что это ошибка.

endeveit 19 июн в 17:53

Попробуйте headroom-proxy

Зарегистрируйтесь на Хабре, чтобы оставить комментарий