Странный какой-то калькулятор, видимо он считает только цены использования моделей через API ? И не учитывает подписки? Я не использую через API - это будет сильно дороже. А использую подписку и подключаюсь через Oauth. OpenAI разрешили использовать подписки для подключения внешних тулов таких как OpenClaw, Codex и т.д.
Отнюдь))) Подписка ChatGPT Plus за $20 в месяц с Codex. Лимиты там большие. Повесил на одном аккаунте и VSCode и OpenClaw и в лимиты дневные и недельные не упираюсь. Сейчас уже пользуюсь моделью GPT 5.4 на ней тоже в лимиты не упираюсь. Ниже в коментах аналогичный опыт люди описывают.
Пользуюсь Кодексом, но 5.3 версии с утра до вечера по работе. Редко выбираю больше 30% лимита и к вечеру ещё процентов 70% остаётся + OpenClaw на нём же висит. Хотя если стаи агентоа пачками запускать, то можно и лимит наверное увидеть)
Для теста можно попробовать эти модели в приложении LM Studio. В нём можно скачать все те-же модели и давно добавили поддержку мульти-модальных моделей и загрузку картинок в чат.
А по поводу компьютера - тут важна не столько скорость видеокарты, сколько объем видеопамяти и чем больше тем лучше.
Согласен, статья как будто написана ChatGPT. Ничего конкретного, только базовые вещи. А проблемы как раз кроются в деталях.
Начиная с того что: Чем парсить и OCRить документы и pdf. Как разбивать на чанки и как доставать семантические связи. Нужны ли графы. Чем делать эмбеддинги, как оптимизировать их размер и где хранить для быстрого поиска. Как и чем ранжировать чанки. В каком формате отдавать их ллм. Какой длинны отдавать чтобы ллм не путалась в большом количестве информации. И какой промпт написать чтобы не галюцинировала и ответы были полезными. (Тут в промпте много мелких нюансов). И какой ответ ожидает юзер короткий и быстрый или длинный и подробный, это тоже надо в промпте для ллм прописать.
Посмотрел что написал. Получился прям промпт для ChatGPT для новой статьи.)
Тоже заметил что переключение между моделями помогает. Если одна модель зацикливается или не может за несколько шагов починить ошибку, то перекдючение на другую модель с тем же промптом помогает двигаться дальше.
Пробовал несколько открытых моделей пол года назад, но у всех у них были проблемы с распознаванием таблиц в сканах печатных документом. И самая большая проблема была с определением направления таблицы - то есть горизонтальная она или вертикальная. (Ну и да ещё с вертикальным текстом в колонках.) Как сейчас с этим обстаят дела? Какие модели сейчас лучше всего распознают документы с таблицами? Qwen3 Omni ?
Syncthing давно перестал использовать. Он бьёт файлы при синхронизации 3х устройств и теряет данные что не допустимо) Remotly Save использую через облако и проблем нет. 3 устройства а одну папку. Только надо сразу после правок на одном устройстве синхронизировать или настроить автосинхронизацию. Ещё использую Self-hosted LiveSync на свой сервер, с ним проблем нет. На сервере нужна только CouchDB. Ещё для посика использую плагин Omni Search, удобный и быстрый поиск.
Странный какой-то калькулятор, видимо он считает только цены использования моделей через API ? И не учитывает подписки?
Я не использую через API - это будет сильно дороже. А использую подписку и подключаюсь через Oauth.
OpenAI разрешили использовать подписки для подключения внешних тулов таких как OpenClaw, Codex и т.д.
Отнюдь))) Подписка ChatGPT Plus за $20 в месяц с Codex. Лимиты там большие. Повесил на одном аккаунте и VSCode и OpenClaw и в лимиты дневные и недельные не упираюсь. Сейчас уже пользуюсь моделью GPT 5.4 на ней тоже в лимиты не упираюсь. Ниже в коментах аналогичный опыт люди описывают.
Пользуюсь Кодексом, но 5.3 версии с утра до вечера по работе. Редко выбираю больше 30% лимита и к вечеру ещё процентов 70% остаётся + OpenClaw на нём же висит. Хотя если стаи агентоа пачками запускать, то можно и лимит наверное увидеть)
Где?
Через Codex с подпиской в $20 нормально работает и за димиты не выходит.
Сравните, пожалуйста, ещё Codex от OpenAI и Gemini 3 Pro от Google.
Возможно тут надо создать MCP тулы, которые будут вызывать простые действия для разбора и уже их сможет вызывать ллм и получать от них информацию?
Codex там есть по API ?
Не удивительно, там уже больше 600 000 аккаунтов в списке подключившихся.
Почему не выбрать лучшее из обоих миров и нанять двух?
Для теста можно попробовать эти модели в приложении LM Studio. В нём можно скачать все те-же модели и давно добавили поддержку мульти-модальных моделей и загрузку картинок в чат.
А по поводу компьютера - тут важна не столько скорость видеокарты, сколько объем видеопамяти и чем больше тем лучше.
Ещё пару дней назад появилась
HunyuanOCR - обещают топ по бенчмаркам и размер меньше.
Согласен, статья как будто написана ChatGPT. Ничего конкретного, только базовые вещи. А проблемы как раз кроются в деталях.
Начиная с того что: Чем парсить и OCRить документы и pdf. Как разбивать на чанки и как доставать семантические связи. Нужны ли графы. Чем делать эмбеддинги, как оптимизировать их размер и где хранить для быстрого поиска. Как и чем ранжировать чанки. В каком формате отдавать их ллм. Какой длинны отдавать чтобы ллм не путалась в большом количестве информации. И какой промпт написать чтобы не галюцинировала и ответы были полезными. (Тут в промпте много мелких нюансов). И какой ответ ожидает юзер короткий и быстрый или длинный и подробный, это тоже надо в промпте для ллм прописать.
Посмотрел что написал. Получился прям промпт для ChatGPT для новой статьи.)
Тоже заметил что переключение между моделями помогает. Если одна модель зацикливается или не может за несколько шагов починить ошибку, то перекдючение на другую модель с тем же промптом помогает двигаться дальше.
Пробовал несколько открытых моделей пол года назад, но у всех у них были проблемы с распознаванием таблиц в сканах печатных документом. И самая большая проблема была с определением направления таблицы - то есть горизонтальная она или вертикальная. (Ну и да ещё с вертикальным текстом в колонках.) Как сейчас с этим обстаят дела? Какие модели сейчас лучше всего распознают документы с таблицами? Qwen3 Omni ?
Syncthing давно перестал использовать. Он бьёт файлы при синхронизации 3х устройств и теряет данные что не допустимо) Remotly Save использую через облако и проблем нет. 3 устройства а одну папку. Только надо сразу после правок на одном устройстве синхронизировать или настроить автосинхронизацию. Ещё использую Self-hosted LiveSync на свой сервер, с ним проблем нет. На сервере нужна только CouchDB. Ещё для посика использую плагин Omni Search, удобный и быстрый поиск.
Или на SWE-Rebench. Если они добавили задач из SWE, то на Rebench будет видно.
На реддите читал отзывы, говорят эта поделка сделана на Qwen3 1.5B и просто дообучена на бенчмарках чтобы красивые цифры в них показывать.
Спасибо ChatGPT )
ColbertV2 как раз не большого размера, но принцип работы у неё немного другой.