Размер контекста для агентов, как мне кажется, не всегда имеет большое значение. Человек держит в голове абстракции не больше чем с семи экранов кода и некоторое количество метаинформации. И этого оказывается достаточно. Конечно, нельзя тут напрямую сравнивать, но это только для иллюстрации мысли: больше важно что будет подано в контекст, а не сколько.
До какого-то момента LLM писали код лучше при увеличении контекста. Но этот момент давно пройден: и Cursor, и Codex, и Claude делают кучу точечных cat&ripgrep и отправляют довольно маленькие контексты, зато обычно довольно удачные. Посмотрел по истории - процентов 80 сессий целиком не превышают 1.5 млн токенов, а ведь 1 млн токенов это уже контекстное окно многих LLM.
Все материалы о моих экспериментах — на сайте, новости — в канале MAX. К каналу в Telegram вернусь, если он заработает.
При всём уважении к Вашим обзорам Suno, честно говоря, только эту ремарку считаю сильнейшим очернением всего, что Вы делаете.
На suno.ai Вы как заходите? Без средств обхода он не открывается. Вероятно, Вы их имеете, значит проблем с постингом в ТГ не будет при их использовании. СкаМа у большой части здешних пользователей нет и не будет. Я читал Ваш канал в ТГ, больше не буду, Вы его не обновляете.
В последнем посте в канале Вы пишете, что Телеграм не работает. Научитесь добавлять прокси и обновите до последних версий, пока почти у всех работает. В конце концов, воможно сделать кросс-постинг tg-ботом с зарубежного VDS.
Разработчики пытаются решать это костылём: запихивают в контекст последние N сообщений. Но это не память. Это дорогое, конечное и очень прожорливое контекстное окно.
Заметки автоматически подгружаются в начало каждого запроса, работают в любой сессии и переживают перезапуски бота.
Только ленивый не придумал память для LLM, не надо выдавать это за ноу-хау. Чем второе принципиально от первого отличается?
И, кстати, тянуть все заметки тоже избыточно: например, есть подход использовать быструю дешёвую сетку в 3-10B для преданализа запроса (чтобы понять, что запросить из памяти и дёрнуть соответствующий tool), а дальше в дорогой opus / 5.4 гнать запрос с добавленным выборочно контекстом.
А почему Вы общение с человеком, который заинтересован в публичном обсуждении, решаете засунуть в л/с? Здесь это "не формат". Не можете публично ответить на вопрос - отпишитесь, что ограничены NDA и т.п. Вы же почему-то решили оставить повисшим вопрос к статье и отписаться в л/с, а в публику решили только претензии отписать.
А что, Сибирь теперь не Россия? Нет, системных проблем реально много, начиная от самого верха до низа, но совершенно не очевидно что проблема именно в выкачивании недр. Свои недра качают все, просто кто-то при этом способен более разумно распоряжаться самой нефтью, нефтедоходами и страной, а кто-то предпочёл довести количество миллиардеров до одного из самых высоких в мире, а накопленную с нефти кубышку конвертировать в кровь, металл и уничтожение людей.
Послали так послали. Зачем и с чем обращаться в ООО? И как эта контора, которая заявляет как основную деятельность производство реагентов для нефтяной и газовой промышленности, относится к вопросу про нефтеразливы?
Первый из этой троицы так никогда и не получил большинства. Он был назначен канцлером при посредстве Гинденбурга. И после этого также не получил большинства до тех пор, пока не устроил поджог рейхстага и под этим предлогом не получил чрезвычайных полномочий и впоследствии запретил все партии, кроме своей. Недаром в немецкой вики приход к власти назван Machtergreifung -- захват власти.
Если очень часто называть всех вокруг изгоями, то действительно может на секунду показаться, что изгой не ты. Но не верьте этому ощущению. Оно Вас обманывает.
Codex за последние пару недель демонстрировал чудеса подсчёта лимитов, однако миллион токенов на отчет потратить не так сложно. Если задавать простые вопросы в длинных старых чатах, размышления могут и намного больше токенов утянуть.
1) Что мешало использовать не онлайн-сервис GitBook, а его же, но запустив локально? Это же просто генератор статичного сайта (https://github.com/GitbookIO/gitbook). Gramax: 30 коммитов, 20 форков. GitBook: 2000 коммитов, 4k форков. Это не говорит плохо о Gramax, просто факт. Но Gramax отечественный, да.
2) Лозунг вашего сервиса "Это не просто дневник. Это пожизненный ИИ-ассистент" наводит на самые худшие мысли.
Вероятно, вы забыли про достаточно мерзкое поведение операторов сотовой связи, которые всовывали внутрь сайтов, доступных по http, баннеры рекламы и кнопки платных подписок. А ещё позабыли про то, что учетку ВКонтакте можно было угнать, просто раздав WiFi. И ещё ооочень много чего опасного для пользователя сейчас в простом HTTP, связанного с атакующим посередине.
Практически в любой стране мира находится некоторое количество людей, готовых за небольшую мзду продавать свои паспорта, заводить банковские карты для посторонних людей и т.п.
А ещё национальный мессенджер же запустили в дружественных странах, в которых сим получить гораздо проще.
Размер контекста для агентов, как мне кажется, не всегда имеет большое значение. Человек держит в голове абстракции не больше чем с семи экранов кода и некоторое количество метаинформации. И этого оказывается достаточно. Конечно, нельзя тут напрямую сравнивать, но это только для иллюстрации мысли: больше важно что будет подано в контекст, а не сколько.
До какого-то момента LLM писали код лучше при увеличении контекста. Но этот момент давно пройден: и Cursor, и Codex, и Claude делают кучу точечных cat&ripgrep и отправляют довольно маленькие контексты, зато обычно довольно удачные. Посмотрел по истории - процентов 80 сессий целиком не превышают 1.5 млн токенов, а ведь 1 млн токенов это уже контекстное окно многих LLM.
При всём уважении к Вашим обзорам Suno, честно говоря, только эту ремарку считаю сильнейшим очернением всего, что Вы делаете.
На suno.ai Вы как заходите? Без средств обхода он не открывается. Вероятно, Вы их имеете, значит проблем с постингом в ТГ не будет при их использовании. СкаМа у большой части здешних пользователей нет и не будет. Я читал Ваш канал в ТГ, больше не буду, Вы его не обновляете.
В последнем посте в канале Вы пишете, что Телеграм не работает. Научитесь добавлять прокси и обновите до последних версий, пока почти у всех работает. В конце концов, воможно сделать кросс-постинг tg-ботом с зарубежного VDS.
Только ленивый не придумал память для LLM, не надо выдавать это за ноу-хау. Чем второе принципиально от первого отличается?
И, кстати, тянуть все заметки тоже избыточно: например, есть подход использовать быструю дешёвую сетку в 3-10B для преданализа запроса (чтобы понять, что запросить из памяти и дёрнуть соответствующий tool), а дальше в дорогой opus / 5.4 гнать запрос с добавленным выборочно контекстом.
А почему Вы общение с человеком, который заинтересован в публичном обсуждении, решаете засунуть в л/с? Здесь это "не формат". Не можете публично ответить на вопрос - отпишитесь, что ограничены NDA и т.п. Вы же почему-то решили оставить повисшим вопрос к статье и отписаться в л/с, а в публику решили только претензии отписать.
А что, Сибирь теперь не Россия? Нет, системных проблем реально много, начиная от самого верха до низа, но совершенно не очевидно что проблема именно в выкачивании недр. Свои недра качают все, просто кто-то при этом способен более разумно распоряжаться самой нефтью, нефтедоходами и страной, а кто-то предпочёл довести количество миллиардеров до одного из самых высоких в мире, а накопленную с нефти кубышку конвертировать в кровь, металл и уничтожение людей.
Послали так послали. Зачем и с чем обращаться в ООО? И как эта контора, которая заявляет как основную деятельность производство реагентов для нефтяной и газовой промышленности, относится к вопросу про нефтеразливы?
Первый из этой троицы так никогда и не получил большинства. Он был назначен канцлером при посредстве Гинденбурга. И после этого также не получил большинства до тех пор, пока не устроил поджог рейхстага и под этим предлогом не получил чрезвычайных полномочий и впоследствии запретил все партии, кроме своей. Недаром в немецкой вики приход к власти назван Machtergreifung -- захват власти.
Есть стопроцентное ощущение, что сверху давно готовы задушить хоть целиком интернет. И с каждым шагом к этому готовятся все сильнее.
Ps. Android релиз только что вышел.
ping habr.com идёт на IP 178.248.237.68, это московский IP. Тут обратная ситуация - на исторической родине лежит nginx, а сервер в человеческом месте.
https://www.youtube.com/watch?v=a6lbguF-06w
Тут сюжет с N телефонами обыгран
Работа идёт над исправлением десятилетнего бага. Однако есть опасение, что ТСПУ быстро научат банить трафик и без бага.
Потому что где-то додёргались рычагами управления чебурнетом https://habr.com/ru/news/1020064/. Скоро закрутят ещё сильнее.
Только что было на Хабре, и не анонс а хорошая статья от создателей https://habr.com/ru/companies/yandex/articles/1017876/
Из комментариев карта от энтузиастов https://antiborschevik.info/map
Если очень часто называть всех вокруг изгоями, то действительно может на секунду показаться, что изгой не ты. Но не верьте этому ощущению. Оно Вас обманывает.
Codex за последние пару недель демонстрировал чудеса подсчёта лимитов, однако миллион токенов на отчет потратить не так сложно. Если задавать простые вопросы в длинных старых чатах, размышления могут и намного больше токенов утянуть.
Но она кремниевая.
Интересно было бы знать, с чем именно не согласился минуснувший.
1) Что мешало использовать не онлайн-сервис GitBook, а его же, но запустив локально? Это же просто генератор статичного сайта (https://github.com/GitbookIO/gitbook). Gramax: 30 коммитов, 20 форков. GitBook: 2000 коммитов, 4k форков. Это не говорит плохо о Gramax, просто факт. Но Gramax отечественный, да.
2) Лозунг вашего сервиса "Это не просто дневник. Это пожизненный ИИ-ассистент" наводит на самые худшие мысли.
Эх, запрещалы...
Вероятно, вы забыли про достаточно мерзкое поведение операторов сотовой связи, которые всовывали внутрь сайтов, доступных по http, баннеры рекламы и кнопки платных подписок. А ещё позабыли про то, что учетку ВКонтакте можно было угнать, просто раздав WiFi. И ещё ооочень много чего опасного для пользователя сейчас в простом HTTP, связанного с атакующим посередине.
Практически в любой стране мира находится некоторое количество людей, готовых за небольшую мзду продавать свои паспорта, заводить банковские карты для посторонних людей и т.п.
А ещё национальный мессенджер же запустили в дружественных странах, в которых сим получить гораздо проще.