Comments 62
Влад, спасибо за кейс. В тексте сказано, что агент сам находит аномалии и формулирует рекомендации. Были ли случаи, когда ИИ галлюцинировал в отчетах или неверно интерпретировал, например, скачки трафика? Проверяет ли кто-то из людей итоговый отчет перед тем, как он попадет к CEO?
С галлюцинациями мы не сталкивались. И да, полученные данные сперва обсуждаются внутри отдела, они нужны прежде всего для планирования гипотез и действий команды. А дальше уже попадают ко мне )
как часто проверяется что ИИ не галюнит? хотя из того что увидел у вас только UX првоерка на иишке, а остальное скрпитами сделано и там по идее стабильно должно быть, хотя и там как отслеживаете что нет багов?
Наконец-то кейсы подвезли. А то из каждого угла про эту клешню трубят, но похвастаться результатами пока никто не спешит. Пытался у себя локально ее поставить, но на мой калькулятор Node.js 23 не ставится, а на меньшем OpenClaw не завелся. Хорошо вам. А мне придется по старинке, ручками.
Посмотрите в сторону nanoclaw и аналоги. Заведутся и на калькуляторе
у меня на VPS с 2cpu/2gb ram крутится, всего 700mb использует. Или у вас именно в nodejs проблема?
В node.js. Процессор древний, нет нужных инструкций. У меня и ollama еле дышит по той же причине.
Быстрый гуглинг говорит, что для того что бы проблема была в инструкциях процессора он должен быть старше 20 лет 0_0
Может попробовать Intel Software Development Emulator (SDE) или перекомпиляцию?
Добрый день, у вас разработан какой то факт чекинг, того что делает ии? Что будет если он однажлы на скрине распознает 1 как 7, пришлет кривой еженедельный отчет, в заявке на тендер укажет не тот ИНН/ОГРН и так далее.
Есть ли у вас зашита?
openclaw в этом плане довольно гибкий. Он умеет сам перепроверять свои выводы (в том числе другой моделью LLM). Но человека в любом случае из цепочки пока исключать рано. Критичные данные (например, платежные реквизиты) обязательно смотрит сотрудник. Плюс резервные копии. Они, кстати, и от человеческих ошибок неплохо защищают )
ИИ, который мы заслужили. Заполняет таблички в Excel.
Плохо что ли? Хорошо!
Давно не удивляюсь, какую тупую и примитивную работу до сих пор делают некоторые операторы. Другое дело, что для подобной автоматизации применение ИИ сомнительно. Или это для особенных, кто не осилит макросы или какой-нибудь vbs?
Ну, я на примере своих задач вижу, что макрос - не универсальное решение. А ИИ - универсальное. Возможно, для забивания гвоздей избыточное, да. Но универсальное. Строго говоря, то же электричество, которое автор приводит в пример, сейчас используется в основном не для улучшения жизни людей (условного), а преимущественно для генерации и потребления говноконтента - от кринжовых телепередач до мемов в телеге. Но любим мы его, как говорится, не только за это. Как раз потому что оно универсальное.
Если бы эту работу можно было бы автоматизировать с помощью человеческих усилий, уже бы автоматизировали и уволили б того, кто её делал. Или нагрузили б его другой работой. Но это только на словах легко, «макросы». А дай вам задание, не факт, что за обозримое время справились бы. А за полгода никому не надо, слишком долго.
Так что ИИ сюда отлично подходит. Ошибки будут, но они и с людьми операторами у них изредка были, скорее всего.
Щас бы в 2к26 писать макросы без ИИ.
Я уже даже идеи макросов сам не пишу :)
Не дочитал, остановился на примерах и использования понял что это "пятая нога для собаки" , не стал читать дальше
Сквозная аналитика и управленческие дашборды: просто существуют.
Кармаков: время для Open Claw
Из вашего кейса не понятно за чем вам "клешня".
Я прочел мы дергаем 5 апи питоном и складываем в гуглотабличку - ок я тоже так делаю и ничего против не имею "набросать все это" llmкой
Еще мы юзаем плэйрайт, чтобы собрать из dom все тем же питоном. таак и это тоже зачем в компании нужен был "автоматизатор" или немножко программист.
Где тут необходимость в переплате за токены для опенкло я не вижу.
Почему у вас сотрудники, если вы открылись не осенью хотя бы нокод какими-то штуками не автоматизировали свою рутину - вопрос к управленьческим решениям.
Я тут звучу "токсично" что ли. Но, как старый дед в своё оправдание скажу, что каждые полгода вижу восторги новой штукой, с которой все носятся. А по факту в 90% случаев "неофиты открыли, что в экселе есть формулы" ;).
я уж совсем злобным побуду, вдруг про conditional formating в эксельках еще кто-то не знает - это же чудо, как без всякого ии и дашбордов со свистоперделками можно данные визуально выделять ;)
Короче тема не раскрыта, как будто llm тут закодить помогло, не самым оптимальным способом. ну ок.
О чем, вообще, речь)
Когда Яндекс в (бл) 23 декабря, 2025 выпускает статью:
Как использовать условное форматирование в Excel маркетологу. Такие нынче спецы
Повторю свою шутку из комментария к другой статье. Вы ничего не понимаете Сову нужно обязательно надеть на глобус. Возьмем циркулярку и нарежем колбасы для бутербродов.
Справедливое замечание, если есть свободный программист, который напишет скрипт за 2-4 часа, поддержит его при изменениях API/верстки и будет на связи для багфиксов. Тогда Python + cron действительно дешевле. Но openclaw решает другие задачи:
- Маркетологам не нужно зависеть от разработчика, они пишут задачу в Telegram и получают результат сразу. Время специалиста = деньги.
- Если сайт изменил верстку, скрипт упадет и будет ждать фикса. Агент увидит ошибку, сам адаптируется и попробует другой подход в рамках той же сессии.
- Сложные цепочки вроде «Найди статьи, собери метрики и тренды, сравни с нашими публикациями и сделай дайджест» — для Python это написание оркестратора, а для агента — одна фраза.
- Контекст не нужно кодировать: наш Клавдий знает структуру компании, предыдущие взаимодействия, типичные задачи пользователя, роли и права доступа.
Подытожу. Да, можно обойтись без openclaw. Но с ним есть гибкость, не нужно ничего допиливать (ну почти), и даже если что-то поменяется, он самостоятельно адаптируется. Это не «открытие формул в Excel», а делегирование рутины ИИ-агенту, чтобы разгрузить команду и дать не-технарям инструмент автономности. Мы используем Клавдия для того, чтобы трансформировать компанию и научить сотрудников решать простейшие задачи без программистов, которые занимаются продуктом, а не парсерами.
Я не просто так написал. Я очень хреновый программист - ллмки слелали жизнь легче.
Выгрузку данных из кабинета яндекса по апи в битрикс24 делал пару лет назад, без ллм - умудохался знатно.
Да и с ллм приходится сильно помучатся - в основном проверкой "то ли я получил, что хотел" и вот эта часть не работает без понимания, как оно тут появилось и если вы не уверены, что получили, что надо и ограничения при этом возникающие - вы не можете доверять данным и от этого они даже не бессмысленны, а даже вредны.
Именно в этом ключевая проблема использования нейронок в целом, они дают буст в местах, которые ты и сам мог бы сделать т.к. только в этом случае ты видишь косяки.
Поэтому если вы от "руками" перешли к автоматизации через клешню, вы пропустили шаг просто автоматизации в котором должно наступить понимание - мое личное мнение, основанное на десятках мелких автоматизашек через апи. в которых чего только не встречалось.
Кривая документация, ошибки в самих апи или том, что их дергает - при этом данные выглядели "валидно". Не столкнувшись с этим ваши автоматизторы не попросят делать кросс-чеки.
В этом проблема ноукод, зерокод, ллмкод, вайбкод и просто клешня безкод - оно как-то решает все более похоже на правду, но без экспертизы минимальной хотя бы "что должно быть внутри" подучается "наукообразная фигня".
вопрос не в инструментарии, вопрос в том почему у вас не было до сих пор ввгрузки из кабинетов метрек, если это ваша основная деятельность.
какой-то опять я токсичный - но нет, со всей душой. занимаюсь местами тем же ;)
но расстраиваюсь, что все равно потом приходется лезть руками в код.
А какую вы модель в к клешне прикрутили для ваших нужд? Другие пробовали? Дорого получается?
Именно поэтому я рекомендую любые эксперименты с агентскими системами запускать на закрытом тестовом контуре/контейнере. А уже потом распространять на реальные рабочие данные.
И это даст только ложное ощущение безопасности. Потому что этот метод проверки хорош для детерминированной логики, где краевые случаи более менее узнаваемы. Как вы собираетесь проверять нейросеть? Она даже на одних и тех же данных с одним и тем же запросом может действовать сильно по-разному, что уж говорить о том, когда к ней будут разные данные прилетать, не исключено, что с инъекциями.
Так это легко - попросить нейронку саму провести пентест и сбежать из окружения. Но полностью от слива данных например защититься невозможно, идея лобстера в том что нейронка не просто инструмент, а актор самостоятельно работающий с инструментами.
И вот с одним запросом она проверит вот эти 2 гипотезы. А с другим - вот эти 3. А если к ней прилетит еще какой-то запрос - то другие 3. И все они частично пересекаются, а частично нет. Проблема все та же: недетерминированность. А какой-то запрос про бабушку заставить ее через легитимный инструмент постить бесконечно новых лидов в crm, отчего на следующее утро система ляжет от миллиарда новых сущностей.
И сколько раз у вас такое было и с какой llm? Сомневаюсь что нейронка может одновременно бредить и правильно вызывать инструменты :)
Во сколько вам обходится опус 4.6 на ваших задачах? Он достаточно дорогой, если сравнивать с другими моделями. Можно легко влететь в астрономические суммы, если не считать токены.
В тексте упоминал, что опус мы использовали для изначальной разработки. Сейчас используем GLM 5 / Gemini 3 Flash, Gemini 3.1 Pro для сложных задач. Подключить можно любые LLM, хоть qwen, хоть kimi, хоть Алису.
Выше уже озвучили намёк, что это за разработчик такой, который за 10 лет не мог наладить автоматизацию и ждал модной новинки) Хотя да, 3700 строчек кода — это, вероятно, кажется внушительным результатом.
Зачем для 101 статьи три разных модуля на ~1400 строк кода? Странная архитектура или просто чтобы масштаб работы эпичнее выглядел?
И вообще, откуда взялся этот дичь-тренд — смотреть количество лайков, просмотров, комментариев? Что это даёт? Я одну и ту же вещь могу выставить в трёх местах, и может случиться такое, что там, где больше всего просмотров и лайков — самый долгий путь до результата (продажи).
Меня, на самом деле, зацепило слово "Сибирь" игра моя любимая))
Так что все претензии к покойному Сокалю
Короче, я просто взял и за 20 минут проанализировал сайт и компанию.
Очень необычно, что разработчики, которые в 2026 году рассуждают про ИИ, имеют фирменный сайт на древнем и уязвимом WordPress v5.3.20. Для компании, которая продаёт IT-услуги и называет себя экспертами, это недопустимо и подрывает доверие. ПейджSpeed подтвердил то, что было видно визуально: производительность сайта — провальная, оценка F. Куча JS и прочего мусора. Отдельно позабавили SEO-имена файлов, например:
232231078_323721929451312_155909450170757428_n.png
Был бы я клиентом, подумал: «Как они сделают качественный и быстрый продукт для меня, если себе не могут сделать нормальный сайт? И даже не знают, что такое WebP?»
Даже захотелось посмотреть на продукты их клиентов
— SPAR (Калининград) — оценка в Google Play: 3,1;
— Быстроном — оценка: 2,6.
Дальше уже не стал смотреть. Пожалел своё время
Но. Будет время — загляну в раздел «Вакансии». Может, задорого и помогу чем.
И да: крошечный логотип и такая огромная гамбургер-меню. Или парсили таки оценки продуктов и себя застеснялись, что ли?
Спасибо за детальный разбор компании )
Отчасти вы правы по поводу сайта — он как раз в процессе обновления. Делался очень давно, на тот момент был вполне хорош и целей своих достигал. Впрочем, разработкой сайтов мы не занимаемся, и WordPress клиентам не предлагаем — не наш уровень, делаем только сложные веб-системы. WordPress — это выбор директора по маркетингу, чтобы отдел мог модифицировать сайт быстро и без участия разработчиков.
А насчет приложений вы не совсем правы, потому что бизнес оценивает их эффективность не по отзывам в маркете, а по влиянию на свои процессы.
Сам выбор кейсов тоже любопытен. Приложения для SPAR мы разрабатывали на протяжении 5 лет и тогда рейтинг был 4.8. Уже 3 года ими занимается другой подрядчик.
С Быстрономом ситуация в точности обратная. Здесь как раз мы — другой подрядчик, и подхватили этот проект лишь недавно. Рейтинг вырастет, не переживайте )
Я, может, ещё не всё понимаю. Менее года изучаю IT (если суммарно, без пауз).
Но активно юзаю всё, что можно юзать. Лет 20. Решил поюзать Быстроном.
Ладно, понимаю, что медленный отклик и новые фичи внедрить - нужно время.
Как так сложилось, что приложение, которым занимались ранее и теперь какое-то время ведете вы - вообще не запустилось через Wi-Fi? Мега актуально в наше ограничительное время.
Чисто интуитивно - до 3 часов на диагностику, до 4-5 часов на Fix. С ИИ.
Что-то сложное: 2-3 дня. Вы сколько дней ведёте проект?
Кстати, ужасное дергание логотипа при заставке - портит первое впечатление.
Какой ж тогда проект был самым сложным и крутым? (просто интересно)
В итоге наш Head of AI единолично разработал систему из пяти автоматических пайплайнов
Чего он ждал 2 года? Когда мог навайбкодить это все еще с чатом гпт 4о, зарегать тг бота и закронить питон скрипт
Head of AI
Ахаахахх, какая смешная помпезная лычка, звучит как какой профессор искусственного мегаинтеллекта Сэм Альтман во плоти, по факту там какой-то вайбкодер сидит скорее всего, чем head of ai, отличается например от junior of ai?)))
Я как-то работал эникейщиком в ООО из 2 человек. И по моей просьбе, должность в трудовую мне записали как "Заместитель директора по информационным технологиям". Уж очень хотелось CIO себя почувствовать)
Отличие то же, что и любого другого head of от джуна: понимание бизнеса клиента, самостоятельное формирование тех. требований, а не просто написание кода по ТЗ. Стратегическое мышление, понимание бизнес-логики и умение ее проектировать, а не только писать промпты. Совершенно иной набор навыков.
В идеальном мире да, а в реальном это вполне может быть Уася вайбкодер который примазался к директору, все думают что он что-то улучшает и оптимизирует, а он на самом деле просто играется в игрушки свои и в "клешни", пока лошадки работают :)
Ну, я про своего Head of AI рассказываю, а не про гипотетического ) У нас это далеко не джун.
Одно дело писать код по готовому ТЗ, другое — самому формировать технические спецификации, исходя из требований бизнеса.
Но я верю, что бывает и по-другому. Тем более, сфера пока новая и реальная экспертиза у многих еще только формируется.
Причина довольно банальна: не доходили руки. Выход завирусившегося инструмента просто оказался удобным поводом начать. Часто даже просто сформулировать потребность в автоматизации бывает непросто.
До скайнета, конечно, такими темпами еще далеко.
Как сказать. Тут уже проскакивало недавно, что у китайцев нейросеть самовольно ушла майнить, чтобы профинансировать поставленную задачу. Учитывая автономность openclaw и все эти терки с Department of War - кто знает, что там будет в итоге. Впрочем, зная человеческую природу, я бы скорее поставил на то, что это сами сотрудники и майнили)
Автоматизация отличная, как саппорт супер. Но я думаю популчрность у чего продукта из за того что зумеры и все молодые спецы, мягко говоря туповатые. У меня в холдинге 200+ людей в разных странах, езжу по разным офисам , и наблюдаю что люди постарше, работают что в екселе что в других софтах без вопросов, все у них отлично работает, минимум вопросов.
А молодежь то не умею это не умею а как принтером печатать?элементарным пользоваться не умеют…такие вот юзеры.
люди постарше, работают что в екселе что в других софтах без вопросов, все у них отлично работает, минимум вопросов
Они за 20+ лет выучили, где какая кнопка ;)
А молодежь то не умею это не умею а как принтером печатать?элементарным пользоваться не умеют
Те, кто постарше, 20 лет назад тоже не знали, где у принтера кнопка. Они не родились с тайным знанием
«Проверь лендинг
mysite.com/promo. Убедись, что на iPhone 15 Pro главная кнопка не перекрыта баннером и текст хорошо читается на фоне картинки».
- честно говоря пока это пишешь быстрее будет зайти самому чекнуть
Так и не понял - при чем тут именно OpenClaw?
Любой ии типа gemini или любой другой, который может в скиллы и mcp, делает это все уже относительно давно.
В чем фишка именно OpenClaw? Какая у него киллер-фича. Вроде он просто обертка для сторонних моделей. Лишняя прокладка.
Автономность же. Он из контекста понимает задачу, находит способ ее решить и решает, вызывая в процессе инструменты, загружая библиотеки и даже прописывая самому себе новые скиллы.
Где-то читал, как человек просто дал боту доступ к радио и попросил расшифровать пожарную частоту. Ничего не кодил, не объяснял, не давал ссылок. Просто попросил в чате. И бот все сделал за полчаса.
Звучит как магия. Я в соседней теме писал, что поэтому и стал пробовать себе поставить - чтобы он фотки сортировал. Потому что все классические решения, которые я пробовал до этого, - требуют слишком много моих действий. Я хочу просто сказать "сделай" и чтобы оно было сделано. Пусть даже не идеально.
Меня волнует вопрос безопасности. Последнее время интернет накрыла волна информации о том как агенты ломаются. Сливают чувствительные данные и прочее. Насколько это безопасно?
Окупаемость за 2-4 недели - каеф. Интересно, как решаете скоупинг прав? агент в битрикс только читает или может и писать? Вебвизорный пайплайн хочется увидеть подробнее, там как раз AI нужнее всего, а деталей меньше всего. Покажете?
Приветствую! А как вы боретесь с тем, что OpenClaw всё забывает через пару компакций, в том числе и все свои навыки/интеграции? Каждую ночь заново разворачиваете весь парк? Как реализовали память? Модели крутите свои или подписка?



Короче, мы просто взяли и за день внедрили OpenClaw в отдел маркетинга