Если взять мой раход токенов с дипсика 185млн кешированный, 13млн входа, 1 млн выхода = мне бы это обошлось в 1000долларов по ценам клода. Не понимаю - как дипсик такое дает, не иначе потом ценник поднимет в раз в 10-50.
У меня в планах - когда все в железе проверено будет до последних веток алгоритма и конечных случаев, скормить код на ревью Опусу какому нибудь, чтобы он резюме свое дал.
Я видел delay - в некритичных местах(настройки), которые не влияют на режим реального времени в полете, если вместо этих задержек пихать что-то другое - код распухнет. Есть еще замечания по делу - чтобы опять же скормить их нейронке? И в продакт в реальное железо на тысячи приборов я бы такое еще не выпустил. Там есть еще что ковырять.
КПД печки в любом случае зашит в цене. Хотя они могут пока и в убыток работать - все провайдеры нейросетей т.е. Так никто не мешает свой референс поднять.
Разницы в размере компилированных машинных кодов не будет - компилятору пофиг, ну может ± 1% в бинарнике.
90% аудитории это Windows, скачали ZIP, открыли в Arduino IDE. Для них монолит это благо. Никаких пропущенных #include, никаких а где main.cpp. Один файл, один клик, одна компиляция. Парапланерист, который очень хочет прошить часы, доберётся до цели.
Если бы аудитория была embedded-разработчики через PlatformIO/VS Code, однозначно нужны модули.
Ага, сотни миллионов водителей даже не могут разобрать и собрать мотор своего авто, однако это не мешает им наматывать миллионы километров по планете. И им тоже не надо знать устройство мотора, а вот ехать надо. Кодеры, как переводчики, с человеческого языка на машинный, просто будут не нужны в таких количествах для массовых переводов.
В ИИ проще сгрузить один файл, если агенты могут сами все решать, то проект еще могут попробовать дорабатывать энтузиасты без настройки среды просто запихнув файл в вебчат. Я так делал до эры прихода агентов. Но, в принципе, ничто мне не мешает в следующей сессии блоки настроек, варика, часов разбить на модули одним запросом к агенту. Замечание принято. Попробую.
Для классической школы кодинга это будет правильнее, когда проще работать небольшими модулями, для вайбкодинга с ИИ будет хуже - жонглировать кучей мелких кирпичиков. У меня сложилось мнение, что вся старая школа программирования разбиения проектов на мелкие кусочки построена на том, что среднестатистический мозг плохо работает с большими простынями кода. Условно говоря раньше печки были маленькие - деревья кололи на поленья, с приходом ИИ стало возможно целое дерево пихать в топку.
В этом кейсе, дипсик мне строчил как пулемет, а по качеству - как Gemini 3 полгода назад. Я прямо упал в дофаминовую петлю на 6 ночных часов. Как в интересную игру - садишься за монитор в 21 встаешь в 05.
Я сейчас уже думаю на агента свалить всю сисадминскую рутину, Гермес сейчас у меня умеет - ползать по сети, искать машины, каталогизировать сетку, отправлять в телегу алерты, работать через бота в телеге - аля "перегрузи мне сервак №1". Зайди на консоль сервака №2 - пришли мне в телегу лог. И тп. Агент сам настраивает себя имеет доступ через апи к гульоблаку умеет писать в гугльдок и т.д. самое приятное - что не надо рыть мануалы - по команде он сам себе настраивает нужные скрипты.
Какое качество кода на ембедд дает? Ну там примерно строк за 6 часов и как ориентируется в предметной области. Я зашел в очень специфичный сектор - это не тг боты и не вебсервисы - обучающего контента для нейросеток в сети немного.
На счет теста подумаю. А так - раздам пилотам тестовых вариков - пусть тестируют. Старый прибор 8 часов в режиме варика работает - на большее батареи не хватает. Ожидаю что с новой прошивкой все должно быть стабильнее.
Я прошелся по многим моделям когда агента настраивал - дипсик мне приглянулся скоростью ответов, качеством и ценой, этот проект был горячей проверкой, иии... я доволен. У меня есть ощущение, что у антропика я бы потратил бы меньше токенов втрое, но заплатил бы раз в 10-20 больше. Редко я переключался на старшую модель Дипсика - но большого смысла нет. Все и так хорошо. Старший Дипсик хорош постфактум - пройтись как ревьювер после всех коммитов. Но деньги улетают впятеро быстрее.
У меня есть Alipay на телефоне, закинул туда с Тинькова. А там уже юанями платил, за час платеж на Алипей прошел. Alipay несложно ставится из гуглплея. Да - минимум переводят на алипей от 1500р. Столько и закидывал.
Ожидал увидеть в статье рецепт как загрузить плотную Gemma4 на 8-16 гигов видеопамяти. типа из этих https://huggingface.co/unsloth/gemma-4-31B-it-GGUF - без потери качества или минимально. Ну как если бы размер был как у 2бит, а качество как у 16бит.
Надо стараться работать на своих локальных моделях и компьютерах, пусть и с лагом по качеству моделей, любое облако - это чужой компьютер. В любой момент времени тебя могут отрубить от него по тем или иным причинам. Я вижу отставание локальных моделей, которые можно развернуть на средненьком сервере за 500к - 6 месяцев. В общем, не критично.
Давинчи Танго
Выглядит прилично и звук правильный.
Сходил, кстати, на опенроутер посмотрел сколько берет клод опус 4.7 фаст
Input Price $30/M tokens Output Price $150/M tokens Cache Read $3
Если взять мой раход токенов с дипсика 185млн кешированный, 13млн входа, 1 млн выхода = мне бы это обошлось в 1000долларов по ценам клода. Не понимаю - как дипсик такое дает, не иначе потом ценник поднимет в раз в 10-50.
У меня в планах - когда все в железе проверено будет до последних веток алгоритма и конечных случаев, скормить код на ревью Опусу какому нибудь, чтобы он резюме свое дал.
Уже запушил точечные доработки. За критику благодарен. Я хотел такие замечания сам писать агенту - а тут не пришлось, комментаторы помогли.
Не стал здесь длинный ответ писать от агента - написал в личку - кратко Delay допустим.
Я видел delay - в некритичных местах(настройки), которые не влияют на режим реального времени в полете, если вместо этих задержек пихать что-то другое - код распухнет. Есть еще замечания по делу - чтобы опять же скормить их нейронке? И в продакт в реальное железо на тысячи приборов я бы такое еще не выпустил. Там есть еще что ковырять.
КПД печки в любом случае зашит в цене. Хотя они могут пока и в убыток работать - все провайдеры нейросетей т.е. Так никто не мешает свой референс поднять.
Разницы в размере компилированных машинных кодов не будет - компилятору пофиг, ну может ± 1% в бинарнике.
90% аудитории это Windows, скачали ZIP, открыли в Arduino IDE. Для них монолит это благо. Никаких пропущенных #include, никаких а где main.cpp. Один файл, один клик, одна компиляция. Парапланерист, который очень хочет прошить часы, доберётся до цели.
Если бы аудитория была embedded-разработчики через PlatformIO/VS Code, однозначно нужны модули.
Ага, сотни миллионов водителей даже не могут разобрать и собрать мотор своего авто, однако это не мешает им наматывать миллионы километров по планете. И им тоже не надо знать устройство мотора, а вот ехать надо. Кодеры, как переводчики, с человеческого языка на машинный, просто будут не нужны в таких количествах для массовых переводов.
В ИИ проще сгрузить один файл, если агенты могут сами все решать, то проект еще могут попробовать дорабатывать энтузиасты без настройки среды просто запихнув файл в вебчат. Я так делал до эры прихода агентов. Но, в принципе, ничто мне не мешает в следующей сессии блоки настроек, варика, часов разбить на модули одним запросом к агенту. Замечание принято. Попробую.
Для классической школы кодинга это будет правильнее, когда проще работать небольшими модулями, для вайбкодинга с ИИ будет хуже - жонглировать кучей мелких кирпичиков. У меня сложилось мнение, что вся старая школа программирования разбиения проектов на мелкие кусочки построена на том, что среднестатистический мозг плохо работает с большими простынями кода. Условно говоря раньше печки были маленькие - деревья кололи на поленья, с приходом ИИ стало возможно целое дерево пихать в топку.
Мне на рф мегафон прекрасно приходят от алипей смс. А там уже юанями платим.
В этом кейсе, дипсик мне строчил как пулемет, а по качеству - как Gemini 3 полгода назад. Я прямо упал в дофаминовую петлю на 6 ночных часов. Как в интересную игру - садишься за монитор в 21 встаешь в 05.
Я сейчас уже думаю на агента свалить всю сисадминскую рутину, Гермес сейчас у меня умеет - ползать по сети, искать машины, каталогизировать сетку, отправлять в телегу алерты, работать через бота в телеге - аля "перегрузи мне сервак №1". Зайди на консоль сервака №2 - пришли мне в телегу лог. И тп. Агент сам настраивает себя имеет доступ через апи к гульоблаку умеет писать в гугльдок и т.д. самое приятное - что не надо рыть мануалы - по команде он сам себе настраивает нужные скрипты.
Какое качество кода на ембедд дает? Ну там примерно строк за 6 часов и как ориентируется в предметной области. Я зашел в очень специфичный сектор - это не тг боты и не вебсервисы - обучающего контента для нейросеток в сети немного.
На счет теста подумаю. А так - раздам пилотам тестовых вариков - пусть тестируют. Старый прибор 8 часов в режиме варика работает - на большее батареи не хватает. Ожидаю что с новой прошивкой все должно быть стабильнее.
Я прошелся по многим моделям когда агента настраивал - дипсик мне приглянулся скоростью ответов, качеством и ценой, этот проект был горячей проверкой, иии... я доволен. У меня есть ощущение, что у антропика я бы потратил бы меньше токенов втрое, но заплатил бы раз в 10-20 больше. Редко я переключался на старшую модель Дипсика - но большого смысла нет. Все и так хорошо. Старший Дипсик хорош постфактум - пройтись как ревьювер после всех коммитов. Но деньги улетают впятеро быстрее.
У меня есть Alipay на телефоне, закинул туда с Тинькова. А там уже юанями платил, за час платеж на Алипей прошел. Alipay несложно ставится из гуглплея. Да - минимум переводят на алипей от 1500р. Столько и закидывал.
Ожидал увидеть в статье рецепт как загрузить плотную Gemma4 на 8-16 гигов видеопамяти. типа из этих https://huggingface.co/unsloth/gemma-4-31B-it-GGUF - без потери качества или минимально. Ну как если бы размер был как у 2бит, а качество как у 16бит.
Он чужой журнал может скачать?
Надо стараться работать на своих локальных моделях и компьютерах, пусть и с лагом по качеству моделей, любое облако - это чужой компьютер. В любой момент времени тебя могут отрубить от него по тем или иным причинам. Я вижу отставание локальных моделей, которые можно развернуть на средненьком сервере за 500к - 6 месяцев. В общем, не критично.