Локальные нейросети заточенные для администрирования линуксов - это технология, которая напрашивается сама собой. Надо только, чтобы оно действительно было локальное и могло работать на в меру слабых машинах
Сложный ландшафт функции, куча аттракторов. Вообще, концепцию динамического хаоса сложно явно перенести на модель трансформера. Я рассматриваю движение сигнала по слоям модели. Есть там хаос или нет, зависит от постановки вопроса, но фундаментальное свойство хаотических систем, а именно "существенные изменения выходного сигнала на малые изменения входного" мы отчётливо видим в эксперименте
Нейросеть внуьри себя хаотична (в плане матхаоса). Можно сделать повторяемость на идеально совпадающих входных данных, но вот вы переставили запятую и результат отличается значительно.
Я делал детерминированный инференс с целью ленивого кеширования, но как бы а зачем ещё? Ну, чтобы регресс не словить, может быть. Проверять вызов инструментов.
Однако ожидать предсказуемого повторяемого поведения от хаотической системы - так себе идея. Парадигму надо сместить, принять, что повторяемость не так уж и важна
Мне один старый инженер как-то сказал, в эпоху огда ни о каких нейронках ещё никто и не слыхивал, мол не надо делать отдельные api для людей и роботов.
Преимущство cli инструментов в том, что это универсальный протокол.
Для всех.
mcp нужны там, где cli утилита смотрится неуместно. Например, управлять скриптами в blender через cli - идея сомнительная. А вот там где есть cli... Чёб его не использовать. Агенты прекрасно это умеют
Не молодой я. Давно уже не молодой. Перевод выполнен корректно. Не отставайте. Новые слова и термины появляются каждый год. Вы должны брать их на взлёте. Иначе, нафиг вы нужны
Это, кстати, любопытно. Я слышал разные мнения. От "ЛЛМ убивает творчество, кодить становиться скучно" до "нейронки вернули мне интерес к кодингу". Шут его знает от чего это зависит.
... С появлением ИИ мы как-то резко стали забывать, что между работает и можно людям показать - огромная разница. Работает - это 10%. До людям показать можно ещё девять раз по столько же и эти девять раз ещё и длиннее самих себя.
Люди как-то поверили, будто бы можно сразу написать хорошо. Нет. Нельзя.
Сначала вы объясняете агенту ТЗ. Это занимает час. Потом ИИ пишет код, который сразу работает. Это занимает 10 минут. Вам не нравится. Вы говорите, что гипотеза не удалась, всё удаляете и пишите ещё раз. Это занимает ещё 10 минут. Теперь вам нравится.
И вот тут вы садитесь и вместе с ИИ следующую неделю перекладываете архитектуру, пока не станет действительно хорошо. Так это работает.
Локальные нейросети заточенные для администрирования линуксов - это технология, которая напрашивается сама собой. Надо только, чтобы оно действительно было локальное и могло работать на в меру слабых машинах
Пишу из шестидесятых. Вам лучше не знать
А если вашим методом сжимать не Deepseek-Pro, а Deepseek-Flash, может потеря качества будет не столь существенной?
Ну, если там 50Гб, то я и локально могу поднять. Вопрос, надо ли оно?
И как оно?
Ну так, сокет то кто-то должен открывать и читать... вот демон sshd этим и занимается. А он вполне себе процесс
Тема отличная, но такое впечатление, что... она не раскрыта. Тут материала на полчасика чтения должно быть, а не на убогие четыре минуты
Сложный ландшафт функции, куча аттракторов. Вообще, концепцию динамического хаоса сложно явно перенести на модель трансформера. Я рассматриваю движение сигнала по слоям модели. Есть там хаос или нет, зависит от постановки вопроса, но фундаментальное свойство хаотических систем, а именно "существенные изменения выходного сигнала на малые изменения входного" мы отчётливо видим в эксперименте
Матхаос там есть
Ставьте нулевую температуру, задавайте seed и будет вам полный детерминизм
Всё так. Сплит решает проблему с кистями раз и навсегда
Нейросеть внуьри себя хаотична (в плане матхаоса). Можно сделать повторяемость на идеально совпадающих входных данных, но вот вы переставили запятую и результат отличается значительно.
Я делал детерминированный инференс с целью ленивого кеширования, но как бы а зачем ещё? Ну, чтобы регресс не словить, может быть. Проверять вызов инструментов.
Однако ожидать предсказуемого повторяемого поведения от хаотической системы - так себе идея. Парадигму надо сместить, принять, что повторяемость не так уж и важна
Интересно, что через тысячу лет в плане генома про наше время скажут
Слишком очевидные примеры.
Мне один старый инженер как-то сказал, в эпоху огда ни о каких нейронках ещё никто и не слыхивал, мол не надо делать отдельные api для людей и роботов.
Преимущство cli инструментов в том, что это универсальный протокол.
Для всех.
mcp нужны там, где cli утилита смотрится неуместно. Например, управлять скриптами в blender через cli - идея сомнительная. А вот там где есть cli... Чёб его не использовать. Агенты прекрасно это умеют
Не молодой я. Давно уже не молодой. Перевод выполнен корректно. Не отставайте. Новые слова и термины появляются каждый год. Вы должны брать их на взлёте. Иначе, нафиг вы нужны
Это, кстати, любопытно. Я слышал разные мнения. От "ЛЛМ убивает творчество, кодить становиться скучно" до "нейронки вернули мне интерес к кодингу". Шут его знает от чего это зависит.
... С появлением ИИ мы как-то резко стали забывать, что между работает и можно людям показать - огромная разница. Работает - это 10%. До людям показать можно ещё девять раз по столько же и эти девять раз ещё и длиннее самих себя.
Люди как-то поверили, будто бы можно сразу написать хорошо. Нет. Нельзя.
Сначала вы объясняете агенту ТЗ. Это занимает час. Потом ИИ пишет код, который сразу работает. Это занимает 10 минут. Вам не нравится. Вы говорите, что гипотеза не удалась, всё удаляете и пишите ещё раз. Это занимает ещё 10 минут. Теперь вам нравится.
И вот тут вы садитесь и вместе с ИИ следующую неделю перекладываете архитектуру, пока не станет действительно хорошо. Так это работает.
Отлично всё понятно. Изучайте матчасть
Чем дальше, тем любопытственнее