Надоело закидывать баксы этим всяким клодам. Подумывается собирать мини серваки с тремя rtx4090 или даже двумя.
Чтобы экономия была реально разумной. А то иной раз за день прожигает 500 баксов. Чтоб я ещё раз этого краба запустил, клешню ему в брюхо.
Вот и думается, в месяц тратишь 3000 баксов на клода. Может тупо собрать сервак себе на эти бабки.
Я думаю что заменять ручной труд на машинный надо покупками машин, а не подписок в где то там. Ну снял офис, вместо людей наставил системники. Ноутбуки распродал, которыми люди пользовались, часть направил на мини серваки. И вот - заменился труд рутинный.
А клоды шмоды эти сегодня 20 баксов, потом 40. Потом у них суперакции и ещё впн этот проплачивай. А РФ чебурнетиться останавливаться не планирует. Отрезаться хочет от интернета глобального.
"Нужно было запоминать всё: от настройки серверов и баз данных до верстки пользовательского интерфейса и бизнес-логики. Наш мозг — невероятная штука, но на такое он вряд ли способен".
Ну у кого как. А у нас до появления нейронок - надо cicd построить, пошлли сделали, надо архитектуру на на 100к+ юзеров - пошли сделали. В кликхаусе/пг запросы кластер тормозять - пошли оптимизировали. Кластеры нажо поднять - пошли подняли. В даных заказчика разобраться - пошли разобрались. Olap drill down закрутить - пошли сделали.Хайлоад бекенд запилить без утечек памяти и с вменяемым латенси - пошли сделали.
Единственное фронт казался скучным. Кнопки красить лень.
Ура появились нейронки. И теперь мы всем говорим, что всё делаем с их помощью. А то вдруг не поверят. А на практике подписка на 20 баксов сгорает за 1 день.
Каков Ваш опыт нейросеток - ну токены экономлю, контекст минимализирую, sdd использую. Задачи декомпозирую. Один день пших и нет токенов. Написала машинка 5к строк кода +- рабочих. А я и так в день по 10к писал кода и рабочего на 100% и тестами закрытого.
Они там продуктовтв агень кодинг и мечты у них.Что там продакты разработку потянут. А я тут недавно кароче вайбкодить в бизнес пошёл. И оказалось что для своего бизнеса 9 классов образования хватит.
И мне вот интересно, кто быстрее через агентов достигнет прогресса? Те, кто нихренатне шарит в разработке, но понимает деньги? Или те кто понимает вдоль и поперек всю разработку, но не было интереса понимать деньги?
Деньги же ну это сложно же)) Или в них даже вайбкодинг справиться? Даже без sdd)
Не хватает контекста. Что вот самого нового появилось. SDD, spek-kit, openclaw. Те кто не шарит ни в чем - кричат революция. Те кто пощупал - рука-лицо и мысли - да уж, "прогресс".
Не освещены темы с генеративными ошибками (галлюцинациями), и что у llm не меняется фундамент. Корпы ушли тоже деньги зарабатывать, а фундаментальные проблемы своих моделей облепили кастылями. Которые вроде работают иногда. Поэтому инженер будущего должен лучше llm понимать что она там нашкодила. А это не джуновский навык.
Единственное интересное - фотонный чип. Который должен увеличить мощности вычислений, прекратив отнимать у людей электричество мегаваттами. Но когда его в производство запустят - не понятно. Но он тоже не решит фундаментальные проблемы llm. Физикой не обойти законы математики.
Во что это превратиться через 5 лет? Выйдет gpt7, который лучше себя самого на 30% в бенчмарках пойди разберись и пойми. На рынок хлынет поток чудо проектов, закрывающих дырки. Которые через раз справляются с задачами. И все на столько обленяться, что будут просто гооворить ну ллм ошиблась, бывает. Упадет качество создаваемых решений. Но оно и перестанет всех волновать. Ведь если мой бот в телеге тупанул - ну и что. А если попросил перевести 1млн себе из банка в банк - а оно тупануло и отправило деньги в фонд пожертвований развития ллм. Люди пошли просить ллм проверить что не так, оно проверило и сказало что всё нормально. А сами люди уже не в состоянии понимать что внутри их систем происходит - это же не модно, как и код писать руками, фу.
Бедные работодатели не смогли ничего побороть. А Наташка из соседнего подъезда с девятью классами образования качнула бесплатную лабуду и продолжает в инсте фотки свои публиковать как и публиковала.
При всем желании ни у кого ничего не получиться. Полностью отрубить можно только электропитание. А на всё остальное найдется 100500 дырок.
Так ваш протобаф гошный может сразу и в хттп и в грпс.
Я Думал все гоферы с молоком матери начинаюь сначала протобаф описывать, а потом проток генерейть и готов хендлер какой хошь. Проток мок и вот тебе заглушки товарищь фронтендер.
Апи фесту уже 1000 лет в обед.
А SDD - спекулянтус дривнус девелопментус - это шкодерам жизнь проделвает. Написал спеку для ллм. А она тебе пофиг какой код, главное чтоб лампочками моргал)
Самый длинный срач про sdd - спек дривен девелолупмент.
Можно так жить - да. А Нужно?
Беру кароче проект на 100к человек из 70 микросервисов. Пешу кароче спеку.
Прошу модель явить чудо. На первом запросе получаю - слишком длинная спека. Не влезает в 200к токенов.
Декомпозирую. Обкладываюсь рагами, спеками по спекам. Вики на чики брики. Глоссарий планетарий. Настраиваю это добро 6й месяц к ряду. Напечатал и нанейронил текста столько сколько все писатели в мире не написали. Допустим всё это сделал.
Опять иду в чудо окно - сделай фикс на микросервис такой то. Вот тебе все 1000+ спеков. В контекст 200к влезли. Фикс сделали. Тесты сделали. Всё сделали. Пошли на прод залили. Через день уже другой сервис грохнулся. Потому что был связан с этим и модель там поле новое влепила в субд.
ПРосим рефлексировать. Чейонфтрушиться. Черепашиться и скрам мастериться через в себя. Запускаем 100 агентов. Проблема дюже сложная. Они вместе пыжат. Мексикснцы опять без света сидят. 10 000 баксов закинули на токены. Супер мега модель всего включили. И всё! Решена задача. Отлично.
А теперь без нейронок. Крепкий спец, который на проекте год, увидев 4 строчки логов в 2х сервисах такой хм. Написал 5 строчек там, 7 строчек тут. Задеплоил и забыл. Всё работает. Потратил свою энергию на кхм. Это было самое сложное
Вот это ещё одна типичная ошибка при построении RAG систем. Объяснять это так менеджерам и бизнесу особенно. Что модель хоть что то делает в этом процессе, кроме как ртом своим пережёвывает информацию.
Придумали кучу кастылей вокруг текстового генератора и понесёсся словестный понос со всех щелей уже который год одно и тоже.
Пгшечку берут для транзакций. Чтобы не попадать в ситуцию "Ваш заказ оплачен, но не создан, платите ещё раз". Возник кейс кей валуэ - читаем что такое вообще КЭШ. И сначала храним его в своей голове. А уже если этого не хватает берём куй валуя в виде редис. Сравнить это всё в одном месте ток нейронка могла. Ей да наплевать на здравый смысл. А почему кликхауса тут нет кстати? В него тоже можно кей велью сохранить. Ну или кафки?
Чё ребят. Откроем филологам Америку? Что код надо уметь читать двумя полушариями. Одним - как человек и там нам обычно плевать что и как называется, главное - какие комментарии написаны.
Вторым - читать код как компьютер. А ему 100% плевать что и как называется. Он там функцию увидел, параметры отсканировал из памяти значения достал и дальше по стеку плюнул.
Если бы компьютер думал над тем как мы там назвали переменную - с ума бы наверное сошёл. Пришлось бы программировать калькулятор на майнинг фермах.
Всем добра. Прочитал комментарии. И статью. Тоже решил вытащить голову из пещеры и высказать мысли.
Вайб-шкодинг. Коротко о том почему он не работает.
Запрос: "Покрой функцию @Функция тестами"
Промпт: (500 строк, не больше, ибо вайб же): Ты сеньор программист. Ты знаешь стандарты. Ты крутой перец. Если забыл стандарты - вот ссылки. Ты сам себя проверяешь. Ты никогда не булшитишь. Ты мощный. Пиши с кайфом...
Дай боже хоть что-то техническое в промпт будет вписано, Аля Используй контекст7. Или я тебе там MCP сервер подрубил. Ну типо Сеньор-Вайбкодер, в теории, наверное, впишет про технику чуток того, что он понял/подсмотрел/украл/взялИзНейросетки.
Агент кодинг. Почему он работает.
Запрос: "Покрой функцию @Функция тестами" <- ВООБЩЕ НЕ МЕНЯЕТСЯ.
Промпт: 5000+ строк на английском языке, в которых методично передан весь накопленный РЕАЛЬНЫЙ сеньорский 10+ лет опыт в программировании, тестировании архитектуре и разработке ПО как таковой. В этим промптах как ребёнка Сеньор-Методист ведёт LLM за ручку по миру программирования и тестирования, разжёвывая ему как тупому валенку базовые и сложные принципы - от того как писать переменную, до того как нужно правильно закрывать тест кейсы, руководствуясь проверенными на практике принципами, которые точно работают. Такие промпты пишутся путём тщатильного анализа того, что именно нейросеть делает не так. И когда она что-то делает не то, ей опять разжёвывается через ПРИЗМУ СВОЕГО ПРАКТИЧЕСКОГО опыта как сделать то что нужно. Так рождается МЕГА/ЧУДО/GOD-Промт, недостижимый для вайбера. Решающий ОДНУ конкретную задачу.
И это ключевая Разница. Когда у Вас вообще нет опыта в разработке например Масштабных микро-сервисных систем, так называемой школы жизни кровавого энтерпрайза - ВАМ ПРОСТО НЕЧЕГО вложить ни в запрос к LLM ни в Промпт. А всё что нейронка нажевала в интернете - это средняя по больнице лабуда.
И как только результат надо получить выше среднего - тут то и начинается веселье. Он недостижим для Вайбкодеров. У них опыт писать промпты. У нейронки жевать промпты и примерять на усреднённый результат того, что она спиздила в интернете. Да, иной раз она может утащить без ведома людей из их проекта что-то реально прикольное и показать Вам - тип о, оптимизировалось. Но это как игра в лотерею. В своей основе - Агенты LLM и вся эта нечисть болотная - просто быстрее и лучше находит информацию. Чем гугл поиск или стек оверфлоу.
И по итогу - все опять идут к нам, к людям, для которых писать код, создавать сложные большие системы - никогда не было и не будет какой-то там проблемой, которую срочно решить бежать надо. Кто прошёл кровавый энтерпрайз - среди них даже у джунов нет проблемы с написанием кода, созданием фич и багофиксаньем. В системах, где 10-ки сервисов через друг в друга данные гоняют. Они решают эти задачи за чашкой-другой кофе и 2-мя печеньками.
А Текущая ситуация с LLM - Илон Маск пошёл строить ЦОД, размером с пол города. Сожрёт Сколько-то там Гигават электро энергии. И оставит реальных живых людей без этой электро энергии. На это потратят баснословные деньги а ещё на суды и бюрократию. Миллиарды долларов. Бюджет какой-нибудь не сильно крупной страны)
Это просто для тех информация кто думает, что он навайбил там штукодрюку. Она жрёт 64Гб оперативки и автоматизировала заказ билета на Туту.ру для 1-го пользователя. Что это никак решать не надо будет - КОНЕЧНО - Вы просто также с кайфом навайбите себе железа на миллиард рублей)) Я в Вас "Верю", потому что "отстал" от жизни и у меня наверное у одного миллиарда рублей нет на оборудование.
Да нет - ВЫ ничего не понимая в оптимизацию и архитектуру. Попросите нейрноку всё Вам сделать. И будет просто "конфетище")) А на практике вы сожжёте все свои токены в первый же день и пойдёте покупать ещё токены. И ОНИ - владельцы этих чатов это знают прекрасно) И толкают Вас туда - Вайбить, Вайбить, Вайбить))) Им то наплевать по большому счёту, сделаете ли Вы реально масштабируемый и производительный и мощный и всему миру нужный продукт. Токены же купите) Ибо чёт не оптимизировалось. Не пошло. Упёрлось в стену. Наверное надо КНОПКУ волшебную оплатить - DEEP REASON - 2000 баксов за месяц. Она то "Сможет". И хоп - не смогла. Надо оплатить её ещё раз. Наверное не туда платили. Пойдём купим ещё кнопок и подписок у других поставщиков. Вдруг случиться чудо - и опять нет, не случиться.
Это в конечном итоге - Лопата, а не шахтёр. Лопата хорошая, копает отлично. И быстро. Может снизить нагрузку на рутину. Напиши тест, сделай рефакторинг. Объясни логику, сформируй документацию. Объясни по этому логу что в итоге за ошибка, куда смотреть?
Напиши сортировку пузырьком (Топ 100 популярных алгоритмов для начинающих). Напишет) Точнее найдёт, скопирует вставит). Напиши что угдоно любое простое что я бы нашёл в гугле за 2 секунды скопировал и вставил бы сам)) Вот её хлеб.
Найди в моём коде где лежит кнопка синяя) Найдёт.
И это только малая честь реально рабочих кейсов. И она ну никак не про то что "Напиши мне ШмякБанк приложение чтобы там 1000 000 юзеров и все законы учтены". Ставлю Чистый даже не порванный банкнот 100 баксов, что Когда они достроят свои ЦОД-ы это никак не измениться.
"...Когда человек ошибается, он берёт на себя ответственность, а рост как раз и происходит через ответственность, значит, через ошибки..."
Видел толпы людей, которые делают ровно наоборот, как в песне - "и никаких последствий нет, свали в туман, запутай след". А потом ещё и начальство приходит и говорит ну у нас тут ведьм не сжигают, ругать никого не надо. А человек, который обделался такой - о нормально. Значит можно так постоянно.
Лишь немногие признают свои ошибки. Остальные просто стрелки переводят и следы путают и врут.
Так что ошибки это плохо. Представьте что Вас оперирует нейрохирург и он такой ошибся и вы мертвы.
Ошибки - плохо. Но без них никуда. Неошибается тот, кто ничего не делает. Но и есть вещи где ошибки недопустимы. Рассматривать ошибки как рост - странно. Потому что не все берут за них ответственность, а лишь единицы.
Вобщем рост через ошибки это скорее исключение чем правило.
Ну Agile же. Есть двух недельный спринт- на любую задачу срок 14 дней. За 14 дней можно 2 раза создать человечество. Спросите у биг-босса - Он подтвердит.
Лучше просто копировать нужные папки и файлы. Так Вы полностью контроллируете что будет внутри.
Установку библиотек следует сбилдить в 1 докер img, который положить в свой docker registry. Когда речь про микросервисную разработку - так удобнее. А от него уже наследоваться. И плодить микросервисы.
Потому что микросервисы на 1м проекте как правило используют одни и те же библиотеки.
На тему вайб кодинга понравилось видео одного толкового разработчика. Где он хвалил курсор и сказал с гордостью, что теперь он вайб кодер. Что он просит агента сгенерировать код, через методологию TDD. У него на входе 4000 строк промта в папке .cursor/rules. И он ещё через скопировать вставить промпт в запрос запихивать строчек на 500 в сам запрос того чего надо сделать. И агент ему выдаёт рабочий продакшн код. А после этого он говорит что надо тщательно самому проверить написанные агентом тесты. И код позапускать и подебажить. Ибо гонки иногда случаются.
А ему кто-то сказал - ты агент кодер. А не вайб кодер.
Вайб-кодинг - это игрушка и будущее у него как у спинера. Агент-кодинг - инструмент
Статья полезная +-. Не хватило объяснения сути и принципиальной разницы между шардом и репликой. Что реплика, что шард требуют дополнительных мощностей. Реплика может решить добрую половину если не больше проблем с перегрузками. И конечно же есть то самое, когда пора делать шарды. Когда реплика уже не помогает. И оно там что-то наверное связано с объёмом хранимых данных и упором на дисковую память, которая не бесконечна.
Мне всегда казалось, что шарды точно надо делать тогда, когда память на диске кончилась, чтобы новые данные принимать.
Что шарды - это про хранение как таковое. И в первую очередь про запись данных. А масштабировать чтение через шарды - это как раз экзотика в виде геораспределенки. Потому что, когда мне хватает диска - я отмасштабирую чтение репликами и буду прав. Если у меня данные вмещаются на 1 nvme диск - шардить смысла особого нет. Преимущества перед репликами не будет. Шило на мыло.
Другая сторона - у меня перекос операций записи не знаю ×10 по отношению к чтению. Тогда я сразу беру шардинг, потому что балансировка операций записи в разные диски/шарды будет работать быстрее. И себя окупит. А вот реплика в этом случае будет замедлять систему.
Вобщем я отчасти согласен с Вашим рецептом про индексы и другие способы оптимизации чтения. Но Шарды это всегда больше про оптимизацию записи и увеличение общего объёма хранилища, чем про оптимизацию чтения. Да, через шардинг можно и чтение оптимизировать, но опять же жертвуя железки на этот самый шардинг. То есть не оптимизировать, а масштабировать горизонтально. При условии что мы точно не ошиблись и не воткнули шард туда, где была нужна реплика. А ещё как Вы правильно сказали надо с ключём и функцией шардирования не ошибиться.
Но всё же в первую очередь выбор шардить или нет он начинается не с того, что нам индексов не хватает. А с того, какой объём данных мы собрались хранить. И с того какое у нас соотношение между чтением и записью. Если мы 100 раз в секунду пишем и 1 раз в минуту читаем - то мы будем шардить сразу. Реплицировать тоже будем, но чисто для обеспечения отказоустойчивости. Чтение там будет уже на вторых, если не третьих ролях
Пора брать в руки ружья! И при случайном найме волка на работу - увольнять его по статье. Таких потом в уборщики не возьмут. Не то что в IT.
Понаплодились лжецы всякие с шакалами. А ещё у них ЛЛМ теперь есть чтобы врать лучше. Да приходите к нам работать матрицы ради хоть на 500к в месяц, ток потом не нойте что Вас по статье уволят уже на второй месяц.
Такое увольнение заносится в трудовую книжку. И любой hr, увидев в трудовой такую запись - не будет нанимать такого сотрудника.
Гнать в шею их. Метлой поганой.
В IT нужны не волки - а динозавры. Гиганты мысли. А не шакалы голодные до денег.
Фаулер и Боб писали свои книжки когда на свете не было СМЭВ и ГОсуслуг которые интегрируются чеинз СМЭВ. И они 1С в глаза не видели просто. Где на одну кнопку "Провести и закрыть" повешано 10000 операций над системой потому что пользователям лень нажимать 10000 кнопок.
На Qwen32b Поедет такая лена?
Надоело закидывать баксы этим всяким клодам. Подумывается собирать мини серваки с тремя rtx4090 или даже двумя.
Чтобы экономия была реально разумной. А то иной раз за день прожигает 500 баксов. Чтоб я ещё раз этого краба запустил, клешню ему в брюхо.
Вот и думается, в месяц тратишь 3000 баксов на клода. Может тупо собрать сервак себе на эти бабки.
Я думаю что заменять ручной труд на машинный надо покупками машин, а не подписок в где то там. Ну снял офис, вместо людей наставил системники. Ноутбуки распродал, которыми люди пользовались, часть направил на мини серваки. И вот - заменился труд рутинный.
А клоды шмоды эти сегодня 20 баксов, потом 40. Потом у них суперакции и ещё впн этот проплачивай. А РФ чебурнетиться останавливаться не планирует. Отрезаться хочет от интернета глобального.
"Нужно было запоминать всё: от настройки серверов и баз данных до верстки пользовательского интерфейса и бизнес-логики. Наш мозг — невероятная штука, но на такое он вряд ли способен".
Ну у кого как. А у нас до появления нейронок - надо cicd построить, пошлли сделали, надо архитектуру на на 100к+ юзеров - пошли сделали. В кликхаусе/пг запросы кластер тормозять - пошли оптимизировали. Кластеры нажо поднять - пошли подняли. В даных заказчика разобраться - пошли разобрались. Olap drill down закрутить - пошли сделали.Хайлоад бекенд запилить без утечек памяти и с вменяемым латенси - пошли сделали.
Единственное фронт казался скучным. Кнопки красить лень.
Ура появились нейронки. И теперь мы всем говорим, что всё делаем с их помощью. А то вдруг не поверят. А на практике подписка на 20 баксов сгорает за 1 день.
Каков Ваш опыт нейросеток - ну токены экономлю, контекст минимализирую, sdd использую. Задачи декомпозирую. Один день пших и нет токенов. Написала машинка 5к строк кода +- рабочих. А я и так в день по 10к писал кода и рабочего на 100% и тестами закрытого.
Они там продуктовтв агень кодинг и мечты у них.Что там продакты разработку потянут. А я тут недавно кароче вайбкодить в бизнес пошёл. И оказалось что для своего бизнеса 9 классов образования хватит.
И мне вот интересно, кто быстрее через агентов достигнет прогресса? Те, кто нихренатне шарит в разработке, но понимает деньги? Или те кто понимает вдоль и поперек всю разработку, но не было интереса понимать деньги?
Деньги же ну это сложно же)) Или в них даже вайбкодинг справиться? Даже без sdd)
Не хватает контекста. Что вот самого нового появилось. SDD, spek-kit, openclaw. Те кто не шарит ни в чем - кричат революция. Те кто пощупал - рука-лицо и мысли - да уж, "прогресс".
Не освещены темы с генеративными ошибками (галлюцинациями), и что у llm не меняется фундамент. Корпы ушли тоже деньги зарабатывать, а фундаментальные проблемы своих моделей облепили кастылями. Которые вроде работают иногда. Поэтому инженер будущего должен лучше llm понимать что она там нашкодила. А это не джуновский навык.
Единственное интересное - фотонный чип. Который должен увеличить мощности вычислений, прекратив отнимать у людей электричество мегаваттами. Но когда его в производство запустят - не понятно. Но он тоже не решит фундаментальные проблемы llm. Физикой не обойти законы математики.
Во что это превратиться через 5 лет? Выйдет gpt7, который лучше себя самого на 30% в бенчмарках пойди разберись и пойми. На рынок хлынет поток чудо проектов, закрывающих дырки. Которые через раз справляются с задачами. И все на столько обленяться, что будут просто гооворить ну ллм ошиблась, бывает. Упадет качество создаваемых решений. Но оно и перестанет всех волновать. Ведь если мой бот в телеге тупанул - ну и что. А если попросил перевести 1млн себе из банка в банк - а оно тупануло и отправило деньги в фонд пожертвований развития ллм. Люди пошли просить ллм проверить что не так, оно проверило и сказало что всё нормально. А сами люди уже не в состоянии понимать что внутри их систем происходит - это же не модно, как и код писать руками, фу.
Бедные работодатели не смогли ничего побороть. А Наташка из соседнего подъезда с девятью классами образования качнула бесплатную лабуду и продолжает в инсте фотки свои публиковать как и публиковала.
При всем желании ни у кого ничего не получиться. Полностью отрубить можно только электропитание. А на всё остальное найдется 100500 дырок.
Так ваш протобаф гошный может сразу и в хттп и в грпс.
Я Думал все гоферы с молоком матери начинаюь сначала протобаф описывать, а потом проток генерейть и готов хендлер какой хошь. Проток мок и вот тебе заглушки товарищь фронтендер.
Апи фесту уже 1000 лет в обед.
А SDD - спекулянтус дривнус девелопментус - это шкодерам жизнь проделвает. Написал спеку для ллм. А она тебе пофиг какой код, главное чтоб лампочками моргал)
Самый длинный срач про sdd - спек дривен девелолупмент.
Можно так жить - да. А Нужно?
Беру кароче проект на 100к человек из 70 микросервисов. Пешу кароче спеку.
Прошу модель явить чудо. На первом запросе получаю - слишком длинная спека. Не влезает в 200к токенов.
Декомпозирую. Обкладываюсь рагами, спеками по спекам. Вики на чики брики. Глоссарий планетарий. Настраиваю это добро 6й месяц к ряду. Напечатал и нанейронил текста столько сколько все писатели в мире не написали. Допустим всё это сделал.
Опять иду в чудо окно - сделай фикс на микросервис такой то. Вот тебе все 1000+ спеков. В контекст 200к влезли. Фикс сделали. Тесты сделали. Всё сделали. Пошли на прод залили. Через день уже другой сервис грохнулся. Потому что был связан с этим и модель там поле новое влепила в субд.
ПРосим рефлексировать. Чейонфтрушиться. Черепашиться и скрам мастериться через в себя. Запускаем 100 агентов. Проблема дюже сложная. Они вместе пыжат. Мексикснцы опять без света сидят. 10 000 баксов закинули на токены. Супер мега модель всего включили. И всё! Решена задача. Отлично.
А теперь без нейронок. Крепкий спец, который на проекте год, увидев 4 строчки логов в 2х сервисах такой хм. Написал 5 строчек там, 7 строчек тут. Задеплоил и забыл. Всё работает. Потратил свою энергию на кхм. Это было самое сложное
Проще говоря, модель:
сначала ищет релевантную информацию;
Вот это ещё одна типичная ошибка при построении RAG систем. Объяснять это так менеджерам и бизнесу особенно. Что модель хоть что то делает в этом процессе, кроме как ртом своим пережёвывает информацию.
Придумали кучу кастылей вокруг текстового генератора и понесёсся словестный понос со всех щелей уже который год одно и тоже.
Ничего не умеет делать llm модель сама.
Пгшечку берут для транзакций. Чтобы не попадать в ситуцию "Ваш заказ оплачен, но не создан, платите ещё раз". Возник кейс кей валуэ - читаем что такое вообще КЭШ. И сначала храним его в своей голове. А уже если этого не хватает берём куй валуя в виде редис. Сравнить это всё в одном месте ток нейронка могла. Ей да наплевать на здравый смысл. А почему кликхауса тут нет кстати? В него тоже можно кей велью сохранить. Ну или кафки?
Чё ребят. Откроем филологам Америку? Что код надо уметь читать двумя полушариями. Одним - как человек и там нам обычно плевать что и как называется, главное - какие комментарии написаны.
Вторым - читать код как компьютер. А ему 100% плевать что и как называется. Он там функцию увидел, параметры отсканировал из памяти значения достал и дальше по стеку плюнул.
Если бы компьютер думал над тем как мы там назвали переменную - с ума бы наверное сошёл. Пришлось бы программировать калькулятор на майнинг фермах.
Всем добра. Прочитал комментарии. И статью. Тоже решил вытащить голову из пещеры и высказать мысли.
Вайб-шкодинг. Коротко о том почему он не работает.
Запрос: "Покрой функцию @Функция тестами"
Промпт: (500 строк, не больше, ибо вайб же): Ты сеньор программист. Ты знаешь стандарты. Ты крутой перец. Если забыл стандарты - вот ссылки. Ты сам себя проверяешь. Ты никогда не булшитишь. Ты мощный. Пиши с кайфом...
Дай боже хоть что-то техническое в промпт будет вписано, Аля Используй контекст7. Или я тебе там MCP сервер подрубил. Ну типо Сеньор-Вайбкодер, в теории, наверное, впишет про технику чуток того, что он понял/подсмотрел/украл/взялИзНейросетки.
Агент кодинг. Почему он работает.
Запрос: "Покрой функцию @Функция тестами" <- ВООБЩЕ НЕ МЕНЯЕТСЯ.
Промпт: 5000+ строк на английском языке, в которых методично передан весь накопленный РЕАЛЬНЫЙ сеньорский 10+ лет опыт в программировании, тестировании архитектуре и разработке ПО как таковой. В этим промптах как ребёнка Сеньор-Методист ведёт LLM за ручку по миру программирования и тестирования, разжёвывая ему как тупому валенку базовые и сложные принципы - от того как писать переменную, до того как нужно правильно закрывать тест кейсы, руководствуясь проверенными на практике принципами, которые точно работают. Такие промпты пишутся путём тщатильного анализа того, что именно нейросеть делает не так. И когда она что-то делает не то, ей опять разжёвывается через ПРИЗМУ СВОЕГО ПРАКТИЧЕСКОГО опыта как сделать то что нужно.
Так рождается МЕГА/ЧУДО/GOD-Промт, недостижимый для вайбера. Решающий ОДНУ конкретную задачу.
И это ключевая Разница. Когда у Вас вообще нет опыта в разработке например Масштабных микро-сервисных систем, так называемой школы жизни кровавого энтерпрайза - ВАМ ПРОСТО НЕЧЕГО вложить ни в запрос к LLM ни в Промпт. А всё что нейронка нажевала в интернете - это средняя по больнице лабуда.
И как только результат надо получить выше среднего - тут то и начинается веселье. Он недостижим для Вайбкодеров. У них опыт писать промпты. У нейронки жевать промпты и примерять на усреднённый результат того, что она спиздила в интернете. Да, иной раз она может утащить без ведома людей из их проекта что-то реально прикольное и показать Вам - тип о, оптимизировалось. Но это как игра в лотерею. В своей основе - Агенты LLM и вся эта нечисть болотная - просто быстрее и лучше находит информацию. Чем гугл поиск или стек оверфлоу.
И по итогу - все опять идут к нам, к людям, для которых писать код, создавать сложные большие системы - никогда не было и не будет какой-то там проблемой, которую срочно решить бежать надо. Кто прошёл кровавый энтерпрайз - среди них даже у джунов нет проблемы с написанием кода, созданием фич и багофиксаньем. В системах, где 10-ки сервисов через друг в друга данные гоняют. Они решают эти задачи за чашкой-другой кофе и 2-мя печеньками.
А Текущая ситуация с LLM - Илон Маск пошёл строить ЦОД, размером с пол города. Сожрёт Сколько-то там Гигават электро энергии. И оставит реальных живых людей без этой электро энергии. На это потратят баснословные деньги а ещё на суды и бюрократию. Миллиарды долларов. Бюджет какой-нибудь не сильно крупной страны)
Это просто для тех информация кто думает, что он навайбил там штукодрюку. Она жрёт 64Гб оперативки и автоматизировала заказ билета на Туту.ру для 1-го пользователя. Что это никак решать не надо будет - КОНЕЧНО - Вы просто также с кайфом навайбите себе железа на миллиард рублей)) Я в Вас "Верю", потому что "отстал" от жизни и у меня наверное у одного миллиарда рублей нет на оборудование.
Да нет - ВЫ ничего не понимая в оптимизацию и архитектуру. Попросите нейрноку всё Вам сделать. И будет просто "конфетище")) А на практике вы сожжёте все свои токены в первый же день и пойдёте покупать ещё токены. И ОНИ - владельцы этих чатов это знают прекрасно) И толкают Вас туда - Вайбить, Вайбить, Вайбить))) Им то наплевать по большому счёту, сделаете ли Вы реально масштабируемый и производительный и мощный и всему миру нужный продукт. Токены же купите) Ибо чёт не оптимизировалось. Не пошло. Упёрлось в стену. Наверное надо КНОПКУ волшебную оплатить - DEEP REASON - 2000 баксов за месяц.
Она то "Сможет". И хоп - не смогла. Надо оплатить её ещё раз. Наверное не туда платили. Пойдём купим ещё кнопок и подписок у других поставщиков. Вдруг случиться чудо - и опять нет, не случиться.
Вобщем - хотите стань инжинерами - учитесь. Учитесь сами, качайте нейронку)
Это в конечном итоге - Лопата, а не шахтёр. Лопата хорошая, копает отлично. И быстро.
Может снизить нагрузку на рутину. Напиши тест, сделай рефакторинг. Объясни логику, сформируй документацию. Объясни по этому логу что в итоге за ошибка, куда смотреть?
Напиши сортировку пузырьком (Топ 100 популярных алгоритмов для начинающих). Напишет) Точнее найдёт, скопирует вставит). Напиши что угдоно любое простое что я бы нашёл в гугле за 2 секунды скопировал и вставил бы сам)) Вот её хлеб.
Найди в моём коде где лежит кнопка синяя) Найдёт.
И это только малая честь реально рабочих кейсов. И она ну никак не про то что "Напиши мне ШмякБанк приложение чтобы там 1000 000 юзеров и все законы учтены". Ставлю Чистый даже не порванный банкнот 100 баксов, что Когда они достроят свои ЦОД-ы это никак не измениться.
Так а в чём проблема консольные истории в докер запихать?
Засунул в докер, подмазал, подкрасил, подшпаклевал. Навешал метрик. И готово.
Опенсорс же. Он всегда такой был.
"...Когда человек ошибается, он берёт на себя ответственность, а рост как раз и происходит через ответственность, значит, через ошибки..."
Видел толпы людей, которые делают ровно наоборот, как в песне - "и никаких последствий нет, свали в туман, запутай след". А потом ещё и начальство приходит и говорит ну у нас тут ведьм не сжигают, ругать никого не надо. А человек, который обделался такой - о нормально. Значит можно так постоянно.
Лишь немногие признают свои ошибки. Остальные просто стрелки переводят и следы путают и врут.
Так что ошибки это плохо. Представьте что Вас оперирует нейрохирург и он такой ошибся и вы мертвы.
Ошибки - плохо. Но без них никуда. Неошибается тот, кто ничего не делает. Но и есть вещи где ошибки недопустимы. Рассматривать ошибки как рост - странно. Потому что не все берут за них ответственность, а лишь единицы.
Вобщем рост через ошибки это скорее исключение чем правило.
Ну Agile же. Есть двух недельный спринт- на любую задачу срок 14 дней. За 14 дней можно 2 раза создать человечество. Спросите у биг-босса - Он подтвердит.
COPY . .
И потом огромный пухлый .dockerignore.
Лучше просто копировать нужные папки и файлы. Так Вы полностью контроллируете что будет внутри.
Установку библиотек следует сбилдить в 1 докер img, который положить в свой docker registry. Когда речь про микросервисную разработку - так удобнее. А от него уже наследоваться. И плодить микросервисы.
Потому что микросервисы на 1м проекте как правило используют одни и те же библиотеки.
На тему вайб кодинга понравилось видео одного толкового разработчика. Где он хвалил курсор и сказал с гордостью, что теперь он вайб кодер. Что он просит агента сгенерировать код, через методологию TDD. У него на входе 4000 строк промта в папке .cursor/rules. И он ещё через скопировать вставить промпт в запрос запихивать строчек на 500 в сам запрос того чего надо сделать. И агент ему выдаёт рабочий продакшн код. А после этого он говорит что надо тщательно самому проверить написанные агентом тесты. И код позапускать и подебажить. Ибо гонки иногда случаются.
А ему кто-то сказал - ты агент кодер. А не вайб кодер.
Вайб-кодинг - это игрушка и будущее у него как у спинера. Агент-кодинг - инструмент
Статья полезная +-. Не хватило объяснения сути и принципиальной разницы между шардом и репликой. Что реплика, что шард требуют дополнительных мощностей. Реплика может решить добрую половину если не больше проблем с перегрузками. И конечно же есть то самое, когда пора делать шарды. Когда реплика уже не помогает. И оно там что-то наверное связано с объёмом хранимых данных и упором на дисковую память, которая не бесконечна.
Мне всегда казалось, что шарды точно надо делать тогда, когда память на диске кончилась, чтобы новые данные принимать.
Что шарды - это про хранение как таковое. И в первую очередь про запись данных. А масштабировать чтение через шарды - это как раз экзотика в виде геораспределенки. Потому что, когда мне хватает диска - я отмасштабирую чтение репликами и буду прав. Если у меня данные вмещаются на 1 nvme диск - шардить смысла особого нет. Преимущества перед репликами не будет. Шило на мыло.
Другая сторона - у меня перекос операций записи не знаю ×10 по отношению к чтению. Тогда я сразу беру шардинг, потому что балансировка операций записи в разные диски/шарды будет работать быстрее. И себя окупит. А вот реплика в этом случае будет замедлять систему.
Вобщем я отчасти согласен с Вашим рецептом про индексы и другие способы оптимизации чтения. Но Шарды это всегда больше про оптимизацию записи и увеличение общего объёма хранилища, чем про оптимизацию чтения. Да, через шардинг можно и чтение оптимизировать, но опять же жертвуя железки на этот самый шардинг. То есть не оптимизировать, а масштабировать горизонтально. При условии что мы точно не ошиблись и не воткнули шард туда, где была нужна реплика. А ещё как Вы правильно сказали надо с ключём и функцией шардирования не ошибиться.
Но всё же в первую очередь выбор шардить или нет он начинается не с того, что нам индексов не хватает. А с того, какой объём данных мы собрались хранить. И с того какое у нас соотношение между чтением и записью. Если мы 100 раз в секунду пишем и 1 раз в минуту читаем - то мы будем шардить сразу. Реплицировать тоже будем, но чисто для обеспечения отказоустойчивости. Чтение там будет уже на вторых, если не третьих ролях
Пора брать в руки ружья! И при случайном найме волка на работу - увольнять его по статье. Таких потом в уборщики не возьмут. Не то что в IT.
Понаплодились лжецы всякие с шакалами. А ещё у них ЛЛМ теперь есть чтобы врать лучше. Да приходите к нам работать матрицы ради хоть на 500к в месяц, ток потом не нойте что Вас по статье уволят уже на второй месяц.
Такое увольнение заносится в трудовую книжку. И любой hr, увидев в трудовой такую запись - не будет нанимать такого сотрудника.
Гнать в шею их. Метлой поганой.
В IT нужны не волки - а динозавры. Гиганты мысли. А не шакалы голодные до денег.
Фаулер и Боб писали свои книжки когда на свете не было СМЭВ и ГОсуслуг которые интегрируются чеинз СМЭВ. И они 1С в глаза не видели просто. Где на одну кнопку "Провести и закрыть" повешано 10000 операций над системой потому что пользователям лень нажимать 10000 кнопок.
Раньше вроде все эти три вопроса умещались в 1 - Кем вы видите себя через 3-5 лет в нашей компании?
Директором.
Вы приняты.
Открыл. Не увидел привязку всего описанного к метрикам железа в графане - закрыл.