Я не понял примера... я обычно для таких задач chatGPT прошу поменять значения. Делов то, зачем тут ваш Си? LLM как интерпретатор 10/10. Ну или хотя бы эксель.
Ps на сколько я знаю компиляторы умеют такое оптимизировать. Но Змею обидеть может каждый.
Что такое кода бейз? Файнтюн квена? А "про" насколько swe "pro"?
И да..мне лень гуглить, если это гдето написано.
русский маркетинг безпощадный - такие приемы только отталкивают от всех "ру" моделей. Как один зеленый банк распиарил модель по всем новостям в мае 2024(?), а на выходе - ни бе ни мэ на змеином.
Где тут GPT увидели то, тут даже знаки препинания после пробелов.
Единственный sus момент - точка с запятой, их gpt обожает. Но остальное - точно человек писал, я кстати поэтому не осилил...с первого раза, разучился рассказы читать. Gpt бы лучше справился с изложением фактов. Написал баш -> получил офер.
Все, кто хоть немного в ml шарят(точнее я слушаю мнение про ИИ только тех, кто в ML работает), идут от обратного: жёстко проектируют архитектуру, добавляют качественные примеры кода и потом по выверенному плану запускают агента заполнить куски.
Такой паттерн легко объясним, если разобраться как работает attention и на чем модели учатся.
P.S. Второе мнение и возможность спросить всегда полезны, но это мнение, а не разработка.
Pps я для pet проекта смирился с багами - главное критические узлы задать, чтобы архитектура была, а не месево с кодом. Через полгода модели сделают х3 по скиллу и перепишут плохой код.
Да потому что каждый хочет написать статью и выложить. Раг раг раг раг... эта статья чем лучше "других"? Какую мысль она несёт? Не получилось?
Ответ супер прост: метрики, метрики и мметрики. Глупость какая эти метрики..циферки которые мешают (сарказм)
Далее, Смысл возвращаться чанк? Верните документ по чанку.
А делать раг на эмбедингах одних - это 2023 год, ну 2024.
Claude code и без рага найдет и ответит. Закинуть в гугл док свою библиотеку и спрашивать chatgpt.
А вообще начинать нужно с оценки LLM закинули документ и спросили вопрос. Или спросили вопрос которого нет в документе.
Ps там были какие-то метрики... но толку, как измерение "близости вопрос-ответ" вообще поможет? Есть классика: полнота возвращаемых документов, вернули 100% - значит дальше есть шанс получить правильный ответ. Вернули 10% - нет смысла дальше даже отвечать.
Лучше собирать пользовательский фидбек, чем неправильное исследование с непонятной гипотезой, вероятно людьми которые даже не пытались.
На конфах корпорации рассказывают, у них.по 10-20% сгенерированного кода идёт в прод. А там такие же скептик как вы сидят.
А по фидбеку: тут выше уже приводил ктото свой пример. Мой пример - это навайбкодить полезную Тулу за 3 часа, и отдать в пользование. Смог бы я быстрее? Нет. Я бы 3 часа в формат json втуплял, и кучу словарей. И вообще, моё свободное время - мне важнее.
Но вообще поражают отрицатели реальности, которые ссылаются на "исследование" непонятно кого вместо того, чтобы протестить самим хотя бы.
Может есть гении стучащие по клавиатуре 200 тыс клавиш в секунду.
Или "гении" считающие, что промт "почини баг" - достаточно понятен. Разработчикам не зря менеджерей ставят...первые же не могут в коммуникацию.(да-да, я тоже полуразраб).
Я не понял примера... я обычно для таких задач chatGPT прошу поменять значения. Делов то, зачем тут ваш Си? LLM как интерпретатор 10/10. Ну или хотя бы эксель.
Ps на сколько я знаю компиляторы умеют такое оптимизировать. Но Змею обидеть может каждый.
А если интеллект это еще одна "странная болячка" слепой природы эволюции?
Заплати кожанному мешку и заплати за каждую правку ТЗ.
А тут сразу платишь за правки ТЗ, ну не красота? И чего програмисты плются ?
"Нормальный сотрудник" - все синьйоры-помидоры? или скучные задачи.
LLM мне прекрасные схемы рисует в svg, жалко что у меня нет отдельного эксперта по svg картинкам и презентациям. Тоже 200$ в час такой стоит?
Что такое кода бейз? Файнтюн квена? А "про" насколько swe "pro"?
И да..мне лень гуглить, если это гдето написано.
русский маркетинг безпощадный - такие приемы только отталкивают от всех "ру" моделей. Как один зеленый банк распиарил модель по всем новостям в мае 2024(?), а на выходе - ни бе ни мэ на змеином.
Вы из яндекса?
слышал там там все страдают с NIH синдромом (not invented here).
Ответа я так понимаю не будет. статья неплохая, но использовать - нет, тоже изза NIH.
Так почему не OpenCode? Glm в нем вроде как родной.
Залогиниться в личную почту - не сделает эту почту корпоративной.
Pet-проекты хранить - вот тут риски есть, но вы же выгружаете другие repo из гита? Это не делает их содственность компании.
Почитайте как антропики давали домашнее задание. Можно так. Но тут же найдутся нытики "еще дома что-то делать".
В каждом посте одно и тоже. Поэтому лучше 5 человекочасов потратить чем неделю/месяц на адаптацию. Не того сотрудника под свои процессы.
Никто ничего лучше не предложил.
Я бы ответил на интервью - мой скрипт, как хочу - так и пишу.
Упадет - поправлю, это скрипт.
Где тут GPT увидели то, тут даже знаки препинания после пробелов.
Единственный sus момент - точка с запятой, их gpt обожает. Но остальное - точно человек писал, я кстати поэтому не осилил...с первого раза, разучился рассказы читать. Gpt бы лучше справился с изложением фактов. Написал баш -> получил офер.
Лол (простите за лол).
Все, кто хоть немного в ml шарят(точнее я слушаю мнение про ИИ только тех, кто в ML работает), идут от обратного: жёстко проектируют архитектуру, добавляют качественные примеры кода и потом по выверенному плану запускают агента заполнить куски.
Такой паттерн легко объясним, если разобраться как работает attention и на чем модели учатся.
P.S. Второе мнение и возможность спросить всегда полезны, но это мнение, а не разработка.
Pps я для pet проекта смирился с багами - главное критические узлы задать, чтобы архитектура была, а не месево с кодом. Через полгода модели сделают х3 по скиллу и перепишут плохой код.
Вы сейчас всех js прогоаммистов задели. Как они посмели рисовать формочки и шаблоны непонимая что там происходит. (Я не шарю за js, не бейте меня).
Картинку режьте на стандартные кусочки и все.
Вы бы подсказали с какими метриками нужно возиться.
Вы сначала купите пару H100. Вы совсем от реальности оторваны.
А вы статью как назвали?
Я не согласен с метриками...они абсолютно бессмысленные...впрочем, это даже не метрики.
Да потому что каждый хочет написать статью и выложить. Раг раг раг раг... эта статья чем лучше "других"? Какую мысль она несёт? Не получилось?
Ответ супер прост: метрики, метрики и мметрики. Глупость какая эти метрики..циферки которые мешают (сарказм)
Далее, Смысл возвращаться чанк? Верните документ по чанку.
А делать раг на эмбедингах одних - это 2023 год, ну 2024.
Claude code и без рага найдет и ответит. Закинуть в гугл док свою библиотеку и спрашивать chatgpt.
А вообще начинать нужно с оценки LLM закинули документ и спросили вопрос. Или спросили вопрос которого нет в документе.
Ps там были какие-то метрики... но толку, как измерение "близости вопрос-ответ" вообще поможет? Есть классика: полнота возвращаемых документов, вернули 100% - значит дальше есть шанс получить правильный ответ. Вернули 10% - нет смысла дальше даже отвечать.
Лучше собирать пользовательский фидбек, чем неправильное исследование с непонятной гипотезой, вероятно людьми которые даже не пытались.
На конфах корпорации рассказывают, у них.по 10-20% сгенерированного кода идёт в прод. А там такие же скептик как вы сидят.
А по фидбеку: тут выше уже приводил ктото свой пример. Мой пример - это навайбкодить полезную Тулу за 3 часа, и отдать в пользование. Смог бы я быстрее? Нет. Я бы 3 часа в формат json втуплял, и кучу словарей. И вообще, моё свободное время - мне важнее.
Но вообще поражают отрицатели реальности, которые ссылаются на "исследование" непонятно кого вместо того, чтобы протестить самим хотя бы.
Кто наблюдал, какие разработчики? Какой язык?
Может есть гении стучащие по клавиатуре 200 тыс клавиш в секунду.
Или "гении" считающие, что промт "почини баг" - достаточно понятен. Разработчикам не зря менеджерей ставят...первые же не могут в коммуникацию.(да-да, я тоже полуразраб).