Из 100 игр автор выделил нормальными 42 игры, это 42%. что не есть плохо. Как замена программистов - точно нет, но как хороший буст в разработке для инди-студий, вполне себе я считаю. как только эффективность нейросетей вырастет до 51-53% примерно из 100 игр, то это уже критический успех, так как даже люди без отладки не могут сделать продукт сразу рабочим
Понятное дело что хотели выкатить 5-ую модель и показать её, но почему не оставили условную вкладку "предыдущие модели" с правом выбора для пользователя
я как-то раз спросил про бренд холодильника SUMSANG (опечатавшись), модель не стала поправлять себя и придумала что да, в действительности в севереной Кореи есть такие холодильники и они просто для внутреннего рынка и потому о них нет информации, а так они существуют в самом деле. правда это было порядком времени назад
Из 100 игр автор выделил нормальными 42 игры, это 42%. что не есть плохо. Как замена программистов - точно нет, но как хороший буст в разработке для инди-студий, вполне себе я считаю. как только эффективность нейросетей вырастет до 51-53% примерно из 100 игр, то это уже критический успех, так как даже люди без отладки не могут сделать продукт сразу рабочим
Понятное дело что хотели выкатить 5-ую модель и показать её, но почему не оставили условную вкладку "предыдущие модели" с правом выбора для пользователя
Ага, именно поэтому ChatGPT льстит пользователю везде подряд)
я как-то раз спросил про бренд холодильника SUMSANG (опечатавшись), модель не стала поправлять себя и придумала что да, в действительности в севереной Кореи есть такие холодильники и они просто для внутреннего рынка и потому о них нет информации, а так они существуют в самом деле. правда это было порядком времени назад
Скорее бы релиз. хочется пощупать уже и сравнить его с Grok-4 в реальных задачах, а не бенчмарках