Потому что он просто принимал что выдаёт LLM. Нужно всегда проверять что выдаёт сеть и держать её на поводке. Я тоже делаю себе плагины и небольшие приложения до 10 тысяч строк и тоже ничего не понимаю в коде. Через месяц тыкания уже начинаешь ориентироваться и в том как он пишет и что он пишет.
В котором работает только 4o, который уже никуда не годится, с контекстным окном (32к токенов) Против Sonnet 3.5 (128к токенов). При этом Claude кеширует и оптимизирует файлы. Закиньте pdf размером 1 мб в ChatGPT и вам скажут память забита, а в Claude 5-10%
У Claude есть одно большое преимущество. Можно в проект подгрузить доки по теме(инструкции, API) и получать каждый раз адекватный ответ, не требующий поправок.
Если выкладывают код с ошибками, значит просят помочь исправить ошибку. Это ничем не отличается от обычной практики на stackoverflow. Просто мертвый код публиковать какой смысл? Он допускает 40% ошибок, но это же не значит что их не правят вручную.
Файлы он крайне проблемно читает, по крайней мере через обычную подписку. Скинешь файл на 2000 строк, он прочитает рандомные 100 и скажет вам надо подумать как все это исправить самому.
А так же для o1 не умения читать прикрепленный файлы. Вернее функция есть, но толком не работает. А вот sonnet с легкостью переваривает прикрепленные документы от первого до последнего символа.
Неправильно выразился наверно. Я имел ввиду встраивать LLM в цепочку автоматизации производства, к примеру. Когда напрямую с чат ботом задачи решаешь, то видишь все его ошибки и можно своевременно поправить.
У Antropic не лучше. Когда выпустили обновлённую Sonet 3.5, то после достижения лимитов появлялось сообщение что вы достигли лимита Sonet 3.5, но вы можете использовать Sonet 3.5 Имелось ввиду предыдущую версию, но никаким боком это не упоминалось. А у ChatGPT 4o по достижению лимитов пишет что вы достигли лимитов ChatGPT4 и пока они не сброисились, то можно пока что использовать ChatGPT 4o. facepalm.jpg
Честно говоря, непонятно как можно серьёзно работать с LLM сейчас. Они в 90% искажают факты, придумывают отсебятину, ловят галюцинации и так далее. В целом хорошо, но в деталях всегда нужно перепроверять, то есть непонятно как это ставить на автоматизацию.
8192 токена у ChatGPT было во времена версии 3.5 Сейчас окно 128к токенов
Ну накодил он что крыша откинулась, а тестить разве это не надо? Понятно что опыт решает, но до крайностей то не доводите.
Antropic не раньше августа следующую модель выкатят
Да оно там вообще без разбору секирой рубит
Потому что он просто принимал что выдаёт LLM. Нужно всегда проверять что выдаёт сеть и держать её на поводке. Я тоже делаю себе плагины и небольшие приложения до 10 тысяч строк и тоже ничего не понимаю в коде. Через месяц тыкания уже начинаешь ориентироваться и в том как он пишет и что он пишет.
В котором работает только 4o, который уже никуда не годится, с контекстным окном (32к токенов)
Против Sonnet 3.5 (128к токенов). При этом Claude кеширует и оптимизирует файлы. Закиньте pdf размером 1 мб в ChatGPT и вам скажут память забита, а в Claude 5-10%
У Claude есть одно большое преимущество. Можно в проект подгрузить доки по теме(инструкции, API) и получать каждый раз адекватный ответ, не требующий поправок.
С LLM моделями чуть сложнее, так как для них очень сильно нужно обрезать возможность неправильно понять контекст задавая вопрос.
Она там на всех возможных языках рассуждает, но почему-то заметили только китайский.
У меня бывало пол слова на английском, пол слова на русском. Например, Posиция.
Через 10 лет и сеньоры будут не нужны.
Если выкладывают код с ошибками, значит просят помочь исправить ошибку. Это ничем не отличается от обычной практики на stackoverflow. Просто мертвый код публиковать какой смысл? Он допускает 40% ошибок, но это же не значит что их не правят вручную.
Который по качеству ничем не отличается от человеческого, так как тренировался на примерах людей...
Файлы он крайне проблемно читает, по крайней мере через обычную подписку. Скинешь файл на 2000 строк, он прочитает рандомные 100 и скажет вам надо подумать как все это исправить самому.
А так же для o1 не умения читать прикрепленный файлы. Вернее функция есть, но толком не работает. А вот sonnet с легкостью переваривает прикрепленные документы от первого до последнего символа.
Вы забыли про контекстное окно. 32к у o1 против 128к у Sonnet 3.5
Неправильно выразился наверно. Я имел ввиду встраивать LLM в цепочку автоматизации производства, к примеру. Когда напрямую с чат ботом задачи решаешь, то видишь все его ошибки и можно своевременно поправить.
Я каждый день работаю по несколько часов с ChatGPT 4o, o1 и Sonnet 3.5
Какие есть новые и качественные модели, которые не имеют вышеописанных проблем?
У Antropic не лучше. Когда выпустили обновлённую Sonet 3.5, то после достижения лимитов появлялось сообщение что вы достигли лимита Sonet 3.5, но вы можете использовать Sonet 3.5 Имелось ввиду предыдущую версию, но никаким боком это не упоминалось. А у ChatGPT 4o по достижению лимитов пишет что вы достигли лимитов ChatGPT4 и пока они не сброисились, то можно пока что использовать ChatGPT 4o. facepalm.jpg
Честно говоря, непонятно как можно серьёзно работать с LLM сейчас. Они в 90% искажают факты, придумывают отсебятину, ловят галюцинации и так далее. В целом хорошо, но в деталях всегда нужно перепроверять, то есть непонятно как это ставить на автоматизацию.