А так же для o1 не умения читать прикрепленный файлы. Вернее функция есть, но толком не работает. А вот sonnet с легкостью переваривает прикрепленные документы от первого до последнего символа.
Неправильно выразился наверно. Я имел ввиду встраивать LLM в цепочку автоматизации производства, к примеру. Когда напрямую с чат ботом задачи решаешь, то видишь все его ошибки и можно своевременно поправить.
У Antropic не лучше. Когда выпустили обновлённую Sonet 3.5, то после достижения лимитов появлялось сообщение что вы достигли лимита Sonet 3.5, но вы можете использовать Sonet 3.5 Имелось ввиду предыдущую версию, но никаким боком это не упоминалось. А у ChatGPT 4o по достижению лимитов пишет что вы достигли лимитов ChatGPT4 и пока они не сброисились, то можно пока что использовать ChatGPT 4o. facepalm.jpg
Честно говоря, непонятно как можно серьёзно работать с LLM сейчас. Они в 90% искажают факты, придумывают отсебятину, ловят галюцинации и так далее. В целом хорошо, но в деталях всегда нужно перепроверять, то есть непонятно как это ставить на автоматизацию.
Оплачивал Claude с предоплаченных карт Visa с первых попавшийся сайтов. Хоть оплата и встроена в интерфейс Antropic, но этот тот же stripe. Самое большое преимущество Claude это умение полностью читать прикреплённые файлы, а не как у ChatGPT, который читает случайную выборку из 1000 символов и посылает тебя далеко и подальше.
Я просто ставлю Ubuntu раз в 5 лет, смотрю на весь этот зоопарк UI. Честное слово, как в 90ые возращаюсь. Отступы текста от краев окон по человечески сделать не могут. Какие-то вырвиглазные шрифты и прочие кривости. Выключаю, удаляю. Смотрю скриншоты других видов в нете. Забываю про линукс ещё на 5 лет.
К слову, на макоси окно настроек открываешь и этот вид тоже вызывает испанский стыд.
Я каждый день с кодом работаю с ChatGPT и Calude и если первый промт приходится расписывать хоть как-то, то потом больше двух строк не пишу. Да, бывает начинает глючить проще перенести базу в новый чат. Но в новом чате уже ничего не объясняю, а просто продолжаю как если бы продолжал в старом.
У вас же диалог не закрылся, напишите правки и он адаптируется. Не с первого раза напишет, так со второго. А вообще, чем больше код у него будет в памяти, тем меньше ему объяснять надо что, зачем и почему.
Я не из деревни и кодить как раз начал с помощью 4o пару месяцев назад. Он сам подсказывает что установить и в каком порядке. Иногда это сложно понять, особенно когда он названия меню называет иначе. Часто путает проект и решение, но тут уже руку набиваешь и адаптируешся к тому, что он постоянно что-то отвечает не точно. Про Git он мне ничего не сказал, я задался этим вопросом, когда замучился бекапить проект копированием папки и сравнением изменения кода. О Git я узнал пару недель назад и плакал))) Установка 2 минуты, никаких сложностей создать репозиторий. Сложнее всего это работать с ним когда ты вообще 0, но потихоньку разбираемся.
И как вы проверили? Типа компилируется -- значит работает?
Нет. Согласно промту собрал по условиям данные, отсортировал и выдал результат в структурированном, ожидаем виде. После этого вручную проделал ту же задачу несколько раз в разных примерах. Если повторяемость 100%, идем дальше. Вводишь новую функцию, проверяешь на совместимость с предыдущими и т.д. Я не заказ для кого то делаю, по расплывчатому тз, а делаю программу для себя. Я прекрасно понимаю что она должна делать и какой результат должна выдавать и всегда могу это перепроверить. Для примера. Вот покупаете вы у Autodesk программу по подписке $4000, выходит апдейт, часть функций отваливается. Репортишь, ждешь пол года нового патча. Часть пофиксили, часть снова сломали и это даже не круг, а бесконечная кривая. Из года в год, ломают и фиксят одно и тоже. Вот там наверно тоже Кормена не читали, либо там тоже не "нормальные" инженеры. Ничем тут не горжусь. Человек написал что ChatGPT это что просто игрушка, я примером показал что уже нет. Мне не надо ТЗ с исполнителем обсуждать и не нужно видеть его реакцию если в процессе мне нужно что-то изменить. У меня появляется новая идея и я её в течение 5 минут уже могу видеть в работе.
А так же для o1 не умения читать прикрепленный файлы. Вернее функция есть, но толком не работает. А вот sonnet с легкостью переваривает прикрепленные документы от первого до последнего символа.
Вы забыли про контекстное окно. 32к у o1 против 128к у Sonnet 3.5
Неправильно выразился наверно. Я имел ввиду встраивать LLM в цепочку автоматизации производства, к примеру. Когда напрямую с чат ботом задачи решаешь, то видишь все его ошибки и можно своевременно поправить.
Я каждый день работаю по несколько часов с ChatGPT 4o, o1 и Sonnet 3.5
Какие есть новые и качественные модели, которые не имеют вышеописанных проблем?
У Antropic не лучше. Когда выпустили обновлённую Sonet 3.5, то после достижения лимитов появлялось сообщение что вы достигли лимита Sonet 3.5, но вы можете использовать Sonet 3.5 Имелось ввиду предыдущую версию, но никаким боком это не упоминалось. А у ChatGPT 4o по достижению лимитов пишет что вы достигли лимитов ChatGPT4 и пока они не сброисились, то можно пока что использовать ChatGPT 4o. facepalm.jpg
Честно говоря, непонятно как можно серьёзно работать с LLM сейчас. Они в 90% искажают факты, придумывают отсебятину, ловят галюцинации и так далее. В целом хорошо, но в деталях всегда нужно перепроверять, то есть непонятно как это ставить на автоматизацию.
Что с контекстном то? А то сейчас в окно больше 32к не закинуть, а файлы как не умело читать, так и не умеет
Оплачивал Claude с предоплаченных карт Visa с первых попавшийся сайтов. Хоть оплата и встроена в интерфейс Antropic, но этот тот же stripe. Самое большое преимущество Claude это умение полностью читать прикреплённые файлы, а не как у ChatGPT, который читает случайную выборку из 1000 символов и посылает тебя далеко и подальше.
Да нет, в России тоже доступно, просто пока общается только на английском
Отвечает на русском, потом удаляет ответ и пишет что пока не знает такой язык 😝
Кнопку копировать код тоже два года доделывали. Всему свое время.
Я просто ставлю Ubuntu раз в 5 лет, смотрю на весь этот зоопарк UI. Честное слово, как в 90ые возращаюсь. Отступы текста от краев окон по человечески сделать не могут. Какие-то вырвиглазные шрифты и прочие кривости. Выключаю, удаляю. Смотрю скриншоты других видов в нете. Забываю про линукс ещё на 5 лет.
К слову, на макоси окно настроек открываешь и этот вид тоже вызывает испанский стыд.
Согласен. Лента была забита новостями ChatGPT месяца три. Рекомендаций в ютубе вся страница в LLM.
128000 токенов это общее контекстное окно. Если сразу загрузить такой объем, то модель кроме как гору бреда ничего не напишет.
4о иногда так мозг делает, что переклбчаешься на о1 и вопрос моментально решается. Потом делаешь всё на о1 и думаешь что уж лучше обратно на 4о)))
Я каждый день с кодом работаю с ChatGPT и Calude и если первый промт приходится расписывать хоть как-то, то потом больше двух строк не пишу. Да, бывает начинает глючить проще перенести базу в новый чат. Но в новом чате уже ничего не объясняю, а просто продолжаю как если бы продолжал в старом.
У вас же диалог не закрылся, напишите правки и он адаптируется. Не с первого раза напишет, так со второго. А вообще, чем больше код у него будет в памяти, тем меньше ему объяснять надо что, зачем и почему.
Я не из деревни и кодить как раз начал с помощью 4o пару месяцев назад. Он сам подсказывает что установить и в каком порядке. Иногда это сложно понять, особенно когда он названия меню называет иначе. Часто путает проект и решение, но тут уже руку набиваешь и адаптируешся к тому, что он постоянно что-то отвечает не точно. Про Git он мне ничего не сказал, я задался этим вопросом, когда замучился бекапить проект копированием папки и сравнением изменения кода. О Git я узнал пару недель назад и плакал))) Установка 2 минуты, никаких сложностей создать репозиторий. Сложнее всего это работать с ним когда ты вообще 0, но потихоньку разбираемся.
Нет. Согласно промту собрал по условиям данные, отсортировал и выдал результат в структурированном, ожидаем виде. После этого вручную проделал ту же задачу несколько раз в разных примерах. Если повторяемость 100%, идем дальше. Вводишь новую функцию, проверяешь на совместимость с предыдущими и т.д. Я не заказ для кого то делаю, по расплывчатому тз, а делаю программу для себя. Я прекрасно понимаю что она должна делать и какой результат должна выдавать и всегда могу это перепроверить.
Для примера. Вот покупаете вы у Autodesk программу по подписке $4000, выходит апдейт, часть функций отваливается. Репортишь, ждешь пол года нового патча. Часть пофиксили, часть снова сломали и это даже не круг, а бесконечная кривая. Из года в год, ломают и фиксят одно и тоже. Вот там наверно тоже Кормена не читали, либо там тоже не "нормальные" инженеры.
Ничем тут не горжусь. Человек написал что ChatGPT это что просто игрушка, я примером показал что уже нет.
Мне не надо ТЗ с исполнителем обсуждать и не нужно видеть его реакцию если в процессе мне нужно что-то изменить. У меня появляется новая идея и я её в течение 5 минут уже могу видеть в работе.
Любая ПРО спортивная снаряга играет на результат. Проигрывает всегда тот, кто не принимает правила игры.