Comments / Profile of PDEMON / Habr

Потому что он просто принимал что выдаёт LLM. Нужно всегда проверять что выдаёт сеть и держать её на поводке. Я тоже делаю себе плагины и небольшие приложения до 10 тысяч строк и тоже ничего не понимаю в коде. Через месяц тыкания уже начинаешь ориентироваться и в том как он пишет и что он пишет.

o3-mini — лучшая модель для программирования на данный момент (лучше, чем DeepSeek R1)

PDEMON Feb 7 at 12:23

В котором работает только 4o, который уже никуда не годится, с контекстным окном (32к токенов)
Против Sonnet 3.5 (128к токенов). При этом Claude кеширует и оптимизирует файлы. Закиньте pdf размером 1 мб в ChatGPT и вам скажут память забита, а в Claude 5-10%

o3-mini — лучшая модель для программирования на данный момент (лучше, чем DeepSeek R1)

PDEMON Feb 7 at 05:52

У Claude есть одно большое преимущество. Можно в проект подгрузить доки по теме(инструкции, API) и получать каждый раз адекватный ответ, не требующий поправок.

Сообщается, что OpenAI планирует представить «суперагентов уровня доктора наук» в конце января

PDEMON Jan 20 at 05:44

С LLM моделями чуть сложнее, так как для них очень сильно нужно обрезать возможность неправильно понять контекст задавая вопрос.

Модель искусственного интеллекта OpenAI иногда «думает» на китайском, и никто не знает почему

PDEMON Jan 15 at 05:57

Она там на всех возможных языках рассуждает, но почему-то заметили только китайский.

Модель искусственного интеллекта OpenAI иногда «думает» на китайском, и никто не знает почему

PDEMON Jan 15 at 05:56

У меня бывало пол слова на английском, пол слова на русском. Например, Posиция.

Цукерберг объявил о планах Meta* заменить Mid-Level инженеров на ИИ в этом году

PDEMON Jan 14 at 06:40

Через 10 лет и сеньоры будут не нужны.

Как Claude от Anthropic меняет правила игры для разработчиков программного обеспечения

PDEMON Dec 24 2024 at 07:42

Если выкладывают код с ошибками, значит просят помочь исправить ошибку. Это ничем не отличается от обычной практики на stackoverflow. Просто мертвый код публиковать какой смысл? Он допускает 40% ошибок, но это же не значит что их не правят вручную.

Как Claude от Anthropic меняет правила игры для разработчиков программного обеспечения

PDEMON Dec 24 2024 at 05:53

Который по качеству ничем не отличается от человеческого, так как тренировался на примерах людей...

Я заплатил $200 за ChatGPT Pro. Это гениальная модель, или я выбросил деньги на ветер?

PDEMON Dec 13 2024 at 17:02

Файлы он крайне проблемно читает, по крайней мере через обычную подписку. Скинешь файл на 2000 строк, он прочитает рандомные 100 и скажет вам надо подумать как все это исправить самому.

Я 8 часов тестировал модель o1 Pro за 200$ и сравнил ее с Claude Sonnet 3.5 за 20$

PDEMON Dec 13 2024 at 07:40

А так же для o1 не умения читать прикрепленный файлы. Вернее функция есть, но толком не работает. А вот sonnet с легкостью переваривает прикрепленные документы от первого до последнего символа.

Я 8 часов тестировал модель o1 Pro за 200$ и сравнил ее с Claude Sonnet 3.5 за 20$

PDEMON Dec 13 2024 at 05:13

Вы забыли про контекстное окно. 32к у o1 против 128к у Sonnet 3.5

OpenAI официально представила модель GPT-o1 Pro за 200 долларов в месяц

PDEMON Dec 6 2024 at 08:53

Неправильно выразился наверно. Я имел ввиду встраивать LLM в цепочку автоматизации производства, к примеру. Когда напрямую с чат ботом задачи решаешь, то видишь все его ошибки и можно своевременно поправить.

OpenAI официально представила модель GPT-o1 Pro за 200 долларов в месяц

PDEMON Dec 6 2024 at 07:08

Я каждый день работаю по несколько часов с ChatGPT 4o, o1 и Sonnet 3.5
Какие есть новые и качественные модели, которые не имеют вышеописанных проблем?

OpenAI официально представила модель GPT-o1 Pro за 200 долларов в месяц

PDEMON Dec 6 2024 at 06:36

У Antropic не лучше. Когда выпустили обновлённую Sonet 3.5, то после достижения лимитов появлялось сообщение что вы достигли лимита Sonet 3.5, но вы можете использовать Sonet 3.5 Имелось ввиду предыдущую версию, но никаким боком это не упоминалось. А у ChatGPT 4o по достижению лимитов пишет что вы достигли лимитов ChatGPT4 и пока они не сброисились, то можно пока что использовать ChatGPT 4o. facepalm.jpg

OpenAI официально представила модель GPT-o1 Pro за 200 долларов в месяц

PDEMON Dec 6 2024 at 06:29

Честно говоря, непонятно как можно серьёзно работать с LLM сейчас. Они в 90% искажают факты, придумывают отсебятину, ловят галюцинации и так далее. В целом хорошо, но в деталях всегда нужно перепроверять, то есть непонятно как это ставить на автоматизацию.

3 4 ...

48 49