g_coll 14 апр в 19:10

ChatGPT-4.1: Революционный скачок в программировании и обработке длинного контекста

3 мин

29K

Искусственный интеллектМашинное обучение*Будущее здесь

Комментарии 18

Мне, для моих текстовых задач, и старых моделей хватает с головой. Но, невозможно не радоваться от того, как они в безумной конкурентной гонке каждый месяц выдают всё лучшие продукты, пытаясь утереть друг другу нос. 😉

dumbaq 15 апр в 05:14

В современной конкурентной гонке не выдают всё лучшие продукты пытаясь утереть друг другу нос, в ней выдают всё более длинную и плотную лапшу на уши потребителей и инвесторов пытаясь убедить, что продукт всё лучше и лучше, и особенно лучше конкурентов.

Calculater 15 апр в 07:29

превосходит GPT-4o по многим показателям, при этом работая почти вдвое быстрее и стоит на 83% дешевле

17%-ное улучшение точности при анализе нескольких юридических документов с помощью GPT-4.1 по сравнению с GPT-4o

На бенчмарке SWE-bench Verified ...новая модель выполняет 54,6% задач

на 60% лучше справляется с их внутренним бенчмарком по программированию

Опять набор удобных бенчмарков для меряния процентами. А как раньше красивые графички да диаграммки рисовали - вот, мол, достигли интеллекта выпускника школы, вот студента, вот аспиранта. Как там сейчас дела, уже наверно и профессоров-академиков заменили :)

Inflame 15 апр в 07:49

Непонятно, на чём основан этот скептицизм. Ведь в том, что качество моделей растёт, можно легко самостоятельно убедиться, просто сравнив решения различных задач, которые выдают разные модели.

w0lkolak 16 апр в 05:20

Иногда заметно падает. Понимаю что они там экспериментируют и претензий тут нет, но улучшения обычно не такие яркие как периодические факапы(да, их потом чинят) : то в формулах латеха косячить начнёт, то на английский спонтанно переключается, то перестает учитывать подписанные настройки и до сих пор не научили раскладку исправлять: я пробовал попросить gpt это делать, но он сразу галлюцинирует

Andrew_1111 15 апр в 12:10

По большинству продуктов я бы согласился с вашим скептицизмом. Но то, что касается сейчас ИИ - тут очевидно, что борьба за рынок заставляет их делать то, что в спокойное время они бы ни за что не делали.

НЛО прилетело и опубликовало эту надпись здесь

Wrench_IT 15 апр в 01:16

Сразу на ум приходит классика: "Шо, опять?! (с), и конечно "Куй железо, не отходя от кассы" (с)

Rsa97 15 апр в 04:39

Вот когда будет "ЧагГПТ N, напиши мне ЧатГПТ N+1", тогда и посмотрим.

muhachev 15 апр в 05:43

Интересно, как они такую запутанную нумерацию своих версий придумывают.

Tarson 15 апр в 08:49

Похоже раньше с Java работали...

AcckiyGerman 15 апр в 11:11

4.1 лучше чем 4.5 и 4о, следующий будет 4.05 что непонятно то? /s

maleva322 16 апр в 17:53

4.5 рофломодель для тех, кому циферки большие нравятся, которая нередко хуже 4о

hrusha 15 апр в 06:07

Им бы что-то поправить с неймингом.

4.1 свежее 4.5, при этом в тестах они лидируют попеременно. А в зоопарке ещё есть 4, 4о, о1, о3-мини.. и ни одного лидера, который был бы умнее всех остальных, поди разберись

g_coll 15 апр в 06:10

bow 15 апр в 07:27

Похоже, в этом и суть, чтобы по нумерации не было понятно какая лучше во всем. Вроде, Альтман обещал оставить только прошу ветку версий для всего.

maleva322 22 апр в 16:59

4.5 более интересная и прогрессивная модель, нежели 4.1, заточенная под эмоциональный интеллект

Vedomir 15 апр в 12:29

Не хватает сравнения с моделями других разработчиков - Claude, DeepSeek и так далее.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий