NeyroEntuziast Apr 15 at 07:54

OpenAI представила GPT-4.1 — улучшенный процесс программирования, следование инструкциям и длинное контекстное окно

Easy

8 min

4.5K

Artificial IntelligenceThe future is hereProgramming *

Review

Translation

Comments 10

Tassdesu Apr 15 at 10:49

О, про промтинг гайд не замечал, спасибо, почитаю.
Но всё-таки жду независимых тестов модели, такое ощущение что они пытаются скрыть, что GPT 4.1 не очень.

NeyroEntuziast Apr 15 at 12:54

Да, все-таки сравнение с конкурентами хотелось бы от openai получить

Akuma Apr 15 at 11:37

И все же Flash 2.0 пока что топ. Быстрая, очень дешевая, умеет в json scheme и картинки.

NeyroEntuziast Apr 15 at 12:56

У каждого на хабре и не только- свой топ )

Vedomir Apr 15 at 12:32

Не хватает сравнения с другими моделями, не от OpenAI

NeyroEntuziast Apr 15 at 12:56

Согласен, т.к. не очень объективное сравнение у openai

gnomeby Apr 15 at 12:38

А чего это у вас ссылки с трекингом, нехорошо это?

https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fplatform.openai.com%2Fplayground&postId=1926878

NeyroEntuziast Apr 15 at 12:55

Все просто - я размещаю статью сразу на 2х площадках. С VC удобно копировать на хабр, а наоборот не очень. Это в правилах не запрещено

vagon333 Apr 15 at 19:22

В рамках проекта по улучшению резюме тестирую разные модели на нахождение дефектов в резюме.

В процессе тестирования пробовал:
- Anthropic 3.7 Sonnet,
- OpenAI GPT 4.1, GPT 4.1 Mini, GPT 4o
- Google AI Gemini 2.5 Pro
- DeepSeek R1, 70b
- Meta 4

На текущий момент самый аккуратный и внимательный к деталям OpenAI GPT 4.1.
За ним Gemini 2.5 Pro +, GPT 4o и 3.7 Sonnet.

Все остальные модели для сравнения непригодны, так как на десятках тестов дают явно худшие результаты по субъективной оценке и по количественным показателям по найденным дефектам.

NeyroEntuziast Apr 16 at 04:57

Спасибо за мини-тест!