dmitrifriend 29 мая в 13:10

Проверка текста на орфографию: рейтинг лучших AI-корректоров. Часть 2

Средний

10 мин

1.9K

Блог компании BotHubИскусственный интеллектМашинное обучение*Контент и копирайтинг*Будущее здесь

Обзор

Часть 2 — это гайд по выживанию в мире кривых текстов, а также грамматический апокалипсис, куда мы закинули ChatGPT‑o1, o3, две штуковины от «Яндекса» — «Нейроредактор» и YandexGPT-5-Pro, Text.ru и «Мистера корректора». Заставили их искать опечатки, запятые, кавычки и ошибки уровня «25-го декабря» — и да, это больно.

Зачем терпеть этот разбор? Чтобы не стать тем парнем, чей пост на «Хабре» поправили в комментах. Готовьтесь: тут будут не только баллы, но и таблица, из‑за которой один нейрокорректор плачет в уголке. Да‑да, он снова всё испортил. Поехали разбирать, кто реально исправит ваши «исчо», а кто наделает новых ошибок.

Проверка текста на орфографию: рейтинг лучших AI‑корректоров, часть 1
Проверка текста на орфографию: рейтинг лучших AI‑корректоров, часть 2 ← вы находитесь тут.

ChatGPT-o1

🟢 Исправлено ошибок: 25.
🟣 Пропущено ошибок (или исправлено некорректно): 13.
🔴 Внесено новых ошибок: 0.
🔵 Сделано стилистических правок, перефразировок: 1.

Вывод ChatGPT-o1

ChatGPT‑o1 показал относительно скромный результат. Исправив 25 и пропустив 13 ошибок, он продемонстрировал уровень, сравнимый с Claude-3.7-Sonnet-Thinking, что не позволяет модели достичь топовых позиций в тесте.

Слабым местом модели стало отсутствие кавычек в названии «АльфаМаркет» — как и в случае Claude, o1 положилась на частотность употребления в источниках, но не на нормы орфографии, теряя за это 4 балла. Дополнительно модель ошиблась в классическом кейсе с датой, используя написание 25-го декабря, которое противоречит правилам русского языка.

ChatGPT-o3

🟢 Исправлено ошибок: 33.
🟣 Пропущено ошибок (или исправлено некорректно): 4.
🔴 Внесено новых ошибок: 1.
🔵 Сделано стилистических правок, перефразировок: 4.

Вывод ChatGPT-o3

ChatGPT‑o3 — ещё один свежий весенний глоток воздуха от OpenAI, появившийся почти одновременно с 4.1 и o4-mini. Потрясающие 33 корректных исправления и всего 4 пропущенные ошибки обеспечили ей первое место в нашем рейтинге. Гибкость, точность и способность находить сложные нюансы текста — всё это делает o3 лучшей нейросетью для исправления орфографии и пунктуации, когда на кону стоят не только буквы, но и репутация.

Бенчмарки подтверждают высокий уровень её познаний:

Бенчмарки, оценивающие способности ChatGPT‑o3 в различных научных сферах. GPQA Diamond (слева) — набор задач уровня доктора философских наук по биологии, физике и химии, требующих глубокого понимания специализированных терминов и концепций. Humanity’s Last Exam (справа) — междисциплинарный тест с экспертными вопросами из разных областей знаний, который оценивает способность моделей решать вопросы, требующие логики, интерпретации текста, обобщения и использования внешних знаний — *Бенчмарки, оценивающие способности ChatGPT‑o3* *в различных научных сферах*. GPQA Diamond (слева) — набор задач уровня доктора философских наук по биологии, физике и химии, требующих глубокого понимания специализированных терминов и концепций. Humanity’s Last Exam (справа) — междисциплинарный тест с экспертными вопросами из разных областей знаний, который оценивает способность моделей решать вопросы, требующие логики, интерпретации текста, обобщения и использования внешних знаний

Отмечу, что пара мест были исправлены немного иначе:

Слова совместно ведущих экспертов o3 воспринял не как формулировку «С кем?» (совместно с ведущими экспертами), а как ответ на вопрос «Кем?» (совместно ведущими экспертами). Думаю, нельзя считать это ошибкой, так как оба варианта логически подходят.
Кроме того, вместо предполагаемого в 5-м разделе нейросеть вывела в разделе 5. Такой вариант действительно встречается на письме чаще, при этом он сохраняет числовую форму, поэтому засчитываю его как альтернативный способ исправления.

Кстати, эта модель входит в тройку особо наблюдательных корректоров (наряду с «Мистером корректором» и Text.ru), распознавших ошибку в написании сфотографирует в анфас — правильно без предлога в. И это ещё не всё: лишь o3 и YandexGPT-5-Pro обнаружили сложный случай отсутствием запятой из‑за общего главного предложения (предложение Наши специалисты сообщили, что презентация прошла успешно и все участники остались довольны).

Модель не только стремится всюду искать подвох и предлагать необычные решения, но и проявляет редакторские способности: она внесла три стилистические правки, отлично вписывающиеся в текст.

Кстати, в этом обзоре я проводил тесты через центр нейросетей BotHub. Если вы готовы улучшить свои тексты с помощью ИИ, чат‑боты из теста тоже ждут вас там. Зарегистрировавшись по этой ссылке, вы можете получить 100 000 стартовых токенов!

Gemini-2.5-Pro

🟢 Исправлено ошибок: 23.
🟣 Пропущено ошибок (или исправлено некорректно): 14.
🔴 Внесено новых ошибок: 1.
🔵 Сделано стилистических правок, перефразировок: 1.

Вывод Gemini-2.5-Pro

Gemini-2.5-Pro, по сути, проваливает экзамен, показав один из самых низких результатов в тесте: исправлено всего 23 ошибки, а 14 остались без внимания.

Кроме базовой ошибки с отсутствующими кавычками вокруг названия «АльфаМаркет», Gemini проседает в некоторых других случаях. Например, попыталась исправить 3-х кнопочный интерфейс в странную конструкцию 3-хкнопочный интерфейс, а вопросительное предложение Вы остались довольны сотрудничеством?.. каким‑то образом превратилось в утверждение. Если это было сделано ради маркетингового вау‑эффекта, то попытка, увы, провалилась.

Вдобавок к техническим недочётам, отзывы пользователей во многом подтверждают результаты теста: «Хуже, чем HAL-9000» — это явно не та характеристика, которая присуждается способным нейросетевым моделям.

YandexGPT-5-Pro

🟢 Исправлено ошибок: 29.
🟣 Пропущено ошибок (или исправлено некорректно): 9.
🔴 Внесено новых ошибок: 0.
🔵 Сделано стилистических правок, перефразировок: 1.

Вывод YandexGPT-5-Pro

Модель показывает высокий результат — 29 баллов. Заметные хайлайты:

Удалена лишняя запятая в сложноподчинённом предложении (Наши специалисты сообщили...);
Название «Гугл» записано не только в исходном русском варианте, но и в кавычках;
Удалена лишняя запятая в вопросительном сложносочинённом предложении: Вы остались довольны сотрудничеством и у вас появились новые идеи?

Однако имеется и пара довольно‑таки простых ошибок: 25-го декабря, а также и слитное написание неслучайно — 5-Pro не заметил последующее противопоставление.

Кстати, знак процента оформлен через пробел: 30–35 %. Иногда этот способ считают более «академическим», так как он закреплён в ГОСТе, но на практике применяются оба варианта.

«Яндекс браузер» («Нейроредактор»)

🟢 Исправлено ошибок: 19.
🟣 Пропущено ошибок (или исправлено некорректно): 19.
🔴 Внесено новых ошибок: 2.
🔵 Сделано стилистических правок, перефразировок: 0.

Вывод «Нейроредактора»

«Яндекс браузер» — популярный российский браузер на движке Blink. В феврале 2024 года вышло обновление, добавившее множество нейросетевых функций, в числе которых как раз таки исправление ошибок. А чуть позже, в сентябре 2024-го, в браузер был добавлен отдельный модуль под названием «Нейроредактор» — благодаря которому исправлять ошибки стало возможно не только внутри текстовых полей разных сайтов, но и в нативной среде самого «Яндекс браузера».

Для открытия «Нейроредактора» нужно в новой вкладке выбрать Редактор:

Итоги проверки через «Яндекс браузер» неутешительны: браузер исправил ровно половину ошибок, столько же остались нетронутыми, а ещё добавились новые две — случаи с точкой после подписи и общим вводным словом кстати говоря.

«Нейроредактор» способен распознавать только простые орфографические ошибки, и то не всегда: сервис проигнорировал ошибку с раздельным не при противопоставлении, отличие чтобы от что бы тоже осталось вне зоны его интересов и, кроме этого, оказался упущен нюанс с записью даты без наращения (25 декабря). В истории ошибочного с 8 марта он исправил окончание, но не сделал М заглавной буквой.

Дополнительно заметим, что грамматические ошибки распознаются инструментом с переменным успехом. Например, неправильное окончание четырёхсот сервис сумел определить, а вот путаницу в формулировке совместно ведущих экспертов не разобрал.

И наконец, о сложных случаях пунктуации: «Нейроредактор» выявил, что причастный оборот не выделяется запятыми в позиции перед определяемым словом, однако в остальных не подкорректировал знаки препинания.

Кстати, думаю, что вам стало очевидно, что «Нейроредактор» работает не на основе YandexGPT-5-Pro, а на гораздо более лёгкой модели. Причины реализации очевидны: «Нейроредактор» доступен бесплатно и даже без входа в аккаунт браузера, а для применения 5-Pro требуется платная подписка.

Text.ru

🟢 Исправлено ошибок: 31.
🟣 Пропущено ошибок (или исправлено некорректно): 7.
🔴 Внесено новых ошибок: 2.
🔵 Сделано стилистических правок, перефразировок: 1.

Вывод Text.ru

В сегодняшней подборке Text.ru, наравне с YandexGPT-5-Pro, показывает впечатляющий результат — 29 баллов. Однако рассмотрим нюансы, ведь пункты, где сервис затруднился, тоже есть.

Сложные случаи пунктуации остались камнем преткновения: Text.ru пасует перед поясняющими оборотами, стыками союзов, запятыми в вопросительных предложениях и постановкой знаков при общей главной части. Эти испытания не сказались на его успехах в орфографии и грамматике: из нашего теста он упустил всего одну орфографическую ошибку — случай с некорректным склонением имени собственного (команда «АльфаМаркет» вместо команда «АльфаМаркета»).

Что насчёт стоимости? Если говорить о ценовой составляющей, ИИ‑корректура в Text.ru стоит ровно 100 ₽/12 500 символов.

«Мистер корректор»

🟢 Исправлено ошибок: 29.
🟣 Пропущено ошибок (или исправлено некорректно): 7.
🔴 Внесено новых ошибок: 2.
🔵 Сделано стилистических правок, перефразировок: 4.

Вывод «Мистера корректора»

«Мистер корректор» — бесплатный сервис для исправления правописания. По утверждениям сайта, в четырёх из шести корректорских тестах, опубликованных в разных онлайн‑изданиях, сервис набирает 87–91%, но в двух более сложных немного меньше — 66 и 82% правильных ответов.

Интерфейс «Мистера корректора». Самый полезный способ проверки, орфография вместе с пунктуацией, почему‑то не выбран по умолчанию. Кстати, в его название закралась ошибка — «и то и другое» пишется без запятой — Интерфейс «Мистера корректора». Самый полезный способ проверки, орфография вместе с пунктуацией, почему‑то не выбран по умолчанию. Кстати, в его название закралась ошибка — *«и то и другое» пишется без запятой*

Всего сервис исправил 29 ошибок, но допустил 2 новые. Сервис распознал пару сложных случаев пунктуации, но допустил несколько элементарных орфографических ошибок — написал 3-х кнопочный и с 8 марта.

То, что объединяет «Мистера корректора» с ChatGPT‑o3, — тяга к стилистическим правкам: оба добавили в текст по 4 перефразировки, максимум в этом тесте.

Надо заметить,что интерфейс не дружит с разбиением на абзацы — всё отправленное сливается в один монолитный кусок. Разделять проверенный текст обратно приходится вручную.

Решающий момент: кто затащил корректуру?

На этом наш экзамен завершается, и оценки всех участников сведены в таблицу. Погружаемся в результаты...

* Итоговая оценка считалась по формуле: исправлено ошибок − пропущено ошибок (или исправлено некорректно).

Как вы уже догадались во время прочтения статьи, топовые места занимают крупные языковые модели: первое — ChatGPT‑o3, второе делят Grok-3-Beta и ChatGPT-4o, а онлайн‑сервису Text.ru достаётся третье место.

В виде диаграммы:

Помимо качества проверки, одним из козырей нейросетевых моделей является возможность указывать конкретные правила редактирования прямо в момент проверки текста, а также динамически менять их. Когда есть текст, полный нюансов и требующий особого способа обработки, это оказывается особенно актуально.

Бонус: какие виды ошибок бывают в тексте?

Пора ещё раз взглянуть на природу ошибок в текстах. Они бывают трёх основных видов: орфографические, пунктуационные и речевые.

Орфографические ошибки — термин тесно пересекается с грамматическими ошибками. Связаны с правильностью написания слов: вопросы выбора букв, слитного/дефисного/раздельного написания, употребления прописных и строчных букв, кавычек в названиях и некоторые другие вещи. Избежать орфографических ошибок обычно просто — многие сомнения разрешимы через современные словари, например на «Грамоте».
Пунктуационные ошибки — те самые виновники, которые могут не только запутать читателя, но и изменить смысл текста. Забытая запятая или недостающая точка может превратить предложение в бессвязную абракадабру.
Речевые ошибки связаны с отступлениями от норм литературного языка и нарушениями правильности речи. Включают в себя несколько разделов:
- Грамматические — неправильное образование форм слова. Подразделяются на словообразовательные, грамматико‑морфологические и грамматико‑синтаксические.
- Лексические, также семантические, — нарушение точности словоупотребления. Придают высказыванию неясность и дают повод для двоякой интерпретации. К ним относятся: употребление слова в несвойственном значении; нарушение норм лексической сочетаемости; расширение и сужение значения слова; неразличение (смешение) паронимов; ошибки в употреблении омонимов, антонимов, синонимов; не устранённая контекстом многозначность и некоторые другие.
- Стилистические. Ещё одна группа ошибок, связанный с тем, когда «звучит как‑то не так». Связаны с употреблением слов, грамматических форм и синтаксических конструкций без учёта их стилистической окраски (функционально‑стилистической и эмоционально‑экспрессивной).
- И некоторые другие, например связанные с произношением — орфоэпические, акцентологические.

Итоги? Эпоха «Word’а с подчёркиваниями» кончилась. ChatGPT‑o3 забрал кубок, Grok-3 и 4o жмут руку, а Gemini и «Нейроредактор»... ну, вы видели скриншоты. o3 не просто выиграл — он устроил разгром. 33 правки против 4 ляпов — это не тест, это демонстрация силы. Но главное не это. Главное — что теперь вы знаете, куда тыкать текст перед публикацией. Короче: корректор‑убийца уже здесь, вам осталось его выбрать.

Это была статья о редактировании текстов через нейросети. Больше полезных материалов о создании и обработке контента в нашем блоге:

Скрытый текст

Только зарегистрированные пользователи могут участвовать в опросе. Войдите, пожалуйста.

А теперь — ваш ход! Какой ИИ-корректор реально заслуживает места в вашем рабочем процессе? Голосуйте за фаворита (можно выбрать несколько):

41.67% DeepSeek-R15

16.67% Claude-3.7-Sonnet2

0% Claude-3.7-Sonnet-Thinking0

8.33% Grok-3-Beta1

8.33% ChatGPT-4o1

8.33% ChatGPT-4.11

0% ChatGPT-o10

8.33% ChatGPT-o31

8.33% Gemini-2.5-Pro1

8.33% YandexGPT-5-Pro1

8.33% «Яндекс браузер» («Нейроредактор»)1

16.67% Text.ru2

0% «Мистер корректор»0

8.33% Напишу в комментах1

Проголосовали 12 пользователей. Воздержались 3 пользователя.

Хабы:

Проверка текста на орфографию: рейтинг лучших AI-корректоров. Часть 2

ChatGPT-o1

ChatGPT-o3

Gemini-2.5-Pro

YandexGPT-5-Pro

«Яндекс браузер» («Нейроредактор»)

Text.ru

«Мистер корректор»

Решающий момент: кто затащил корректуру?

Бонус: какие виды ошибок бывают в тексте?

Публикации

Информация