Pull to refresh

Comments 12

>> Лента реже всех ведущих российских СМИ, попавших в исследование, делает орфографических ошибок и ошибок согласования в предложениях.
Эмм…
Ну что вы хотите? Он же не Государственный институт русского языка имени А. С. Пушкина и не ABBYY. Он только написал о выполненной ими работе.
Я думаю, что не надо таких длинных предложений сочинять. Он начал с «реже», а закончил как будто там «меньше».
Если учитывать тот факт, что после смены большей части команды качество текстов на Ленте упало ниже некуда и они забыли для чего обычно используют Orphus, то результаты крайне печальные.
Где можно почитать о падении качества текстов Ленты после смены команды?
Хм, а на ТВ оценивали только ведущих? Или приглашенных экспертов тоже? Прямые эфиры/запись?
Оценку делал один человек (который тоже может ошибиться), или кто-то проверял?

В общем, без деталей, пока это выглядит, что сделали так, как кому-то было нужно.

Ну, и цель проекта — «построить рейтинг» — вызывает недоумение. Рейтинг ради рейтинга.
"% ошибок на страницу текста (в словах)" — а на полстраницы, на две страницы или на все издание процент будет другой, что ли? Писать «на страницу текста» или «на тысячу слов» имеет смысл только в случае указания абсолютного кол-ва ошибок. Статистики хреновы. :)
Высокие результаты, надо сказать. Может, «технологию понимания и анализа текстов на естественных языках ABBYY Compreno» стоит еще подопиливать? Чтобы ошибки искала лучше? Сегодня ни смотреть телевизор (независимо от канала), ни читать газеты, журналы, не говоря уже об интернете, невозможно без постоянного ощущения, что слушаешь, читаешь, смотришь на троечников.
[OFF] на первой картинке ошибка: если допущено две ошибки, то какую оценку поставить — три или четыре? Для тройки надо чтобы было «3-4 ошибки» [/OFF]
Это институт русского языка, а не математики.
Интересно, был ли потом пост-анализ глазами этих найденных автоматикой ошибок, чтоб понять можно ли это считать ошибкой русского языка издания, ведь это может быть чья-то прямая речь, перепечатка с указанием ссылки откуда взяли и т.д. С теле-радиом еще интереснее: там (на мой взгляд) корректно учитывать только ошибки ведущих, а вот ошибки приглашенных людей вроде и не на совести радио/тв.
Еще нюанс: СМИ были взяты по популярности, а популярность была построена на соцопросе (весьма странный способ определения популярности).
Из услышанного мимоходом по «Россия-24»:
«В {cityName} произошло землетрясение мощностью 7 магнитуд»…
Sign up to leave a comment.

Articles