Информация
- В рейтинге
- 659-й
- Откуда
- Москва, Москва и Московская обл., Россия
- Дата рождения
- Зарегистрирован
- Активность
Специализация
Менеджер продукта, Деливери-менеджер
Ведущий
От 400 000 ₽
Английский язык
Управление проектами
Разработка ТЗ
Agile
Управление людьми
Оптимизация бизнес-процессов
Стратегическое управление
Стратегическое планирование
Управление разработкой
Вероятно, этот вопрос можно будет решить в рамках следующего этапа моей работы в этой теме - проверка грамматики и стилистики. В рамках этой работы дополнение может определять, в каком стиле пишет пользователь (использует ли он по тексту ё) и делать предложения, исходя из того, ёфикатор он или нет :) А анализ только лишь орфографии не способен это определять по определению. Нужен дополнительный слой, но решаемо.
Именно так :) Я ещё решил поработать с грамматикой. Там, правда, сложнее, но выполнимо. Скрин для затравки. Хочу, чтобы грамматические ошибки подчёркивались синим, а стилистические - зелёным с отображением того, что не так и предложениями по исправлению. И чтобы оно при этом работало достаточно быстро. На скрине концепт, что в принципе это работоспособно. Для Firefox и Thunderbird будут разные расширения.
Я сам ёфикатор. Но часто это связано с комплайенсом. Например, если вы пишете техническую документацию, новости или книгу, которая будет издана, корректоры/редакторы будут у вас ё убирать, если её отсутствие не может привести к неоднозначности.
Над такими открытыми словарями обычно работают ИТ-энтузиасты. Например, я до бага, упоминаемого в статье, этим не занимался, но вот занялся, ибо есть потребность и мои руки. У меня тоже есть такие скрипты, которые отбирают кандидатов. Корпус Хабра использовался. Вопрос в том, стоит ли добавлять всё, что можно добавить. Я над этим буду ещё думать. Словарь не должен быть огромным. Из-за частотности что-то может отсекаться. Если это обычные слова, часто применяемые, добавлять можно. Спасибо за коммент, буду думать, что можно будет из ваших наблюдений вытянуть :)
Интересная тема, спасибо за коммент. Попробую провентилировать, как будет время. Тоже вопрос, касающийся локализации в смысле i18n, а не l10n :)
Всё подряд, может быть, и не стоит, но устоявшийся технический жаргон считать за ошибку в современном словаре орфографии всё же не стоит, потому что он используется. В таком орфографическом словаре должно быть побольше распространённого узуса, который используется намеренно. Это не словарь нормированного языка. Скорее, словарь разговорной (прямой) письменной речи (в т.ч.). Кстати, вот выявил, что слово "узус" этот мой словарь считает ошибкой. Есть нормированный (официальный) русский язык. Но этот мой словарь не про это. Это про орфографию в ежедневном реальном использовании языка. Другая несколько функциональность (кстати, специалисты РАН на Грамоте.Ру считают, что "функционал" вместо "функциональность" в ИТ уже тоже можно не считать ошибкой) :)
В статье не всё, что попало в словарь. Конкретные слова лучше проверять по факту, подчёркиваются или нет. По возможности в таких случаях включаю оба таких варианта. Но спасибо за коммент. Проведу отдельную проверку по этой теме.
Спасибо. Добавляю в список слов на проработку.