Pull to refresh

Comments 11

днсы

нейросетей

флешку

гигабит (и наверное мегабит итп)

бэкап

патчей

майнеры

Беларуси ??

апдейты

фич

сисадмина

В хроме часть из этих слов в словаре есть, так что наверное стоит его взять и распотрошить. Некоторые слова есть в другой словоформе, флешка например.

Спасибо. Добавляю в список слов на проработку.

Может не стоит добавлять все подряд? Если с флешкой, нейросетью и т.п. все понятно, то например с бэкапом (резервная копия), патчем (изменение) и апдейтом (обновление) мне кажется не все так однозначно.

Всё подряд, может быть, и не стоит, но устоявшийся технический жаргон считать за ошибку в современном словаре орфографии всё же не стоит, потому что он используется. В таком орфографическом словаре должно быть побольше распространённого узуса, который используется намеренно. Это не словарь нормированного языка. Скорее, словарь разговорной (прямой) письменной речи (в т.ч.). Кстати, вот выявил, что слово "узус" этот мой словарь считает ошибкой. Есть нормированный (официальный) русский язык. Но этот мой словарь не про это. Это про орфографию в ежедневном реальном использовании языка. Другая несколько функциональность (кстати, специалисты РАН на Грамоте.Ру считают, что "функционал" вместо "функциональность" в ИТ уже тоже можно не считать ошибкой) :)

А почему для "бэкапа" в русском языке есть буква "э", а для остальных заимствований – нет?

Как-то в статье этот вопрос не раскрыт: кто всё же решает, что новое слово, ещё не попавшее в академические словари, должно писаться именно так?

В статье не всё, что попало в словарь. Конкретные слова лучше проверять по факту, подчёркиваются или нет. По возможности в таких случаях включаю оба таких варианта. Но спасибо за коммент. Проведу отдельную проверку по этой теме.

Ещё бы они пересмотрели свою позицию по багу 1073840...

Когда Firefox видит в заголовке страницы код языка, например, <html lang="en", то он напрочь игнорирует пользовательскую настройку "использовать несколько установленных словарей одновременно" и по умолчанию использует на этой странице лишь один словарь. Да, можно вручную включить для этой страницы дополнительные словари, но делать это на каждом сайте напрягает. Белых людей, у которых в системе одна раскладка (английская) это не колышет, а вот индейцам жизнь портит, ведь существуют сайты, имеющие интерфейс на английском, но при этом писать там приходится по-русски (допустим, Гитхаб).

Интересная тема, спасибо за коммент. Попробую провентилировать, как будет время. Тоже вопрос, касающийся локализации в смысле i18n, а не i10n :)

Написал скрипт который читает хабр и проверяет по словарю тексты статей. Пишет в логи что нашел. И потом можно просто запустить opencode и он будет идти по логам и предлагать варианты.

Оказалось что слов отсутствует очень много, например для чудный не прописана превосходная степень. Еще много опечаток и сомнительных жаргонизмов но опенкод может их сам пропускать.

Всегда было интересно кто работает над словарями и почему в них нет даже таких популярных слов как юзер или недоработаны старые слова типа чудный.

Над такими открытыми словарями обычно работают ИТ-энтузиасты. Например, я до бага, упоминаемого в статье, этим не занимался, но вот занялся, ибо есть потребность и мои руки. У меня тоже есть такие скрипты, которые отбирают кандидатов. Корпус Хабра использовался. Вопрос в том, стоит ли добавлять всё, что можно добавить. Я над этим буду ещё думать. Словарь не должен быть огромным. Из-за частотности что-то может отсекаться. Если это обычные слова, часто применяемые, добавлять можно. Спасибо за коммент, буду думать, что можно будет из ваших наблюдений вытянуть :)

Sign up to leave a comment.

Articles