Хабр Курсы для всех
РЕКЛАМА
Практикум, Хекслет, SkyPro, авторские курсы — собрали всех и попросили скидки. Осталось выбрать!
дополнительная обработка полей вводаФильтрация ввода от пользователя нужна в любом случае, поэтому обработка полей вводе не является дополнительной опцией и не является минусом.
танцы с бубном вокруг случаев, когда пользователь вводит вперемешку utf8 и entitiesХабрапарсер, форумы на vbb/ipb с Вами не согласятся по поводу «привыкания» пользователей.
молчу, что «Ива́ново» вы в cp1251 в базе не найдете никогда
посмотрите, как оно реализовано в ЖЖ/ya.ru — именно так, как я говорю, а значит — пользователи к этому привыкли.

Отсюда, внимание, вопрос: вы уверены, что накладные расходы себя оправдают?Иногда оправдают, иногда нет.
Целью публикации было показать какие именно потери по производительности в БД возможны в случае выбора utf
там, где достаточно cp1251, что бы каждый для своей ситуации мог бы сделать оптимальный выбор
Потому, что ru_RU и en_EN в данном случае задают culture — сортировку символов, преобразование регистра, форматы чисел, валют и т.д.Точный пример вспомнить трудно, но если по памяти/аналогии привести пример «с потолка», то очень сильно смущает, что iconv Königsberg //ignore //translit может превратиться в Konigsberg, может в Ko'nigsberg, или допустим в K«onigsberg или даже в Koonigsberg в зависимости от локализации „универсальной“ кодировки UTF.
UTF-8 это никакая не передовая технология. Это нормальное и логичное решение всех проблем с костылями и зоопарком кодировок.Не передовая, именно потому, что 100% решением не является на данный момент, имея набор своих, нерешенных проблем.
А 32 бита больше, чем 8. Давайте все переходить на 8-битные компы! Память же надо экономить! И современные проги слишком прожорливы — не то, что «лексикон» под DOS!Нет, не совсем правильно. Речь о том, что надо понимать, что работа с утф8 до 2 раз замедляет работу скриптов. Или до 2 раз удорожает ресурсы требуемые для их работы, что особенно заметно в облаках.
Вы примерно к этому призываете, я правильно понял?
Спустя 14 лет, насколько изменилась ситуация?
Скорость работы с utf, очевидное, но малоизвестное для новичков