Невозможности подсчета количества букв, просто по размеру файла даже в простом варианте (ну тут понятно о чем речь).
А зачем это в реальной жизни надо?
Для расчёта ширины текста всё равно надо отрисовывать, чтобы учесть:
символы разной ширины (i, ж)
символы без ширины (◌゙ )
emoji, в которых несколько unicode-символов превращаются в 1 графический символ 🏴
делает работу прог заметно более шустрой
В настолько специфичных задачах, где кодировка становится узким местом, компетентные разработчики могут покрутить кодировку сами. А в большинстве ситуаций гораздо полезнее, чтобы все символы успешно передавались, даже если разработчик не сильно разбирается в кодировках, разных языках и т.п.
внешне одно и то же может быть по разному кодировано
Для сравнения надо пользоваться функциями сравнения и прочитать про https://en.wikipedia.org/wiki/Unicode_equivalence - к большим и маленьким буквам все же привыкли. Или к тому, что есть короткие и длинные "-". Да и не проблема это utf-8, а особенность развития человеческой письменности, зафиксированной в unicode.
разные либы и разные проги очень по разному обрабатывают utf-8
Интересны детали, что там можно сделать по-разному (кроме обработки ошибок)
Я бы понял, если предъявы были бы про UCS-2/UTF-16, которые создают иллюзию, что все символы в 2 байтах, но UTF-8 очень явно намекает, что символы имеют разное количество байт.
Так странно, что Android на Java не мог запускать J2ME приложения. Вроде, был какой-то эмулятор для Android<2, но даже с ним как-то криво запускался Jimm.
И на контрасте WindowsMobile прекрасно запускал J2ME.
Что только ни добавят в стандарт, лишь бы не стандартизацию внешних зависимостей</сарказм_с_болью>
На контрасте с Go с превосходными зависимостями, но невозможностью сделать свой полноценный контейнер (operator[] только для встроенных типов). Спасибо generic - очень сильно упростился этот момент.
Если не в спешке искать подтверждения своим убеждениям, а попытаться разобраться, то можно прочитать комментарии к почти каждому использованию этой функции, вроде:
// On Windows 7, where Win32k lockdown is not supported, the Chromium
// sandbox does something weird that breaks COM instantiation. или
// SetDisplayAutoRotationPreferences requires Win8, tablet mode and device
Я скорее про наличие разницы: я слышу "ш" и "шь" одинаково (имеется в виду, в словах "ваш" и "делаешь"), а "щ" и "сч" как смягчённую ш (при произношении - изгибая язык, как при смягчении других согласных). Стало интересно, вдруг я и в родном языке не слышу разницы между звуками, которые слышат носители?
Я именно так и понял артикли: в англ многие слова могут быть разными частями речи и вот артикль намекает, что сейчас будет мешанина прилагательных с существительным в конце. Если опустить артикль, носитель не распарсит, что тут действие, а что объект. И лучше поставить абы какой, чем не поставить.
А в чём разница между "ш" и "шь"? Или "шь" - условный звук, что было бы, если "ш" изменялась б от "ь"? А если уж докапываться, то всё зависит от акцента: в московском "щ" - это как если б "ш" смягчилась, а в западном - "шч".
Однажды пытался учить вьетнамские звуки: носители показали, как повернуть щёки и язык, чтобы произнести разные звуки, но моему уху они абсолютно одинаковы.
Стоит добавить, что в open-source похожие проблемы. Обнаружил, что после запуска диск отвечает очень плохо минут 5-10. Виновник - mlocate, зачем-то кеширующий список файлов каждый день (DE: Xfce 4.16). Благо, не сильно много зависимостей за собой утянул при удалении.
Вероятно, что-то не то с моими глазами, но я там чётко видел «Я собираю информацию, хотите, чтобы я её вам показывал? (А ещё я в другом городе и что я тебе сделаю, а в твоём городе тот, у кого есть доступ к локации по вышкам)»
Какой-то неочевидный вывод. Одинаковые результаты могут получится и в случае, когда омега-3 не влияет, и когда у 25% повышенная (диета/усвояемость) омега-3 и им она вредит ровно так же, как помогает 25% с пониженным. Или влияет содержание железа в крови - части помогает и такой же части вредит.
А зачем это в реальной жизни надо?
Для расчёта ширины текста всё равно надо отрисовывать, чтобы учесть:
символы разной ширины (i, ж)
символы без ширины (◌゙ )
emoji, в которых несколько unicode-символов превращаются в 1 графический символ 🏴
В настолько специфичных задачах, где кодировка становится узким местом, компетентные разработчики могут покрутить кодировку сами. А в большинстве ситуаций гораздо полезнее, чтобы все символы успешно передавались, даже если разработчик не сильно разбирается в кодировках, разных языках и т.п.
Для сравнения надо пользоваться функциями сравнения и прочитать про https://en.wikipedia.org/wiki/Unicode_equivalence - к большим и маленьким буквам все же привыкли. Или к тому, что есть короткие и длинные "-". Да и не проблема это utf-8, а особенность развития человеческой письменности, зафиксированной в unicode.
Интересны детали, что там можно сделать по-разному (кроме обработки ошибок)
Я бы понял, если предъявы были бы про UCS-2/UTF-16, которые создают иллюзию, что все символы в 2 байтах, но UTF-8 очень явно намекает, что символы имеют разное количество байт.
Можно расширять unsigned - тоже дешевле расширения signed.
Что интересно, clang создаёт одинаковый код, но есть подозрение, что
asmухудшит оптимизацию реального кода.Так странно, что Android на Java не мог запускать J2ME приложения. Вроде, был какой-то эмулятор для Android<2, но даже с ним как-то криво запускался Jimm.
И на контрасте WindowsMobile прекрасно запускал J2ME.
Удовлетворить зависимости можно либо установив rootfs x64 через chroot/systemd-nspawn/docker или добавив архитектуру:
```
# доступно только в debian-based
dpkg --add-architecture amd64
```
В Xfce плохо работает(ло) масштабирование, а с современными разрешениями это критично. Спустя 10+лет таки ушёл на KDE.
Что только ни добавят в стандарт, лишь бы не стандартизацию внешних зависимостей</сарказм_с_болью>
На контрасте с Go с превосходными зависимостями, но невозможностью сделать свой полноценный контейнер (operator[] только для встроенных типов). Спасибо generic - очень сильно упростился этот момент.
Глаза очень сильно огорчаются от фокусирования на малом расстоянии. А на вращение глазами влияет угловой размер.
Это приводит к тому, что лучше иметь лопату и держать на расстоянии вытянутой руки.
Посыл моего сообщения был не в том, что можно доверять тому, что исключения не будет.
А что даже если исключения не будет, доверять тому, что процесс не упадёт - нельзя. Надо обращаться к платформо-зависимым штукам.
А ещё и исключение скорее всего не кинет (во многих системах /proc/sys/vm/overcommit_memory = 0), а при обращении OOM пришлёт SIGKILL.
Лечение: поставить в "2" - тогда будешь получать исключение, но gcc перестанет работать.
Что именно - второе?
Если не в спешке искать подтверждения своим убеждениям, а попытаться разобраться, то можно прочитать комментарии к почти каждому использованию этой функции, вроде:
// On Windows 7, where Win32k lockdown is not supported, the Chromium// sandbox does something weird that breaks COM instantiation.
или// SetDisplayAutoRotationPreferences requires Win8, tablet mode and device// support.Когда большинство текущих граждан РФ рождались, такой страны не было.
Я скорее про наличие разницы: я слышу "ш" и "шь" одинаково (имеется в виду, в словах "ваш" и "делаешь"), а "щ" и "сч" как смягчённую ш (при произношении - изгибая язык, как при смягчении других согласных). Стало интересно, вдруг я и в родном языке не слышу разницы между звуками, которые слышат носители?
Я именно так и понял артикли: в англ многие слова могут быть разными частями речи и вот артикль намекает, что сейчас будет мешанина прилагательных с существительным в конце. Если опустить артикль, носитель не распарсит, что тут действие, а что объект. И лучше поставить абы какой, чем не поставить.
А в чём разница между "ш" и "шь"? Или "шь" - условный звук, что было бы, если "ш" изменялась б от "ь"? А если уж докапываться, то всё зависит от акцента: в московском "щ" - это как если б "ш" смягчилась, а в западном - "шч"![]()
.
Однажды пытался учить вьетнамские звуки: носители показали, как повернуть щёки и язык, чтобы произнести разные звуки, но моему уху они абсолютно одинаковы.
cdimage.ubuntu.com/kubuntu/focal/daily-live/current/focal-desktop-amd64.manifest
packages.ubuntu.com/focal/amd64/mlocate/filelist
Вероятно, я что-то поставил и оно потянуло зависимость.
Стоит добавить, что в open-source похожие проблемы. Обнаружил, что после запуска диск отвечает очень плохо минут 5-10. Виновник -
mlocate, зачем-то кеширующий список файлов каждый день (DE: Xfce 4.16). Благо, не сильно много зависимостей за собой утянул при удалении.Но при этом лучше, чем не выбирать, а в универе отрицательный опыт легче усваивается.
Какой-то неочевидный вывод. Одинаковые результаты могут получится и в случае, когда омега-3 не влияет, и когда у 25% повышенная (диета/усвояемость) омега-3 и им она вредит ровно так же, как помогает 25% с пониженным. Или влияет содержание железа в крови - части помогает и такой же части вредит.