Любая программа, это абстракция над абстракцией. Было бы логичным использовать именно самый низкоуровневый элемент для хранения данных, и в случае Unicode это действительно code-point. Правда их тоже несколько видов и если делать реализацию именно на уровне синтаксиса языка, то непонятно как это учесть. Возможно все как раз и скатится к тому виду, как это реализовано в С++ с разными вариантами code point.
Поверх последовательности code-points нужен ещё один уровень абстракции: отображаемые символы. Иначе, придётся у себя в программе решать эту задачу.
Так это и должно делаться в конечной программе. Текстовая строка Unicode это только хранилище данных, а их визуализация и интерпретация в виде печатных символов, это более высокий уровень абстракции.
Изначально, когда я собирал материал, то хотел привести Rust как один из примеров языков, в которых отсутствует на байтовые и Unicode строки. Но потом отказался от этого, а тег забыл убрать.
Если речь про Unicode строки, то достаточно будет сделать доступ к code point. То тогда само собой решаются вопросы и с представлением строки в памяти и с индексацией, необходимостью конвертирования и т.д.
Критерий стравнения язиков программирования по "энергетической эффективности", это более чем странный критерий сравнения. Тем более, что получить количественвенную оценку языка вряд ли получится. (можно оценить конкретное решение, но это будет оценка алгоритма, но не самого языка)
Для этих сервисов требуется обязательная добровольная регистрация.
Поэтому следующим шагом будет автоматическое создание кабинетов на Госуслугах.
А в чем проблема в подмене аккаунта?
А есть возможность более подробно рассказать про "замену"?
Нет. Текстовые строки Unicode бывают разными Текстовые строки в языках программирования
Да, действительно попутал. Конечно же должно быть "code unit"
К сожалению code point тоже несколько видов и один единственный тип данных для хранения unicode строк сделать не получится.
Любая программа, это абстракция над абстракцией. Было бы логичным использовать именно самый низкоуровневый элемент для хранения данных, и в случае Unicode это действительно code-point.
Правда их тоже несколько видов и если делать реализацию именно на уровне синтаксиса языка, то непонятно как это учесть. Возможно все как раз и скатится к тому виду, как это реализовано в С++ с разными вариантами code point.
Так это и должно делаться в конечной программе. Текстовая строка Unicode это только хранилище данных, а их визуализация и интерпретация в виде печатных символов, это более высокий уровень абстракции.
Это идеальный вариант, но он сработает только если будет два разных типа текстовых строк.
Потому что code point это минимально возможная единица данных для Unicode строк
Изначально, когда я собирал материал, то хотел привести Rust как один из примеров языков, в которых отсутствует на байтовые и Unicode строки. Но потом отказался от этого, а тег забыл убрать.
Спасибо, не знал.
Оказывается можгно вот так https://habr.com/ru/post/725888/ или так https://habr.com/ru/post/63501/
Если речь про Unicode строки, то достаточно будет сделать доступ к code point. То тогда само собой решаются вопросы и с представлением строки в памяти и с индексацией, необходимостью конвертирования и т.д.
Опрос добавил
Критерий стравнения язиков программирования по "энергетической эффективности", это более чем странный критерий сравнения. Тем более, что получить количественвенную оценку языка вряд ли получится. (можно оценить конкретное решение, но это будет оценка алгоритма, но не самого языка)
А где обещанные женщины легкого поведения?