Ссылки
Главная фундаментальная особенность Аргентума - это его ссылочная модель данных, обеспечивающая не только безопасность памяти, как в Java-Rust-Go, но и полностью предотвращающая утечки.
Но кроме этой особенности в Аргентуме есть еще много интересного - это сверхбыстрые динамические приведения типов и вызовы методов интерфейсов, модульность, "микросервисная" многопоточность, и управляющие конструкции, основанные на optional типе. О последней особенности и будет этот пост.
В Аргентуме нет тернарного оператора ?:, но есть два бинарных - ? и :
Рассмотрим пример:
a = 4; // `a` имеет тип int и значение 4 b = a < 0 ? -1 : 1; // `b` имеет тип int и значение 1
На самом деле выражение a ? b : c. в этом примере - это два вложенных друг в друга бинарных оператора. И их можно записать и по отдельности:
x = a < 0 ? -1; b = x : 1;
Тип переменной x будет optional<int> или в синтаксисе Аргентума: ?int. Остаовимся на семантике этих двух строчек подробнее:
x = a < 0 ? -1; // x будет -1, если a < 0 или "ничего" во всех остальных случаях. b = x : 1; // присвоить в b значение x, но если там "ничего", то присвоить 1.
Можно сказать, что оператор `?` производит optional, а `:` потребляет его.
Если они применены вместе, они работают как старый добрый тернарный оператор:
b = (a < 0 ? -1) : 1;
Если результат выражения не нужен, оператор ? работает как if
a < 0 ? log("it's negative");
А пара операторов ?: работает как if...else:
a & 1 == 0 ? log("it's even") : log("it's odd");
Итак Аргентум разделил тернарный оператор на два бинарных. Что это дало?
Поддержаны короткие условные выражения без части else, которые возвращают значения. Язык стал ортогональнее.
Ничего не усложнено - не добавлены никакие новые синтаксические конструкции.
Появилось два конструктора optional-значений:
вместо (C++)
optional<decltype(x)> maybeX{x}
можно написатьmaybeX = true ? xвместо
optional<decltype(x)> maybeX{nullopt}
можно написатьmaybeX = false ? x
илиmaybeX = ?x
Распаковка с использованием дефолтного значения тоже стала проще:
вместо
auto a = maybeX ? *maybeX : 42
можно написатьa = maybeX : 42
При отсутствии данных не обязательно использовать дефолтное значение, можно вызвать хендлер проблемной ситуации или удариться в панику:
x : terminate()Очень часто возвращая optional результат функции мы пишем
return condition ? result : nulloptв Аргентуме это будет так:condition ? resultМы можем не только комбинировать операторы
?и:. Мы можем комбинировать операторы:между собой.
Например:user =currentUser :getUserFromProfile() :getDefaultUser() : panic("no user");
Это короткое выражение попытается получить user-объект из нескольких мест, и вызовет выход из приложения если ничего не получится.
Аргентум поддерживает упрощенный синтаксис для создания optional-типов:
Вместо
true ? xможно написать+xВместо
false ? xможно написать?xили?int
В Аргентуме нет разделения на стейтменты и выражения
В Аргентуме есть оператор {A; B; C}, который исполняет A B C по очереди и возвращает результат C. Обратите внимание на отсутствие точки с запятой ";" после после C. Если она там будет, это будет означать, что в конце всего блока {} есть еще один пустой оператор, и его результат (void) станет результатом всего блока {}.
Блок - может группировать несколько операторов:
{ log("hello from inner block"); log("hello from inner block again"); }; log("hello from outer block");
Блок позволяет создавать локальные переменные:
{ a ="Hello"; log(a); } // здесь уже нет `a`
Блок может присутствовать в других выражениях, например быть инициализатором переменной.
x = { a = 3; a += myFn(a); a / 5 // это выражение станет значением `x` };
(Еще блок может быть таргетом для оператора break/return, но это тема отдельного поста).
Совместное использование блоков и оператора "?" позволяет создавать условные выражения, аналогичные оператору if..else, которого в Аргентуме, кстати, тоже нет:
a < 0 ? { log("negative"); handleNegative(a); }; // или a < 0 ? { handleNegative(a); } : { handleOtherValues(a); }
В Аргентуме нет bool
Что такое значение типа optional<T>? Это или сам T или особое значение nothing, не совпадающие ни с каким значением T. Теперь попробуем новый трюк: что такое optional<void>? Это однобитное значение, позволяющее различить nothing и void. Это полный синоним логического типа данных. Получается, что если в нашем языке есть тип void и есть и optional<T>, то отдельный тип bool нам уже не нужен. Все логические операции, например операции сравнения, в Аргенуме возвращают optional<T>. А все операции принимающие логические значения теперь будут принимать любые разновидности optional<T>.
Что это нам дает?
Оператор ? на самом деле имеет тип: (?T) ? (T->X) -> (?X)
Cлева не только
bool(который на самом деле?void) но и вообще любой?TCправа - выражение с результатом
X(как вариант, превращающееTвX)Результат самого оператора
?будет?X.
Как работает оператор "?"
Вычисляется/исполняется левый операнд и анализируется его результат:
Если "nothing", результатом всего оператора ? становится "nothing" типа
?X.Иначе
Создается специальная временная переменная `_` типа
T, которая получает значение извлеченное из?T.Исполняется правый операнд, которое может использовать переменную "_".
Результат правого операнда должен иметь тип
X,он упаковывется в?Xи становится результатом всего оператора?.
Такая конструкция оператора "?" позовляет проверять условия с одновременным излечением завернутого в optional значением и передавать результаты дальше, объединяя в конвейер цепочки операций, вызовов методов, доступов к полям в безопасной контролируемой манере:
currentOrderId ? orders.findOrder(_) ? _.getPrice() ? processPrice(_);
В этом примере:
Если
currentOrderIdсуществует, найти по немуorder.Если
orderнашелся, взять из негоprice.Если
priceесть, обработать его.
Если в языке отсутствует такой синтаксис, это простое выражение превращается в многострочную трудно сопровождаемую простыню `if`-ов и временных переменных.
Кстати о безопасности на уровне синтаксиса, и C++ и Java позволяют обратиться к значению внутри optional без проверки на его существование:
// С++ optional<int> x; cout << *x; // Java var x = Optional<Integer>.empty(); System.out.println(x.get());
А в Аргентуме оператор "?" откроет вам доступ к внутреннему значению только при его наличии, а оператор ":" потребует указать код, который предоставит значение вместо отсутствующего. Других операторов для доступа к optional нет. Это непробиваемая защита от обращений к несуществующим значениям на уровне синтаксиса языка на этапе компиляции.
fn printOpt(x ?int) { // мы не можем обратиться к внутреннему числу без проверки x ? log(toString(_)); // другой способ обратиться - предоставив значение по умолчанию log(toString(x : -1)); // еще одни вариант - условная конверсия ?int в ?String // и значение по умолчанию уже для строки log(x ? toString(_) : "none"); }
Кстати, в Аргентуме есть ключевые слова bool, true, false. Они декларируют тип ?void, и создают значения +void и ?void, чтобы все было просто и привычно.
В Аргентуме нет null pointer но есть optionals
В последнее время стало модно добавлять в разные языки Null safety. В Аргентуме Null safety обеспечивается не добавлением новых понятий, а убиранием ненужных. Указатели в Аргентуме не бывают nullable. Если нужен nullable-указатель, используется optional-обертка над указателем, где optional nothing - это аналог null:
// `a` - это не-nullable указатель, проинициализированный // свежесконструированным экземпляром Point a = Point; // `b` это optional указатель на Point, // проинициализированный значением nothing. b = ?Point; b := a; // Теперь `b` показывает туда же куда `a` b := Point; // Теперь `b` показывает на собственный свежесозданный экземпляр класса b := ?Point; // Теперь b снова optional-none.
Кстати, синтаксис ?T для создания пустых указателей означает, что в Аргентуме все "null pointers" строго типизированные.
В Аргентуме тип optional глубоко встроен в язык. Для разных обертываемых типов его внутреннее представление различается. Например, optional-указатели на самом деле хранятся как простые указатели, и optional-nothing кодируется в них как 0. Это обеспечивает бесплатный маршалинг в други языки через FFI, компактность внутреннего представления и высокую скорость работы. ТипыObject и ?Object с точки зрения языка различаются только на стадии компиляции - для первого не нужны проверки на null, для второго наоборот запрещается обращение без проверки.
Аналогичный прием используется для ?double, в котором optional nothing - это просто NaN.
Объявление переменных в If
Еще одна модная тенденция обвешивать условный оператор какими-нибудь вычислениями в условии, результат которых сохраняется в локальной переменной доступной в ветках условий, например в C++:
if (auto v = expression()) use(v);
Чтобы это работало, достаточно, чтобы v приводился к bool. Однако очень быстро выяснилось, что приводить один и тот же тип к логическому типу можно по разному. Например для строки иногда полезно считать как бы false пустую строку, иногда строку с текстовым значением "false", иногда к этому можно добавить строку "0" или еще как-то. Поэтому в C++17 появился вот такой удобный вариант if
if (auto v = expression; predicate(v)) use(v);
Как это работает? Вначале вычисляется expression его результат помещается в локальную переменную v, потом она передается в predicate который на ее основе делает bool, которые выбирает нужную ветку в которой эта v доступна. Например:
if (auto i = myMap.find(name); i != myMap.end()) use(*i);
Вот как это делается в Аргентуме без никакого дополнительного синтаксиса:
predicate(expression) ? use(_)
Где: expression по-прежнему отдает значение T, predicate анализирует его и превращает в ?T со значением внутри, a оператор ? при удачном решении предиката передает распакованное из `optional` значение T в use. Пример:
isAppropriate(getUserName(userId)) ? log(_) : log("username is so @#$ing @#$it that I can't even say it");
Таким образом Аргентум реализует эту возможность, без введения в язык новых сущностей.
Иногда переменная "_" неудобна или занята
В коротких выражениях имя "_" удобочитаемо и уместно, однако больших конструкциях, оно может становиться проблемой и конфликтовать, особенно если несколько операторов "?" вложены друг в друга. Поэтому существует синтаксическая разновидность оператора "?", которая позволяет давать переменной явное имя.
profuceSomeConditionalData() ?`data { data.method(); // Используем имя `data` вместо "_" }
Рассмотрим менее абстрактный например:
fn applyStyleToLastParagraph(text TextBlock, styleName String) { text.getLastParagraph() ?`last text.getDocument().styles.findByName(styleName) ?`style last.forEach((span){ span.applyStyle(style) }); }
Эта функция проверяет, есть ли у текста последний абзац и есть ли у документа стиль с указанным именем, прежде чем прикладывать стиль к абзацу. И это все делается без введения переменных уровня блока, засоряющих пространство имен и продлевающих жизнь объекту сверх необходимого. Кроме того эти переменные связываются не с optional-значением, а уже с распакованным, прошедшим проверку на nothing-ness.
Optionals и приведение типов
Оператор expression ~ ClassOrInterface выполняет два вида приведения типов - если класс является базовым для выражения, то результат такого приведения гарантирован, и операция имеет тип ClassOrInterface во всех остальных случаях операция выполняет быструю рантайм проверку типа, и результат операции будет optional:?ClassOrInterface. В отличие от кастов в Java и C++ где проверка результата каста является необязательной (и очень многословной), в Аргентуме синтаксически невозможно обратиться к зачению завернутому в optional-тип, и поэтому приложение на Аргентуме просто не может упасть из-за ошибочных типов:
pointerExpression() ~ MyClass ? _.myClassmethod() : handleIfNot();
Optionals и weak pointers
В аргентуме ассоциативные ссылки (так же известные как weak pointers) - это один из трех базовых встроенных в язык типов указателей. Такие ссылки легко создаются, копируются передаются и хранятся, они nullable сами по себе:
class MyClass { field = &MyClass; // поле класса; weak-ссылка; "null" } a = &MyClass; // локальная переменная; weak; "null" realObject = MyClass; // временная ссылка на свеже-созданный объект класса a := &realObject; // теперь `a` ссылается на наш объект realObject.field := a; // теперь поле объекта ссылается на него самого
Процесс разыменования такой ссылки включает в себя проверку, что ссылка вообще на что-то ссылается, что ее таргет все еще существует и находится в том же потоке. Результат всех этих проверок - временная ссылка на объект, завернутая в optional, которая не только сигнализирует, о доступности объекта по ссылке, но и предотвращает его удаление.
Вышеописанное разыменование не имеет никакого синтаксиса. Оно выполняется автоматически везде, где &T преобразуется в ?T. Например, в опреаторе "?":
fn doSomething(obj &Object) { obj ? _.something(); }
Оператор ? хочет получить слева ?T, поэтому weak-pointer obj будет локнут, и при успехе передан в правый операнд в виде имени "_".
В результате:
в Аргентуме невозможно обратиться по weak-ссылке, которая потерялась
эта проверка имеет супер легковесный синтаксис
она порождает временное значение ("_" или имя определенное программистом через ?=name), и это временное имя имеет время жизни органиченное правым операндом оператора
?.
Optionals и индексы/ключи контейнеров
Все стандартные контейнеры в результате операции индексации x[i] возвращают ?T. Поэтому Аргентум делает невозможным обращение за пределы массива или по не валидному ключу.
a = Array(String); a.append("Hello"); a[0] ? log(_); // вывести нулевой элемент массива, если он есть log(a[0] : ""); // вывести нулевой элемент массива, или пустую строку // Функция принимает контейнер, ключ и лямбду, создающую новые элементы fn getOrCreate(m MyMap, key int, factory ()@Object) { // если контейнер содержит элемент, это и будет результат. // иначе вызовется лямбда, // ее результат сохранится в контейнере по ключу и вернется в виде результата m[key] : m[key] := factory() }
Кстати, операция индексации - это сахар для вызова метода getAt | setAt. Определяя такой метод (с произвольным количеством параметров произвольных типов) вы превращаете свой класс в многомерный контейнер.
Вложенные Optionals, &&, ||
Optional-обертка может содержать в себе любой тип, включая optional. Теоретически это позволяет иметь типы ?int, ??int, ???int и т.д.
Зачем это нужно?
Например, при индексации контейнера с bool или optional- элементами нужно как-то различать отсутствие элемента (выход за границу массива) и элемент со значением nothing.
Или при использовании вложенных ?-операторов. Результат будет зависеть от того, какое из условий не сработало.
Рассмотрим пример:
token = name ? findUserByName(_) ? getUserToken(_); // Ассоциативность операторов правая. Поэтому этот пример можно записать так: token = name ? (findUserByName(_) ? getUserToken(_));
Предположим, что getUserToken возвращает значение ?String, которое будет или токеном, или nothing, если у этого user-a нет токена.
Тогда правый самый внутренний оператор ? вернет ??String, который буден nothing, если нет user-a, just(nothing) если нет токена, и just(just(string)) если есть токен.
Тогда левый оператор ? будет иметь тип ???String который буден nothing, если нет name, и все сорта just(...) сигнализирующие о проблемах с поиском user-a и его токена. Получившийся пакет из optional-значений можно проанализировать тремя операторами ":"
log(token : "No name" : "No user" : "No token)
Но такая вложенность нужна не всегда. И поэтому в Аргентуме есть оператор &&, который работает почти как ?, но он требует, чтобы и правый левый операнды возвращали optional значения (не обязательно одного типа).
Он работает совсем как maybe >>= Хаскеля. Его левый операнд возвращает ?T, а правый - преобразует T в ?X. Результат оператора - ?X. Вначале он исполняет левый операнд:
если он
nothing, результат становитсяnothingтипа?X.иначе он связывает внутренне значение из
?Tс переменной "_" и исполняет правый операнд, результат которого и становится результатом всего оператора&&.
По сравнению с оператором ? оператор && имеет всего одно отличие - он не упаковывает результат правого операнда в optional, вместо этого он требует, чтобы он сразу был optional.
Если подставить bool (optional void) вместо ?T и ?X в оператор && он становится полностью идентичным оператору && во всех Си-подобных языках.
Естественно, как и оператор ?, оператор && имеет форму &&=name, для задания имени вместо "_".
Перепишем пример выше:
token = name && findUserByName(_) && getUserToken(_);
Теперь token имеет тип ?String. В нем пропала вся информация о том, почему токен не удалось получить. Теперь это или "нет токена" или значение токена.
Иногда вложенность optional-оберток полезна, иногда - нет, поэтому и оператор ? и оператор && найдут себе применение.
Последний из не рассмотренных операторов - "||". Он похож на ":". Его единственное отличие - он требует, чтобы и справа и слева был один и тот же optional тип. Если оператор ":" возвращает свой левый операнд распакованным из optional-a, то "||" этого не делает. И в этом он также аналогичен оператору || изо всех Си-подобных языков.
Примеры использования:
x = a < 0 || a > 100 ? -1 : 1; myConfig = getFromFile() || getFromServer() || getDefaultConfig() : terminate();
Итоги
Аргентум использует привычные операторы для условий и блоков, но благодаря использованию типа данных optional вместо bool, он добавляет к ним новое измерение - они начинают не только передавать управление, но и данные. Благодаря этому синтаксис упрощается, выражения становятся более лаконичными и выразительными.
Аргентум не вводит ни одной новой конструкции, наоборот, убираются дублирующие.
Аргентум упрощает и инфорсит проверки на null, потерю weak, результатов приведения типов, индексов и ключей контейнеров с тем, чтобы эти проверки были естественной частью бизнес-логики, а не обработчиков исключений.
Внутреннее представление optional-типов бесплатно для всех указателей, и большинства типов значений.
