Pull to refresh

Comments 10

Мне кажется странным поддерживать в движке регулярных выражений какую-то определенную кодировку юникода, пусть даже такую распространенную как UTF-8. Из статьи я понял, что огромный класс проблем был только от того, что нужно было реализовать поиск именно в байковом представлении UTF-8. Может быть было бы эффективнее искать сразу в кодпоинах Юникода?

Судя по всему, даже используя алфавит из кодпоинтов Юникода всё равно получаем огроменные символьные классы (и, соответственно, гигантские автоматы). При этом теряется универсальность и ещё, наверное, пришлось бы часть движков делать в двух экземплярах - один экземпляр для алфавита на основе байт, а второй - для алфавита из Юникодных кодпоинтов.

Не поверил своим глазам, как раз искал статьи про устройство Regex для решения одной задачи с LeetCode. Спасибо огромное

Сорян, но поясните для меня, что такое "крейт" и "трейт"? Даже википедия ничего не знает по теме.

Crate - это так в rust называются библиотечные модули, иногда их называют пакетами. Trait - это что-то вроде интерфейса - набор методов, которые реализованы для конкретного типа данных. В русскоязычной литературе встречается термины "характеристика" и "типаж".

Crate — это так в rust называются библиотечные модули, иногда их называют пакетами.

Немного не так. Crate — "единица компиляции", это может быть как библиотека, так и исполняемый файл. Подробнее вот тут.

Sign up to leave a comment.

Articles