Символ — это, например, «CYRILLIC SMALL LETTER A», а байт — это нолики и еденицы, например '\xe0'. Для того, что б байт стал символом, необходима кодировка. И в зависимоти от кодировки, этот байт (или байты) может представлять разные символы.
Если строго, то html по классификации Хомского принадлежыт к типу 2 (контекстно-свободные), в тоже время регулярки — 3 тип. То есть html нельзя описать (а значит и пропарсить) с помощью regexp.
And to those taking the thread seriously: this is all in jest. We
won't change the indexing base. The idea is so preposterous that the
only kind of response possible is to laugh with it.
(Коротко — «Ребята, это просто шутка»)
Второй ответ Гвидо, который понял, что некоторые восприняли идею всерьёз:)
У раздела «Дифференциальное выделение границ» замечательное содержание :)
Если вспомнили Собеля, грех не вспомнить оператор Лапласа. Если уж расписали обе матрицы для оператора Собеля, стоить добавить формулу для вычисления направления границы — «a = arctg(A*Gx / A*Gy)».
Из как уже заметили, метод Канни(Canny) — де-факто основной метод распознавания границ на изображении на сегодня, но о нем ни слова.
>он используется очень часто
Странно. До публикации статьи на гуглом находилось всего несколько научных статей-книг с упоминанием алгоритма.
> дерево кластеров
> нет необходимости заранее фиксировать число кластеров
Это всем известные преимущества иерархических методов. Не видел смысла о них упоминать еще раз.
> Только вот вы почему-то это дерево в статье не привели
Я бы с радостью, только здесь на порядок больше нужно было поработать над представлением результатов (дерево надо красиво нарисовать, точки на рисунках удобно пронумеровать) — а я пока так себе владею matplotlib.
Идея в построение отношения, которое обладает свойством эквивалентности. В книге есть определения теоремы, которая утверждает что отношение эквивалентности разбивает множество на попарно непересекающиеся классы эквивалентных элементов.
Я бы с удовольствием интерпретировал это определение, но мои познания с теории множеств не позволяют :)
if fn and type(fn)==MethodType
стоило бы заменить наisinstance(fn, MethodType)
.А по делу — хорошая демонстрация развития идеи и возможностей Пайтона :)
— no worse than the current algorithm in worst case (O(nm))
отсюда — effbot.org/zone/stringlib.htm
won't change the indexing base. The idea is so preposterous that the
only kind of response possible is to laugh with it.
(Коротко — «Ребята, это просто шутка»)
Второй ответ Гвидо, который понял, что некоторые восприняли идею всерьёз:)
Вы издеваетесь? Эти алгоритмы успели уже много раз появится, стать взрывобразно популярными, забыться и заново возродится.
Если вспомнили Собеля, грех не вспомнить оператор Лапласа. Если уж расписали обе матрицы для оператора Собеля, стоить добавить формулу для вычисления направления границы — «a = arctg(A*Gx / A*Gy)».
Из как уже заметили, метод Канни(Canny) — де-факто основной метод распознавания границ на изображении на сегодня, но о нем ни слова.
>не очень известного, но крайне интересного иерархического метода
никак не имела ввиду редкость иерархических методов вообще, а только редкость конкретного метода.
п.с. у Вас отличные статьи о распознавание образов :)
Странно. До публикации статьи на гуглом находилось всего несколько научных статей-книг с упоминанием алгоритма.
> дерево кластеров
> нет необходимости заранее фиксировать число кластеров
Это всем известные преимущества иерархических методов. Не видел смысла о них упоминать еще раз.
> Только вот вы почему-то это дерево в статье не привели
Я бы с радостью, только здесь на порядок больше нужно было поработать над представлением результатов (дерево надо красиво нарисовать, точки на рисунках удобно пронумеровать) — а я пока так себе владею matplotlib.
lastpass.com
keepass.info
Я бы с удовольствием интерпретировал это определение, но мои познания с теории множеств не позволяют :)
> процесс какого вида мог к нему привести
Похоже на предметную область теории конечных автоматов.
> питон под рукой
http://codepad.org
Ищем отличия и смотрим, что такое ROT_TWO:
Swaps the two top-most stack items. (дока)
И так, на самом деле вариант с упаковыванием-распаковыванием списков потребляет меньше памяти. Компилятор умный, он оптимизирует.
с itertools превратится в