Хабр Курсы для всех
РЕКЛАМА
Практикум, Хекслет, SkyPro, авторские курсы — собрали всех и попросили скидки. Осталось выбрать!
pygmentize.py -O style=native,encoding=utf-8,full=true,outencoding=cp1251,noclasses=true -o manage.py.html manage.py
>>> ['аб', 'вг'].index('вг')
1>>> print u'Вася Пупкин'.upper() ВАСЯ ПУПКИН $ python -V Python 2.5.2
print unicode(a).upper()
>>> a=raw_input() абв >>> a '\xd0\xb0\xd0\xb1\xd0\xb2'
>>> print a абв
>>> a8 = unicode(a, 'utf-8') >>> a8 u'\u0430\u0431\u0432'
>>> print a8.upper() АБВ >>> print a.upper() абв
>>> class Str(str):
... def __repr__(self):
... return "'" + self + "'"
...
>>>
>>> s=Str("фбв")
>>> s
'фбв'>>> type(u'абв')
<type 'unicode'>
>>> type('абв')
<type 'str'>>>> import re
>>> reg = re.compile(u'АБВ')
>>> print reg.match(u'АБВ')
<_sre.SRE_Match object at 0xb7df0218>
>>> print reg.match(u'абв')
None
# вроде бы работает, но на самом деле - нет.
# получается примерно та же проблема как с цепочкой байт
>>> reg = re.compile(u'АБВ', re.IGNORECASE)
>>> print reg.match(u'АБВ')
<_sre.SRE_Match object at 0xb7df01e0>
>>> print reg.match(u'абв')
None
# Дело в том, что нужно везде указать, что вы используете unicode-объекты:
>>> reg = re.compile(u'АБВ', re.UNICODE | re.IGNORECASE)
>>> print reg.match(u'абв')
<_sre.SRE_Match object at 0xb7df0250>
>>> print reg.match(u'АБВ')
<_sre.SRE_Match object at 0xb7df0250>
* This source code was highlighted with Source Code Highlighter.
tt = intervalmap( slice('08:00', '12:00'), 'Иванов')
Интервально-ассоциативный массив