Comments 2
# А
CODE_OF_FIRST_RUSSIAN_LETTER = 1040
# я
CODE_OF_LAST_RUSSIAN_LETTER = 1103
CODES_OF_RUSSIAN_SYMBOLS = list(
range(
CODE_OF_FIRST_RUSSIAN_LETTER,
CODE_OF_LAST_RUSSIAN_LETTER + 1
)
) + [1025, 1105] # Ё, ё
Замените числа на ord("A"), ord("я") и т.д.
Так и от комментариев избавитесь и код читабельнее
Обходит все английские страницы;
Из каждой страницы извлекает весь контент (похожий пример был в прошлой статье);
На нашем сайте большая часть текста, который видит пользователь, хранится в div с классом b-content. Поэтому тест извлекает контент из него с помощью метода find. Остальные блоки div мы тестируем отдельно;
Получает из контента все слова;
Проходится по каждому слову и по каждому символу;
Проверяет, что символ не является русским.
Зачем разбиваете на слова? Почему сразу по тексту не пробежаться?
Думали ли регулярку составить на русские буквы и проверить на совпадение сразу со всем текстом?
Если нужно выделить слова, содержащее русскую букву - регуляркой можно и такое сделать
Information
- Website
- pvs-studio.ru
- Registered
- Founded
- 2008
- Employees
- 51–100 employees
- Location
- Россия
- Representative
- Андрей Карпов
Как тестировать сайт на Django. Часть 2. JavaScript и русский текст на английских страницах