Как стать автором
Обновить

Заметка о PHP DomDocument

Время на прочтение 1 мин
Количество просмотров 1.5K
Потратив уйму времени на борьбу с правильным парсингом html документа (а именно DomDocument::loadHTML) в кодировке cp1251, хочу дополнить хороший пост о кодировке, парсинге и meta-тэге

ненадёжный вариант — мета-тэг идёт после тэга title

<html>
<head>
<title>заголовок</title>
<meta http-equiv="Content-type" content="text/html; charset=window-1251">
</head>
<body>
<div>текст</div>
</body>
</html>


* This source code was highlighted with Source Code Highlighter.



более надёжный вариант — мета-тэг идёт перед тэгом title, DomDocument правильно определяет кодировку

<html>
<head>
<meta http-equiv="Content-type" content="text/html; charset=window-1251">
<title>заголовок</title>
</head>
<body>
<div>текст</div>
</body>
</html>


* This source code was highlighted with Source Code Highlighter.



надеюсь кому-то сэкономит время эта неявная особенность
Теги:
Хабы:
-2
Комментарии 8
Комментарии Комментарии 8

Публикации

Истории

Ближайшие события

PG Bootcamp 2024
Дата 16 апреля
Время 09:30 – 21:00
Место
Минск Онлайн
EvaConf 2024
Дата 16 апреля
Время 11:00 – 16:00
Место
Москва Онлайн
Weekend Offer в AliExpress
Дата 20 – 21 апреля
Время 10:00 – 20:00
Место
Онлайн