Доброе время суток, просьба не пинать, это моя первая статья, подробности под катом. В PHP есть DOMDocument. Спасибо за внимание, если есть ошибки — в ПМ, если есть вопросы — в комментарии, если интересно — продолжу тему позже.
Тем не менее, это знание может оказаться очень полезным для тех, кто не пишет профессионально на PHP, но нуждается в несложных скриптах для обработки HTML. Люди пытаются использовать регекспы и sed для парсинга там, где достаточно PHP-скрипта из пяти строчек.
Очистка HTML-тегов от атрибутов