highw Jul 25 2009 at 21:01

Игры с XPath

4 min

29K

XML*

Comments 23

sse Jul 25 2009 at 21:30

>> Первоисточник
Это не первоисточник, это копи-cпи$динг

-5

highw Jul 25 2009 at 21:34

лолик. это мой сайт:)

-4

sse Jul 25 2009 at 21:39

Т.е. вы все свои статью сюда собираетесь копи-пастить?

Я к тому, что в вашей «оригинальной» статье есть ссылка «Первоисточник», которая ведет на саму себя. Вы когда копипастите сюда или отсюда в блог, хоть смотрите, как копируете.

highw Jul 25 2009 at 21:42

Сколько злости то…
Подготовил статью для публикаций, в чем проблема?

Забыл в оригинале убрать — сейчас уберу.

-2

sse Jul 25 2009 at 21:45

Злость — это, кажется, у читателей: вот и коммент заминусовали; я просто обратил ваше внимание на досадную оплошность.

P.S. Правила Хабра в явном виде запрещают кросс-постинг; надеюсь, у вас не будет проблем.

centur Jul 25 2009 at 21:49

/ — это не узел, это указатель на сам корень. Т.е. используя / вы переводите XPath на поиск от корня документа

// — тоже не совсем верно — это не множество узлов, это указание на произвольную глубину поиска указанной ноды. Т.е. //row найдет вам и /item/row и /item/mynest/row и /item/mynest/subtree/subnest/pod/row.

Ну еще дополню — [] это не аналог (), ну не то что бы не аналог, просто для людей не знающих синтаксиса РНР совсем непонятно.
[] — это предикат, который проверяется на истинность ( т.е. проверяемая строка попадет в результат если все ее предикаты истинны. Добавлю что можно писать несколько предикатов подряд, чтобы легче читалось.

И еще, насколько я вижу, ваше выражение людей не работающих в IBM — неверное, banned у василия говорит от том что он уже тоже НЕ работает в IBM
//row[name[not(@company='ibm')]]

правильнее будет еще добавить проверку статуса
//row[name[@company !='ibm' or @status !='banned']]

Вообще, насколько мне известно — почти во всех языках XPath очень дорогое (ресурсоемкое) удовольствие (особенно если система не затачивалась специально под работу через xpath), так что называя это достойной заменой, надо делать определенные оговорки, а то все достоинства испарятся.

Как пример — буквально в пятницу в небольшой утилите надо было разбирать 15 метров xml фрагментов. Оказалось ГОРАЗДО выгоднее переложить все 15000 записей об объектах в память, в большую хэш-таблицу, чем каждый раз гонять xpath и извлекать только конкретный объект для текущей итерации.

centur Jul 25 2009 at 21:53

Добавлю еще — на мой взгляд, статья слабовата для того чтобы быть достойной быть написанной :). Подобные базовые знания легко можно почерпнуть в любом источнике. А вот допущенные неточности и ошибки — могут ввести в заблуждение неопытных товарищей.

highw Jul 25 2009 at 21:53

// неверное, banned у василия говорит от том что он уже тоже НЕ работает в IBM
Я хотел больше показать работу, а не нагружать логикой пример)

спасибо за поправки

centur Jul 25 2009 at 21:57

welcome to nitpicker corner :)

shai_xylyd Jul 25 2009 at 21:51

Эмоциональная реакция: скучно.

По существу: ни заголовок, ни текст до хабраката не дают понять, что игры будут не только XPath, но и с PHP. Так же информация достаточно поверхностная. Проверили бы хотя бы работу библиотеки с юникодом (UTF-8, UTF-16).

sylvio Jul 25 2009 at 21:51

Как при помощи XPath можно выбрать элемент с максимальным значением атрибута?

Regis Jul 25 2009 at 22:51

Простой ответ — никак. Эта задача выходит за рамки задач XPath.

Сложный ответ — задать условие, когда значение атрибута найденного элемента будет выше предыдущего найденного значения атрибута. Но учтите — это будет работать весьма медленно. Намного лучше будет просто найти все нужные элементы и уже непосредственно средствами своего языка программирования выполнить поиск наибольшего.

razetdinov Jul 25 2009 at 23:51

item[not(../item/@attr > @attr)]
item[not((preceding-sibling::item | following-sibling::item)/@attr > @attr)]

centur Jul 26 2009 at 00:35

имхо — отсортировать и взять первый. Но это уже действительно — уже xslt

remal Jul 26 2009 at 01:39

В XPath2.0 есть функция max. Правда XSLT2.0 процессоров мало. К примеру: saxon.sourceforge.net/

highw Jul 25 2009 at 21:55

Понял, в необходимо окунуться в более сложные схемы и показать как это.
Взял на заметку.

razetdinov Jul 25 2009 at 22:09

Есть ощущение, что автор изучал XPath по примерам, не читая документацию. Пожалуйста, не вводите читателей в заблуждение:

/ не просто узел, а корневой узел;
// не множество узлов, а сокращение для /descendant-or-self::node()/;
* выбирает не любые символы, а только дочерние узлы-элементы (например, сюда не попадают текстовые узлы).

Вместо //row[name[@company='ibm']] лучше писать //row[name/@company='ibm'].

highw Jul 25 2009 at 22:13

Это я и имел ввиду, нечетко написал.

-2

remal Jul 26 2009 at 01:46

> Вместо //row[name[@company='ibm']] лучше писать //row[name/@company='ibm']
Это не одно и то же. В первом случае мы перебираем все теги name и проверяем их атрибут. Во втором сравниваем *последовательность* name/@company со строкой. Xslt2.0 процессоры будут сильно ругаться на такое.

razetdinov Jul 26 2009 at 02:02

Насколько я знаю, в XPath 1.0 сравнивается набор узлов. Не могли бы вы объяснить, на что именно ругаются процессоры XSLT 2.0? В документации ничего подозрительного не нашёл.

remal Jul 26 2009 at 02:30

Ругаются на ошибку преобразования типов. В документации, если поискать «compatibility mode», всякие «raise error» очень часто встречается рядом.

Вполне возможно конкретно данное выражение сработает. Вполне возможно, сработает корректно. На часах 2:20 проверять лень, извините…

Проблемы в любом случае начнутся, если понадобиться усложнить условие, использовав функции. При вызовах функций типы проверяются жестко. Поэтому имеет смысл сразу писать так, чтобы потом не исправлять.

ЗЫ: Безусловно, есть XPath 1.0 compatibility mode, но и он не всегда спасает.
ЗЗЫ: www.ozon.ru/context/detail/id/3964217/ вот тут об этом написано на странице 38.

alekciy Jul 26 2009 at 02:02

В свете наличия хорошего перевода спецификации на русский язык ценность данного материала сомнительна. А уж при таком количестве неточностей да еще кросспостингом и вовсе входит в минус.

klimin007 Nov 22 2022 at 15:42

Я думал, что "игры" с XPath — это что-то типа https://topswagcode.com/xpath/

Show the best of all time