Anthony 17 июн 2008 в 00:33

Рекурсивные SQL запросы

2 мин

147K

SQL*

+33

Комментарии 51

PQR 17 июн 2008 в 00:58

Вопрос к аудитории: как вы решаете задачу вывода дерева в MySQL? Встроенные процедуры? Внесение избыточности в таблицы?

silentroach 17 июн 2008 в 01:43

сортировкой по идентификатору родителя =))
а остальное уже сделает клиент.

redhummer 17 июн 2008 в 04:18

Библиотеку DBSimple юзаем.

karneds 17 июн 2008 в 08:21

организовываем хранение дерева другими методами, в зависимости от условий ;)

НЛО прилетело и опубликовало эту надпись здесь

hannimed 17 июн 2008 в 10:07

Nested Sets

nfx 17 июн 2008 в 13:01

* можно какую-нить статью об етой технике?

если на базе РНР - буду вдвое рад. если на другом языке - тоже рад. но больше разбиратся будет. главное - по SQL нужно понять как ето нормально делать.

hannimed 17 июн 2008 в 13:02

Как раз на базе PHP и MySQL: http://www.getinfo.ru/article610.html

tigrenok 27 июн 2008 в 02:37

сервер помер... :(

megahertz 17 июн 2008 в 13:03

материала достаточно, вот например http://phpclub.ru/faq/Tree?v=w5u

dkrnl 17 июн 2008 в 10:42

nested sets + немного хранимых процедур по управлению деревом.
рекурсия, имхо плохо, по скрости чтения, ns самый быстрый метод хранение (про вставку узлом промолчим(: )

dkrnl 17 июн 2008 в 10:44

* вставку узов, опечатка, извините

SchTiRlic 17 июн 2008 в 12:22

Я храню данные в подобной же таблице (id - идентификатор элемента, id_parent - идентификатор родителя, data - какие нибудь доп. данные элемента дерева). Затем делаю выборку всей таблицы в массив (arrData). По полям id и id_parent функцией рекурсивного обхода выстраиваю ещё один вложенный многомерый массив (т.е. массив масивов, в которых могут быть элементы массивов), который представляет собой структуру дерева (arrStructure). И потом по этим двум массивам, масиву труктуры и массиву данных, делаю вывод. Т.е. обхожу полностью массив структуры определяю положение и расставляю данные.

Наверняка лучше сделать такое хранимой процедурой на сервере СУБД.

Был так же вариант без рекурсии, он быстрее работает чем с рекурсией, но настолько незначительно (проводились тесты с несколькими тысячами записей), что сложность его реализации проигрывает перед легкостью реализации с рекурсией. Поэтому решено было всё таки рекурсией реализовывать построение структуры дерева.

А вот насчёт сортировки по идентификатору родителя, простите, но это бред, так правильной структуры дерева не достичь, т.к. вложенность может быть бесконечно большой.

diamant 17 июн 2008 в 16:24

имхо, хранимая процедура, быть может, и проще в использовании, но она создаёт большую нагрузку на сервере СУБД.
во всяком случае, у нас тут не рекомендуется даже "ORDER BY" использовать, а сортировать на сервере приложения. но это всё имхо и частные случаи, у вас может быть всё иначе

SchTiRlic 19 июн 2008 в 08:07

Я отписал лишь по поводу того, что возможно было лучше. На данный момент у нас реализована сортировка и оброаботка массивов данных именно на сервере приложения.

megahertz 17 июн 2008 в 12:22

Юзаю materialized path. Конечно, Nested Sets часто побыстрее работает, но зато matpath удобней, легко ручками править дерево. Особенно удобно, когда в БД храниться структура сайта и применяется mod_rewrite. в этом случае, берем url и простеньким запросом находим нужную нам ветвь (в этом случае в качестве пути применяю латинские имена узлов, а не id)

maxic 23 июн 2008 в 18:44

Не всегда NS быстрее работает :), да и измененный (замечу измененный, жаль мало реализаций, но на коммерческих есть что посмотреть) mp не только удобней, но целостней NS + возможно перенести почти под любую СУБД без сильных изменений.

biduin 17 июн 2008 в 18:44

Могу кинуть create proc, но оно не влазит в коммент.
Подскажите, как сделать - кину...

PQR 17 июн 2008 в 22:45

http://pastebin.com/

biduin 18 июн 2008 в 14:34

Ну собственно вот... hттp://pastebin.com/f58ed1208
Только не бейте ногами за динамич. SQL.
работает достаточно быстро.
Главное для меня - мегауниверсальность...

Gaen 17 июн 2008 в 02:33

до этого я думал что знаю mysql

-1

JStingo 17 июн 2008 в 02:56

Это MS SQL.

XaocCPS 17 июн 2008 в 07:36

не совсем, дело в том, что приведенный пример парсится с ошибкой
почему это так я написал ниже

Anthony 17 июн 2008 в 09:33

Это не MS SQL. На самом деле это стандарт SQL 99. Эту конструкцию поддерживают: DB2, Sybase iAnywhere, MS SQL. Не знаю как Oracle, но там точно есть другая конструкция типа:

select ...
from tree_sample
start with id = ....
connect by prior id = id_parent

* This source code was highlighted with Source Code Highlighter.

JStingo 17 июн 2008 в 09:37

См. ниже — я уже писал об этом.

Anthony 17 июн 2008 в 09:40

Пардон, не досмотрел.

JStingo 17 июн 2008 в 03:00

Хммм. Честно в описаниях по PL/SQL не встречал такой конструкции, обычно везде приводят «родную» конструкцию вида start with ... connect by ... . В очередной раз убеждаюсь, что оракл всегда бежал впереди паравоза=)
Спецы по PostgreSQL поделитесь, как у вас с этим?

XaocCPS 17 июн 2008 в 07:33

Автору стоит указать, что в MS SQL (даже в 2008) нет ключевого слова recursive, в этой СУБД его следует опускать

Anthony 17 июн 2008 в 09:39

Спасибо, исправил.

hannimed 17 июн 2008 в 10:06

Автору спасибо. Теперь подумаю, чтобы вернуться к нормальным деревьям, вместо этих Nested Sets... хотя и к ним уже привык.

Anthony 17 июн 2008 в 10:16

Я думаю, что Nested Sets будут побыстрее работать, хотя не сравнивал. Конечно, Nested Sets гораздо сложнее реализуются. Надо будет попробывать провести эксперимент по сравнении скорости для разных способов реализации дерева.

kibitzer 17 июн 2008 в 10:25

Действительно, nested set при выборке из него будет работать быстрее. Сложности в нем нет по одной причине - его уже столько раз обмусолили и сделали столько реализаций... что думать уже даже ненадо :) При необходимости и в nested set можно столбец parent_id добавить(иногда бывает полезно).

XaocCPS 17 июн 2008 в 11:06

Я был бы рад если бы вы поэкспериментировали с новым типом hierarchyid для MS SQL 2008 и сообщили нам о своих результатах. Этот тип как раз и придуман для реализации иерархий.

Anthony 17 июн 2008 в 11:25

Я попытаюсь попробывать, правда MS SQL 2008 у меня нет, но думаю найду.

dewil 17 июн 2008 в 10:19

В PostgreSQL есть библиотека ltree. Позволяет получать дерево простым селектом и очень быстро. Дерево хранится в своем типе, и не очень удобно в манипуляциях (перенос веток). Для манипуляций писал свои функции, но процесс получения самого дерева или ветки - песня.

bizzona 17 июн 2008 в 10:48

можно не использовать ключевое слово recursive - а просто 'with' - создаётся временное представление. Жаль что в MySQL нельзя в таком же духе строить рекурсию. На днях пришлось использовать старый дедовский способ - рекурсию делать на клиенте.

kibitzer 17 июн 2008 в 10:53

А через хранимые процедуры не получалось реализовать(для MySQL)?

bizzona 17 июн 2008 в 11:10

хотелось бы использовать но хостер не позволяет использовать хранимые процедуры - на мой запрос - посоветовали перейти на vps.

bat 17 июн 2008 в 11:13

Автору следовало бы указать, что это называется Common Table Expressions (CTE) и, очевидно, ничего общего с рекурсивными запросами в Oracle не имеет. Кроме того, CTE используются не только не только для рекурсии.

P.S.
Возможно, следует перенести топик в блог по SQL.

Anthony 17 июн 2008 в 11:23

Топик я перенес. У меня просто кармы не было, чтобы туда написать.
Я писал просто про рекурсивные запросы, а не про Common Table Expressions (CTE), поэтому решил, что это лишнее.
Oracle я никогда не использовал и так и не смог найти поддерживает ли он этот синтаксис, поэтому решил просто указать, что это часть стандарта SQL 99 и каждая база, которая полностью поддерживает этот стандарт должна поддерживать и эту конструкцию. Oracle, как я понял, не поддерживает ни эту конструкцию ни SQL 99, а придерживается своих стандартов.

bat 17 июн 2008 в 14:16

Я писал просто про рекурсивные запросы, а не про Common Table Expressions (CTE), поэтому решил, что это лишнее.

Как раз наооборот, ибо надо показать откуда ноги растут и в каком направлении копать, в случае углубленного изучения.

Shama 17 июн 2008 в 12:40

Стандарт для крупных промышленных разработок - Oracle. Там конструкция "connect by prior" уже давно и работает неплохо. В других случаях и базы, и нагрузки поменьше.

-3

Anthony 17 июн 2008 в 13:03

Oracle стандартом не является. Он очень популярен у нас в стране, так как часто его получали бесплатно.
Например, в США DB2 не сильно отстает от Oracle по использованию.

Shama 17 июн 2008 в 13:10

Ну да, забыл добавить, у нас в стране.

Насчет "бесплатно" не знаю, но некоторым предприятиям уже надоедает платить за эту СУБД и посматривают в сторону MySql. Только не вижу в этом смысла, у них всё повалится моментально от перегруза.

Lain_13 17 июн 2008 в 14:25

Зря вы так думаете про MySQL, им даже Гугл пользуется. Там другая проблема хранимые процедуры. Их придется заново реализовывать на чём-то отдельном от мускула.

Terion 5 апр 2010 в 22:01

postgres им в помощь

Lain_13 17 июн 2008 в 14:40

Был у меня случай, когда нужно было построить дерево из однонаправленного графа, т.е. переходы происходят строго в одном направлении, но ветки могут как расходиться, так и сходиться.
На Оракле я решил это хранимой процедурой, которая помещала в локальную таблицу (ту, то из type объявить можно) корневые элементы, проставляла им айдишники и начинала вычитывать для каждой позиции из локальной таблицы её потомков, добавлять их в конец списка и проставлять им парентом айдишник элемента, по которому они вычитывались. До и после вычитки потомков элемента запоминалась количество элементов (локальные счетчики, просто инкрементились при добавлении). Если мы приходили в конец списка и для последнего элемента потомков больше не обнаруживалось построение дерева останавливалось.
В случае неоднонаправленного графа пришлось бы плясать с проверкой на вхождение добавляемого элемента в список уже существующих, что невероятно затормозило бы алгоритм, но, к счастью, обошлось.