Tagire Jul 3 2008 at 21:01

Деревья в MySql/Php.

1 min

1.7K

Comments 30

khim Jul 3 2008 at 21:10

Всё зависит от того процента информации, которое достанется клиенту. Если ему достаётся 50-100% от содержимого дерева - то это вообще самый лучший способ, если 99% информации не используется (а это значит что дерево велико) - то вы зря гоняете кучу данных между SQL-сервером и PHP-скриптом и зря напрягаете интерпретатор PHP, если где-то посередине - то подумайте куда будут склоняться выши запросы в типичном случае...

Tagire Jul 3 2008 at 21:28

У меня ного маленьких деревьев, которые нужны целиком для генерации стрницы.

khim Jul 3 2008 at 21:57

Если данные нужны целиком - то это самый разумный способ. Сериализация и десериализация в PHP весьма быстры и никакой другой способ не даст тебе выигрыша в скорости/памяти. Есть проигрыш при добавлении данных в таблицу, но в большинстве Web-приложений им можно пренебречь. Единственная (но зачастую весьма серъёзная) беда этого способа - сериализация/десериализация данных, которые вообще можно было бы не трогать, но если этого нет - то ни о каких других вариантах и думать не стоит...

Tagire Jul 3 2008 at 22:15

Я неизменившиеся данные с помощью кэшлайта кэширую, так что этого нету.

UFO landed and left these words here

Tagire Jul 3 2008 at 21:28

У меня не одно дерево. Не буду же я получать всю таблицу изза одной сотой)

UFO landed and left these words here

Tagire Jul 3 2008 at 21:30

Читал я эту статью, у меня просто деревья на 10-20 элементов, и дерево нужно полностью.

Gunger Jul 3 2008 at 21:24

Очевидный недостаток — для поиска по этим элементам придется сделать какой-то хитрый поиск.

Было бы гораздо правильнее хранить сериализованное дерево в memcache, а всю структуру (каждый элемент — строка в таблице) в базе.

Tagire Jul 3 2008 at 21:26

Я закэшил дерево кэшлайтом)
И в этой задаче мне не надо делать поиск по дереву.

Tagire Jul 3 2008 at 21:35

Да и попросту говоря, я не умею memcache настраивать, да и возиться ради своего мелкого проекта лень)

Patrick Jul 8 2008 at 11:02

какой нафиг memcache ???? какая у вас посещаемость? 10-20 пользователей в день?

Tagire Jul 8 2008 at 11:10

Вообще-то этот проект для себя делался, и посещаемость не более 200-300 человек в день)
А фраза про nencache была ответом на предыдущий комментарий.

UFO landed and left these words here

Tagire Jul 3 2008 at 21:49

У меня в одной таблице данные, включая дополнительные поля итп, а в другой только сериализованное дерево, в котором хранится только id и name элемента.

nooze Jul 3 2008 at 22:25

О, коллега по несчастью :)
Мне приходилось боротся с этой задачей давно, я решил вопрос через подполнительное поле (`all_parents`), в котором в "[]" записывались значения всех предыдущих `parent_id`

Когда мне нужно было получить только ветку начиная с элемента 10 я, чтобы не выбирать базу рекурсивно (это реально жестоко) и не забирать таблицу целиком (что чуть лучше но тоже хрень) выбирал по типу: select * where `all_parents` LIKE '%[10]%'

Ну а потом уже средствами php разбирал полученный результат в дерево. Т.к. сами деревья были небольшие (20-30 элементов) php их строил моментально, в итоге все летало

nooze Jul 3 2008 at 22:27

Я конечно не претендую на идеальность, но в то время это было очень простое и логичное решение. Сделал бы я так же сейчас? Незнаю, может быть ;)

nooze Jul 3 2008 at 22:35

Даже интересно стало, решил вспомнить как работало :) Вроде так:
"-" для наглядности вложенности
Поля: имя - id,parent_id,all_parents

-мячи - 1,0,[0]
--футубол - 2,1,[0][1]
---красный - 4,2,[0][1][2]
----в полоску - 9,4,[0][1][2][4]
---синий - 5,2,[0][1][2]
---зеленый - 6,2,[0][1][2]
--теннис - 3,1,[0][1]
---зеленый - 7,1,[0][1][3]
-груши - 8,0,[0]

Для выбора ветки "футбол"
select * from `table` where `id`=2 OR `all_parents` LIKE '%[2]%'

В ответ получаем всю нужную ветку
--футубол - 2,1,[0][1]
---красный - 4,2,[0][1][2]
----в полоску - 9,4,[0][1][2][4]
---синий - 5,2,[0][1][2]
---зеленый - 6,2,[0][1][2]

В php разбираем простенькой рекурсией, получаем все что нужно

khim Jul 4 2008 at 05:09

Вы хоть представляете себе сколько времени всё это работает и какого нечеловеческого размера нужно дерево чтобы это было быстрее предложенного варианта?

hell Jul 4 2008 at 06:49

слегка меняем принцип заполнения столбца all_parents - записываем туда id текущей рубрики. И лучше делать не массивом, а строкой. получаем запрос вида select * from table where all_parents like '[0][1][2]%', шлепаем индекс на all_parents (не скажу за MySQL, на PostgreSQL делается, хотя и довольно специфически) и все пашет очень даже быстро - запрос на выборку поддерева с 5 - 10 Килоузлами и вложенностью 8 - 10 занимает от 5 до 0.5 mc (5 - без кеширования, 0.5 - с внутренним кешированием БД).
От всех проблем на insert/update это не спасает, но заведомо быстрее nested sets.

khim Jul 4 2008 at 07:55

Такой вариант уже чуть получше. Квадратные скобки излишни - достаточно одного разделителя. Но десериализация подобного дерева даст вам где-то те же 5ms - и вы будете иметь доступ ко всему дереву. В общем я бы стал использовать подобный подход для вариантов с несколькими тысячами узлов и тенденцией к увеличению их количества. Если же это, скажем, рубрики которые вам нужно отображать "кусочно", то ещё неизвестно что будет лучше (сколько времени будет обрабатываться запрос вида 'all_parents like "[0]%" or all_parents like "[0][1]%" ...' ? там же несколько раз придётся по базе пройтись), а уж по простоте написания вариант с деревьями в базе, а не в PHP точно проиграет...

nooze Jul 4 2008 at 12:19

Я ж говорю, не обязательно способ универсальный, все зависит от задачи. Но согласитесь, очень простое решение :) Я в то время знал mysql поверхностно (впрочем и сечас не сильно круто)

Tagire Jul 4 2008 at 12:28

Предложенный метод можно юзать хоть для текстовых файлов)

chill84 Jul 3 2008 at 23:13

Эммм.. может быть стоит использовать Materialized Path ? Или я не в теме?
http://phpwiki.ru/Tree/Mp

Tagire Jul 3 2008 at 23:38

я не в теме немного похоже, правда для моего случая мой способ лучше подошел, но этот надо запомнить, хорошо запомнить.

UFO landed and left these words here

hell Jul 4 2008 at 04:40

nested sets - замечательная штука, пока не возникает задача вставки элемента куда-нибудь в серединку, или в начало такого дерева. или задача перемещения ветви такого дерева. Как только дерево мало-мальски разрастается, insert и update начинают вполне конкретно тормозить (у меня эффект начинал наблюдаться уже на 1500 узлах).

DorBer Jul 4 2008 at 08:35

Nested sets идеально подходят для веба, в связи с тем, что там малое количество обновлений информации и много запросов на выборку. Doctrine кстати поддерживает nested sets (и не только) и сам делает всю черновую работу.

hell Jul 4 2008 at 10:08

Nested sets не идеально подходят для веба. Единственный плюс - вывод дерева в правильном порядке одним запросом. На сравнительно больших ветвистых деревьях (25 - 30 КилоУзлов) выигрыш по сравнению с альтернативными алгоритмами (я не имею в виду рекурсию) - около 2 - 3 секунд. на небольших - значительно меньше.
Минусы - вставки и переносы. К примеру у нас есть древовидный форум - вроде текущего обсуждения, но с бошльшей интенсивностью - что-нить вроде обсуждения последнего апдейта яндекса на searchengines. Я пытаюсь добавить комментарий, к примеру, ко второму сообщению в таком обсуждении, всего сообщений 1000. При добавлении будет апдейт по крайней мере 998 строк таблицы. Я не скажу наверняка про MySQL (хотя мне приходилось чистать, что insert и update - не самые сильные его стороны), но PostgreSQL на подобных задачах начинает откровенно загибаться.
Правильнее сказать, что nested sets идеально подходят для деревьев, которые уже никогда не изменятся, либо все изменения будут происходить вне уже сформированных веток. На весь веб я бы не обобщал

Patrick Jul 8 2008 at 11:01

как уже советовали Materialized Path и больше выдумывать нечего...