Дерево и листья. Структура базы.

0

1

Никогда не занимался проектированием баз данных, посему вопрос.

Есть дерево, содержащее группы текстовых записей. Дерево построено по принципу Nested Sets. Дерево может быть, например, таким:

Корень
  Новости
    Новости на русском
    Новости на английском
    Новости на немецком
  Правила
    Краткое описание
      Что
      Где
      Когда
    Терминология
    Резюме
  Статьи
    Статьи на русском
      О проекте
    Статьи на английском
    Статьи на немецком

Каждую группу записей назовем, для простоты, веткой. База данных, содержащее данное дерево пусть называется tree.

У каждой ветки есть конечные записи - листья. Листья - это текстовые записи. Они лежат в другой базе - leaves. Они содержат заголовок, текст записи, время создания, время правки, автора, прочую информацию.

Вопрос. Как правильно связать листья и дерево? У меня два варианта:

1. Простой. В базе leaves добавить поле branch_id, которое будет указывать, какой ветке принадлежит запись.

2. Сложный. Создать еще одну базу со структурой один-ко-многим, в которой будет прописана связь branch_id -> leave_id. Ну, то есть в этой дополнительно базе будет указано, какой ветке какие записи принадлежат.

Какой вариант правильнее?

Ссылка

← Поиск аналитической формулы для набора данных

[quine][sh][dc] Смысл жизни →

Sedna?

Hoodoo ★★★★★
(20.10.11 01:13:15 MSK)

Как-то сложно. Проще не различать ветки и листья и запихнуть все в одну таблицу leaves. В таблице leaves, соответственно, добавить поле parent_leaf_id. А в алгоритме отображения прописать, что доп. свойства выводить у листа только в том случае, если у него нет дочерних листов например. Или если поле is_final_leaf установлено в true. Так будет проще листья с развитием структуры превращать в ветки.

ovk48 ★★★
(20.10.11 01:20:51 MSK)

Ответ на: комментарий от Hoodoo 20.10.11 01:13:15 MSK

> Sedna?

Ну какая седна? Просто MySQL.

~~webhamster~~
(20.10.11 01:40:48 MSK) автор топика

Ответ на: комментарий от ovk48 20.10.11 01:20:51 MSK

> Как-то сложно. Проще не различать ветки и листья и запихнуть все в одну таблицу leaves. В таблице leaves, соответственно, добавить поле parent_leaf_id. А в алгоритме отображения прописать, что доп. свойства выводить у листа только в том случае, если у него нет дочерних листов например. Или если поле is_final_leaf установлено в true. Так будет проще листья с развитием структуры превращать в ветки.

Так, понятно. Проектированием баз данных вы еще больше меня не занимались.

~~webhamster~~
(20.10.11 01:42:00 MSK) автор топика

Ответ на: комментарий от webhamster 20.10.11 01:42:00 MSK

>Так, понятно. Проектированием баз данных вы еще больше меня не занимались.

Я проектированием БД занимался и занимаюсь и считаю данное решение весьма удобным и гибким. Id и parent_id определяют иерархию, любые другие поля - данные. Другое дело, если ты хочешь иметь разный набор данных для веток и для листьев, но в приведенном тобой примере этого нет.

staseg ★★★★★
(20.10.11 01:54:19 MSK)

Ответ на: комментарий от webhamster 20.10.11 01:42:00 MSK

а совет imho не такой уже и плохой. всё равно slq одномерный, как не крути. но, подождём гуру этого дела.

beastie ★★★★★
(20.10.11 01:59:04 MSK)

Ссылка

Зависит от условий задачи и вложенностей

ИМХО, на первом уровне я бы делал ноды, связывая их по суррогатному ключу с листьями, далее бы делал пункт 1, то есть начиная со второго уровня листьев реализовывал бы parent->child

Но тут многое зависит от задачи, повторюсь

westtrd
(20.10.11 02:29:53 MSK)

Ссылка

>1. Простой. В базе leaves добавить поле branch_id, которое будет указывать, какой ветке принадлежит запись.

Вполне.

2. Сложный. Создать еще одну базу со структурой один-ко-многим, в которой будет прописана связь branch_id -> leave_id. Ну, то есть в этой дополнительно базе будет указано, какой ветке какие записи принадлежат.

Если у тебя один лист не может быть в двух ветках, то зачем вообще городить m2m?

anonymous
(20.10.11 03:09:30 MSK)

Ссылка

Ответ на: комментарий от staseg 20.10.11 01:54:19 MSK

> Я проектированием БД занимался и занимаюсь и считаю данное решение весьма удобным и гибким. Id и parent_id определяют иерархию, любые другие поля - данные. Другое дело, если ты хочешь иметь разный набор данных для веток и для листьев, но в приведенном тобой примере этого нет.

Конечно, разный набор данных для веток и листьев.

Меня интересует вот что. Если сделать по варианту 1, то выборку нужно будет делать из большой базы (база с листьями - большая по объему в мегабайтах). То есть, в большой базе нужно будет находить листья с указанным parent_id.

Если вынести эту связку в отдельную базу, то выборка будет происходить на микроскопической базе в которой всего-то два поля. А затем получив список записей, можно будет уже целенаправленно извлекать их из базы с листьями.

Вот я и думаю, будет ли второй способ меньше нагружать MySQL-базу чем первый способ?

~~webhamster~~
(20.10.11 03:43:44 MSK) автор топика

Ответ на: комментарий от webhamster 20.10.11 03:43:44 MSK

Вот я и думаю, будет ли второй способ меньше нагружать MySQL-базу чем первый способ?

imho нет. чисто логически: что там, что там тебе нужно выбрать n из мульёна. только во втором случае у тебя две таблицы.

а ля псевдокод:

SELECT * FROM leaves INNER JOIN tree ON leaves.parent == tree.id;

верзус

SELECT * FROM leaves WHERE parent == 'id';

хотя, тут тестить надо

beastie ★★★★★
(20.10.11 04:23:30 MSK)

Ответ на: комментарий от beastie 20.10.11 04:23:30 MSK

bugfix: к первому ещё надо добавить WHERE или что-то такое.

beastie ★★★★★
(20.10.11 04:29:43 MSK)

Ссылка

Ответ на: комментарий от webhamster 20.10.11 03:43:44 MSK

большая по объему в мегабайтах

а это вообще ещё копейки. KISS!

beastie ★★★★★
(20.10.11 04:31:30 MSK)

Ссылка

Ответ на: комментарий от webhamster 20.10.11 03:43:44 MSK

> Конечно, разный набор данных для веток и листьев.

И чем же кардинально отличаются ветка «Новости» и лист «Новости на русском»?

ovk48 ★★★
(20.10.11 08:38:08 MSK)

Ответ на: комментарий от ovk48 20.10.11 08:38:08 MSK

И чем же кардинально отличаются ветка «Новости» и лист «Новости на русском»?

«Новости на русском» - это ветка. В топике приведен пример дерева групп.

Ветка содержит обычно только заголовок, подзаголовок, текстовое описание, сопроводительную картинку.

Лист содержит заголовок, текст записи, время создания, время правки, автора, прочую информацию.

~~webhamster~~
(20.10.11 13:18:31 MSK) автор топика

Ответ на: комментарий от webhamster 20.10.11 01:40:48 MSK

Просто так с отступами всё расписано, чисто тебе XML.

Это было такое лаконичное предложение. :)

//Слежу за развитием темы с интересом. Кстати вот для настоящих индейцев ссылка: http://dba.stackexchange.com/

Hoodoo ★★★★★
(20.10.11 13:48:05 MSK)

Ссылка

nested sets же и использовать

легко гуглится

anonymous
(20.10.11 15:09:16 MSK)

Ссылка

Ответ на: комментарий от webhamster 20.10.11 13:18:31 MSK

Тривиально решается задача ваша.

Имеем таблицы:

TREEPOS(ID,PARENT_ID) - определяет иерархию и вложенность.

LEAF=(ID,TREEPOS_ID,<дополнительные поля для листьев>) - определяет содержимое листьев

NODE=(ID,TREEPOS_ID,<дополнительные поля для серединных узлов>) - определяет содержимое серединных узлов

Если появится необходимость заиметь разные типы листьев, то делаем это так:

LEAF=(ID, TREEPOS_ID)

LEAF_SIMPLE=(LEAF_ID,<поля для простых листьев>)

LEAF_COMPLEX=(LEAF_ID,<поля для сложных листьев>)

Проблема производительности пусть вас не очень волнует пока не встретили реальные а не предполагаемые затыки.

anonymous
(22.10.11 22:53:44 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

← Поиск аналитической формулы для набора данных

Development

[quine][sh][dc] Смысл жизни →

Похожие темы