ring0 Dec 26 2009 at 09:13

Rails и полиморфные связи

3 min

7.6K

Ruby on Rails *

+12

Comments 24

benone Dec 26 2009 at 10:21

Да никаких подводных камней. Просто ActiveRecord унифицированная модель для нескольких БД. И не везде есть ENUM.

Конечно же, надо каждую табличку после стандартных миграций допиливать — добавлять индексы, внешние ключи, менять типы. Та же ситуация не только с полиморфными связями, но и с STI

ring0 Dec 26 2009 at 10:36

Согласен, видимо поэтому в типовых примерах указывают
…
t.string :resource_type
t.integer :resource_id
…

mpetrunin Dec 26 2009 at 11:38

Если бы вы добавили краткую аннотацию, что такое полиморфные связи, зачем они нужны и в чём преимущество их использования, мне кажется статья стала бы полнее и полезнее.

ring0 Dec 26 2009 at 12:09

В самом деле. Добавлю.

ognevsky Dec 26 2009 at 19:54

у меня сейчас в черновиках валяется статья, уже пару дней тружусь, именно про то, что такое полиморфные ассоциации и как их использовать. Поначалу даже подумал, что это моя статья каким-то образом появилась в общей ленте:) Знатно испугался, знаете ли:)

ring0 Dec 26 2009 at 20:47

Ну я же не телепат :) С удовольствием почитаю вашу статью.

ognevsky Dec 26 2009 at 20:55

Я опять за нее взялся, думаю выложить в понедельник, а то RoR-статьи не особо пользуются спросом, в выходной быстро вниз уйдет :(

ring0 Dec 26 2009 at 23:30

Да не, вроде нормально. Ну можно еще в гуглгруппе написать пост, основное же сообщество там.

ognevsky Dec 26 2009 at 23:51

было бы кого там этому учить:)

ring0 Dec 27 2009 at 00:17

Ну в группе очень много человек, просто не каждый там себя проявляет. В любом случае спросить мнения стоит.

Paxa Dec 26 2009 at 15:58

Более наглядно результаты выглядили бы на графике

ring0 Dec 27 2009 at 00:31

К сожалению нет. Данные формировались псевдослучайно, и видно что разброс не велик, поэтому я и решил взять матожидание и не строить график. Ниже в комментариях я привел ссылку на скрипт генерации данных.

UFO landed and left these words here

ring0 Dec 27 2009 at 00:20

это не так :) просто не все тут.

ingeniarius Dec 26 2009 at 17:47

А кто прокомментирует момент с изменением ENUM на большом количестве данных?
Спасибо за тесты.

ring0 Dec 26 2009 at 17:55

Поясните пожалуйста детальнее. Не совсем понятно что вы подразумеваете под изменением ENUM и о каком количестве данных идет речь?

ingeniarius Dec 26 2009 at 18:06

Изменение схемы имеется ввиду, когда добавляется новое значение в ENUM, например.

ring0 Dec 26 2009 at 18:43

Попытаюсь получить точные цифры. Если на глаз, то порядка 10 минут на 1000000 записей.

ring0 Dec 26 2009 at 18:45

Причем мой MySQL идет со стандартным конфигом, и компьютер у меня не то что бы очень.

ring0 Dec 26 2009 at 20:51

Обещанные данные:
1. ENUM -> VARCHAR — 1053.34708200 секунд
2. VARCHAR -> ENUM('Post','Image') — 535.87988500 секунд
3. ENUM('Post','Image') -> Enum('Post','Image','Something') — 826.80801800 секунд

на 1000000 записей.

zed_0xff Dec 27 2009 at 07:31

а ENUM('Post','Image','Reserved1','Reserved2') -> ENUM('Post','Image','Something','Reserved2') — сколько секунд?

осмелюсь предположить что где-то около 0.2с :)

Source Dec 26 2009 at 18:16

Что-то неоднозначные соотношения в результирующей таблице наводят на мысли о неодинаковости наборов исходных данных. Надо было одним скриптом оба варианта заполнять, чтобы все посты в обоих случаях имели одни и те же комментарии.

P.S. В независимости от того какой вариант быстрее в реальности, нет смысла вводить ENUM пока в результате профайлинга реального приложения не доказано, что использование VARCHAR является узким местом в производительности.
Ибо преждевременная оптимизация — одно из самых больших зол в программировании.

ring0 Dec 26 2009 at 18:31

Данные одинаковы в обоих таблицах. В подтверждение вот скрипт генерации gist.github.com/264003

Насчет преждевременной оптимизации, как мне кажется, речи не идет. Скорее тут вопрос проектирования БД. Разумеется можно оставлять VARCHAR, и потом по необходимости менять. Зависит от проекта и лично опыта.

LightAlloy Dec 27 2009 at 07:49

Если я не ошибаюсь, то, что вы описываете в качестве альтернативы — это STI(Single Table Inheritance). Вообще вот здесь написано, что стоит использовать их не стоит, т.к. «модели будут связаны намертво» и потом их фиг отдерёшь друг от друга. Но вообще STI — иногда очень удобная штука, поэтому в каждом случае нужно решать отдельно, что вы будете использовать.