Представления (VIEW) в MySQL

    В комментариях Хабра упоминались вопросы по использованию представлений. Данный топик является обзором представлений, появившихся в MySQL версии 5.0. В нем рассмотрены вопросы создания, преимущества и ограничения представлений.

    Что такое представление?


    Представление (VIEW) — объект базы данных, являющийся результатом выполнения запроса к базе данных, определенного с помощью оператора SELECT, в момент обращения к представлению.

    Представления иногда называют «виртуальными таблицами». Такое название связано с тем, что представление доступно для пользователя как таблица, но само оно не содержит данных, а извлекает их из таблиц в момент обращения к нему. Если данные изменены в базовой таблице, то пользователь получит актуальные данные при обращении к представлению, использующему данную таблицу; кэширования результатов выборки из таблицы при работе представлений не производится. При этом, механизм кэширования запросов (query cache) работает на уровне запросов пользователя безотносительно к тому, обращается ли пользователь к таблицам или представлениям.

    Представления могут основываться как на таблицах, так и на других представлениях, т.е. могут быть вложенными (до 32 уровней вложенности).

    Преимущества использования представлений:

    1. Дает возможность гибкой настройки прав доступа к данным за счет того, что права даются не на таблицу, а на представление. Это очень удобно в случае если пользователю нужно дать права на отдельные строки таблицы или возможность получения не самих данных, а результата каких-то действий над ними.
    2. Позволяет разделить логику хранения данных и программного обеспечения. Можно менять структуру данных, не затрагивая программный код, нужно лишь создать представления, аналогичные таблицам, к которым раньше обращались приложения. Это очень удобно когда нет возможности изменить программный код или к одной базе данных обращаются несколько приложений с различными требованиями к структуре данных.
    3. Удобство в использовании за счет автоматического выполнения таких действий как доступ к определенной части строк и/или столбцов, получение данных из нескольких таблиц и их преобразование с помощью различных функций.

    Ограничения представлений в MySQL


    В статье приведены ограничения для версии MySQL 5.1 (в дальнейшем их число может сократиться).
    • нельзя повесить триггер на представление,
    • нельзя сделать представление на основе временных таблиц; нельзя сделать временное представление;
    • в определении представления нельзя использовать подзапрос в части FROM,
    • в определении представления нельзя использовать системные и пользовательские переменные; внутри хранимых процедур нельзя в определении представления использовать локальные переменные или параметры процедуры,
    • в определении представления нельзя использовать параметры подготовленных выражений (PREPARE),
    • таблицы и представления, присутствующие в определении представления должны существовать.
    • только представления, удовлетворяющие ряду требований, допускают запросы типа UPDATE, DELETE и INSERT.

    Создание представлений


    Для создания представления используется оператор CREATE VIEW, имеющий следующий синтаксис:
    CREATE [OR REPLACE]
    [ALGORITHM = {UNDEFINED | MERGE | TEMPTABLE}]
    VIEW view_name [(column_list)]
    AS select_statement
    [WITH [CASCADED | LOCAL] CHECK OPTION]

    * This source code was highlighted with Source Code Highlighter.

    view_name — имя создаваемого представления. select_statement — оператор SELECT, выбирающий данные из таблиц и/или других представлений, которые будут содержаться в представлении

    Оператор CREATE VIEW содержит 4 необязательные конструкции:
    1. OR REPLACE — при использовании данной конструкции в случае существования представления с таким именем старое будет удалено, а новое создано. В противном случае возникнет ошибка, информирующая о сществовании представления с таким именем и новое представление создано не будет. Следует отметить одну особенность — имена таблиц и представлений в рамках одной базы данных должны быть уникальны, т.е. нельзя создать представление с именем уже существующей таблицы. Однако конструкция OR REPLACE действует только на представления и замещать таблицу не будет.
    2. ALGORITM — определяет алгоритм, используемый при обращении к представлению (подробнее речь об этом пойдет ниже).
    3. column_list — задает имена полей представления.
    4. WITH CHECK OPTION — при использовании данной конструкции все добавляемые или изменяемые строки будут проверяться на соответствие определению представления. В случае несоответствия данное изменение не будет выполнено. Обратите внимание, что при указании данной конструкции для необновляемого представления возникнет ошибка и представление не будет создано. (подробнее речь об этом пойдет ниже).

    По умолчанию колонки представления имеют те же имена, что и поля возращаемые оператором SELECT в определении представления. При явном указании имен полей представления column_list должен включать по одному имени для каждого поля разделенных запятой. Существует две причины по которым желательно использовать явное указание имен полей представления:
    1. Имена полей представления должны быть уникальны в пределах данного представления. При создании представления основанного на нескольких таблицах возможна ситуация повторения имен полей представления. Например:
      CREATE VIEW v AS SELECT a.id, b.id FROM a,b;

      * This source code was highlighted with Source Code Highlighter.
      Для избежания такой ситуации нужно явно указывать имена полей представления
      CREATE VIEW v (a_id, b_id) AS SELECT a.id, b.id FROM a,b;

      * This source code was highlighted with Source Code Highlighter.
      Того же результата можно добиться, используя синонимы (алиасы) для названий колонок:
      CREATE VIEW v AS SELECT a.id a_id, b.id b_id FROM a,b;

      * This source code was highlighted with Source Code Highlighter.
    2. В случае если в определении представления получаемые данные преобразуются с помощью каких-то функций, то именем поля будет данное выражение, что не очень удобно для дальнейших ссылок на это поле. Напимер:
      CREATE VIEW v AS SELECT group_concat(DISTINCT column_name oreder BY column_name separator '+') FROM table_name;

      * This source code was highlighted with Source Code Highlighter.
      Вряд ли удобно использовать в дальнейшем в качестве имени поля `group_concat(DISTINCT username ORDER BY username separator '+')`
    Для просмотра содержимого представления мы используем оператор SELECT (полностью аналогично как в случае простой таблицы), с другой строны, оператор SELECT есть в самом определении представления, т.е. получается вложенная конструкция — запрос в запросе. При этом, некоторые конструкции оператора SELECT могут присутствовать в обоих операторах. Возможны три варианта развития событий: они обе будут выполнены, одна из них будет проигнорированна и результат неопределен. Рассмотрим подробнее эти случаи:
    1. Если в обоих операторах встречается условие WHERE, то оба этих условия будут выполнены как если бы они были объединены оператором AND.
    2. Если в определении представления есть конструкция ORDER BY, то она будет работать только в случае отсутствия во внешнем операторе SELECT, обращающемся к представлению, собственного условия сортировки. При наличии конструкции ORDER BY во внешнем операторе сортировка, имеющаяся в определении представления, будет проигнорирована.
    3. При наличии в обоих операторах модификаторов, влияющих на механизм блокировки, таких как HIGH_PRIORITY, результат их совместного действия неопределен. Для избежания неопределенности рекомендуется в определении представления не использовать подобные модификаторы.

    Алгоритмы представлений


    Существует два алгоритма, используемых MySQL при обращении к представлению: MERGE и TEMPTABLE.

    В случае алгоритма MERGE, MySQL при обращении к представлению добавляет в использующийся оператор соответствующие части из определения представления и выполняет получившийся оператор.

    В случае алгоритма TEMPTABLE, MySQL заносит содержимое представления во временную таблицу, над которой затем выполняется оператор обращенный к представлению.
    Обратите внимание: в случае использования этого алгоритма представление не может быть обновляемым (см. далее).

    При создании представления есть возможность явно указать используемый алгоритм с помощью необязательной конструкции [ALGORITHM = {UNDEFINED | MERGE | TEMPTABLE}]
    UNDEFINED означает, что MySQL сам выбирает какой алгоритм использовать при обращении к представлению. Это значение по умолчанию, если данная конструкция отсутствует.

    Использование алгоритма MERGE требует соответствия 1 к 1 между строками таблицы и основанного на ней представления.

    Пусть наше представление выбирает отношение числа просмотров к числу ответов для тем форума:
    CREATE VIEW v AS SELECT subject, num_views/num_replies AS param FROM topics WHERE num_replies>0;

    * This source code was highlighted with Source Code Highlighter.

    Для данного представления каждая строка соответствует единственной строке из таблицы topics, т.е. может быть использован алгоритм MERGE. Рассмотрим следующее обращение к нашему представлению:
    SELECT subject, param FROM v WHERE param>1000;

    * This source code was highlighted with Source Code Highlighter.

    В случае MERGE алгоритма MySQL включает определение представления в использующийся оператор SELECT: заменяет имя представления на имя таблицы, заменяет список полей на определения полей представления и добавляет условие в части WHERE с помощью оператора AND. Итоговый оператор, выполняемый затем MySQL, выглядит следующим образом:
    SELECT subject, num_views/num_replies AS param FROM topics WHERE num_replies>0 AND num_views/num_replies>1000;

    * This source code was highlighted with Source Code Highlighter.

    Если в определении представления используются групповые функции (count, max, avg, group_concat и т.д.), подзапросы в части перечисления полей или конструкции DISTINCT, GROUP BY, то не выполняется требуемое алгоритмом MERGE соответствие 1 к 1 между строками таблицы и основанного на ней представления.

    Пусть наше представление выбирает количество тем для каждого форума:
    CREATE VIEW v AS SELECT forum_id, count(*) AS num FROM topics GROUP BY forum_id;

    * This source code was highlighted with Source Code Highlighter.

    Найдем максимальное количество тем в форуме:
    SELECT MAX(num) FROM v;

    * This source code was highlighted with Source Code Highlighter.
    Если бы использовался алгоритм MERGE, то этот запрос был бы преобразован следующим образом:
    SELECT MAX(count(*)) FROM topics GROUP BY forum_id;

    * This source code was highlighted with Source Code Highlighter.
    Выполнение этого запроса приводит к ошибке «ERROR 1111 (HY000): Invalid USE of GROUP function», так как используется вложенность групповых функций.

    В этом случае MySQL использует алгоритм TEMPTABLE, т.е. заносит содержимое представления во временную таблицу (данный процесс иногда называют «материализацией представления»), а затем вычисляет MAX() используя данные временной таблицы:
    CREATE TEMPORARY TABLE tmp_table SELECT forum_id, count(*) AS num FROM topics GROUP BY forum_id;
    SELECT MAX(num) FROM tmp_table;
    DROP TABLE tpm_table;


    * This source code was highlighted with Source Code Highlighter.

    Подводя итог, следует отметить, что нет серьезных причин явно указывать алгоритм при создании представления, так как:
    1. В случае UNDEFINED MySQL пытается использовать MERGE везде где это возможно, так как он более эффективен чем TEMPTABLE и, в отличие от него, не делает представление не обновляемым.
    2. Если вы явно указываете MERGE, а определение представления содержит конструкции запрещающие его использование, то MySQL выдаст предупреждение и установит значение UNDEFIND.

    Обновляемость представлений


    Представление называется обновляемым, если к нему могут быть применимы операторы UPDATE и DELETE для изменения данных в таблицах, на которых основано представление. Для того, чтобы представление было обновляемым должно быть выполнено 2 условия:
    1. Соответствие 1 к 1 между строками представления и таблиц, на которых основано представление, т.е. каждой строке представления должно соответствовать по одной строке в таблицах-источниках.
    2. Поля представления должны быть простым перечислением полей таблиц, а не выражениеями col1/col2 или col1+2.
    Обратите внимание: встречающиеся в русско-язычной литературе требования, чтобы обновляемое представление было основано на единственной таблице и присутствие в числе полей представления первичного ключа физичекой таблицы не являются необходимыми. Скорее всего требование единственной таблицы является ошибкой перевода. Дело в том, что через представление, основанное на нескольких таблицах, может обновлять только одну таблицу за запрос, т.е. конструкция SET оператора UPDATE должна перечислять колонки только одной таблицы из определения представления. Кроме того, чтобы представление, основанное на нескольких таблицах, было обновляемым, таблицы в его определении должны быть объединены только с помощью INNER JOIN, а не OUTER JOIN или UNION.

    Обновляемое представление может допускать добавление данных (INSERT), если все поля таблицы-источника, не присутствующие в представлении, имеют значения по умолчанию.

    Обратите внимание: для представлений, основанных на нескольких таблицах, операция добавления данных (INSERT) работает только в случае если происходит добавление в единственную реальную таблицу. Удаление данных (DELETE) для таких представлений не поддерживается.

    При использовании в определении представления конструкции WITH [CASCADED | LOCAL] CHECK OPTION все добавляемые или изменяемые строки будут проверяться на соответствие определению представления.
    • Изменение данных (UPDATE) будет происходить только если строка с новыми значениями удовлетворяет условию WHERE в определении представления.
    • Добавление данных (INSERT) будет происходить только если новая строка удовлетворяет условию WHERE в определении представления.

    Иными словами, нельзя добавить или изменить данные в представлении таким образом, чтобы они не были доступны через представление.

    Ключевые слова CASCADED и LOCAL определяют глубину проверки для представлений основанных на других представлениях:
    • Для LOCAL происходит проверка условия WHERE только в собственном определении представления.
    • Для CASCADED происходит проверка для всех представлений на которых основанно данное представление. Значением по умолчанию является CASCADED.

    Рассмотрим пример обновляемого представления, основанного на двух таблицах. Пусть наше представление выбирает темы форума с числом просмотров более 2000.
    punbb >CREATE OR REPLACE VIEW v AS
    -> SELECT forum_name, `subject`, num_views FROM topics,forums f
    -> WHERE forum_id=f.id AND num_views>2000 WITH CHECK OPTION;
    Query OK, 0 rows affected (0.03 sec)

    punbb >SELECT * FROM v WHERE subject='test';
    +------------+---------+-----------+
    | forum_name | subject | num_views |
    +------------+---------+-----------+
    | Новости | test | 3000 |
    +------------+---------+-----------+
    1 row IN SET (0.03 sec)

    punbb >UPDATE v SET num_views=2003 WHERE subject='test';
    Query OK, 0 rows affected (0.03 sec)
    Rows matched: 1 Changed: 0 WARNINGS: 0

    punbb >SELECT * FROM v WHERE subject='test';
    +------------+---------+-----------+
    | forum_name | subject | num_views |
    +------------+---------+-----------+
    | Новости | test | 2003 |
    +------------+---------+-----------+
    1 row IN SET (0.01 sec)

    punbb >SELECT subject, num_views FROM topics WHERE subject='test';
    +---------+-----------+
    | subject | num_views |
    +---------+-----------+
    | test | 2003 |
    +---------+-----------+
    1 rows IN SET (0.01 sec)


    * This source code was highlighted with Source Code Highlighter.


    Однако, если мы попробуем установить значение num_views меньше 2000, то новое значение не будет удовлетворять условию WHERE num_views>2000 в определении представления и обновления не произойдет.
    punbb >UPDATE v SET num_views=1999 WHERE subject='test';
    ERROR 1369 (HY000): CHECK OPTION failed 'punbb.v'


    * This source code was highlighted with Source Code Highlighter.


    Не все обновляемые представления позволяют добавление данных:
    punbb >INSERT INTO v (subject,num_views) VALUES('test1',4000);
    ERROR 1369 (HY000): CHECK OPTION failed 'punbb.v'


    * This source code was highlighted with Source Code Highlighter.


    Причина в том, что значением по умолчанию колонки forum_id является 0, поэтому добавляемая строка не удовлетворяет условию WHERE forum_id=f.id в определении представления. Указать же явно значение forum_id мы не можем, так как такого поля нет в определении представления:
    punbb >INSERT INTO v (forum_id,subject,num_views) VALUES(1,'test1',4000);
    ERROR 1054 (42S22): Unknown COLUMN 'forum_id' IN 'field list'


    * This source code was highlighted with Source Code Highlighter.

    С другой строны:
    punbb >INSERT INTO v (forum_name) VALUES('TEST');
    Query OK, 1 row affected (0.00 sec)


    * This source code was highlighted with Source Code Highlighter.


    Таким образом, наше представление, основанное на двух таблицах, позволяет обновлять обе таблицы и добавлять данные только в одну из них.

    Удачи в работе с представлениями!

    Кросспост Представления (VIEW) в MySQL с SQLinfo.
    Поделиться публикацией
    Ой, у вас баннер убежал!

    Ну. И что?
    Реклама
    Комментарии 22
      –3
      Молодец. На этом ресурсе очень не хватает подобных обзоров-хаутушек.
      Заплюсовал бы, еслиб администрация не снесла мне карму и силу за коммент про нашу власть :)
        +1
        Очень удобная штука, при определенной сноровке.
          +1
          Хорошая статья. В очередной раз убедилась что если работал с MS SQL Server, то и в MySQL разберешься без труда)
            +2
            Должен заметить, что обратное тоже верно :)
              +3
              Если работал реляционной базой данных, то в любой другой реляционной базе данных разберешься без труда
            +3
            Не хватает только одного — понимания будут ли запросы использующие view использовать индексы. И насколько правильно они их будут использовать.
              +2
              Зависит от запроса. Если используется алгоритм MERGE, то будут. Сравните explain итогового запроса через таблицу и запроса через представление, увидите их полную идентичность.
              –9
              Подлые тролли сожрали мою карму! Горе мне, говночитателю, не могу плюс накликать я, о мастер!
                +1
                Если только читаешь — нафиг карма? :) А я за тебя уже плюсанул
                +1
                Довольно интересно, только хотелось бы узнать — где может реально пригодиться на практике этот функционал? Я просто может с утра не проснулся, кто-нибудь поделится?

                ЗЫ плюсанул бы, расписано очень качественно, да нечем *PARDON*
                  +5
                  Если Вы не знаете где, то значит оно вам и не надо.
                    +1
                    Во-первых, для настройки прав доступа. Помню во времена MySQL 4 испытывал трудности с тем, чтобы дать пользователям права на отдельные строки таблицы.

                    Во-вторых, для совместимости с приложениями, когда они требуют определенной структуры данных.
                      +3
                      Очень удобно использовать вьюшки для создания виртуальных таблиц. Например, какому-то приложению требуется поле из этой таблицы, пару полей из той, еще парочка из третьей и т.д. Запрос получается трехэтажный. Вот чтобы этот запрос не таскать по всему приложению, его проще записать во вьюшку, а в приложении выбирать все поля из этой вьюшки. Просто и удобно! Программист приложения может даже и не подозревать что он выбирает данные из вьюшки, а не из реальной таблицы. Получается нечто вроде инкапсуляции по ООП.
                        0
                        Да, тут вьюшки получаются как таблицы до применения нормализации.
                          0
                          хмм, самое лучше пояснение, спасибо — полагаю пригодится :)
                        +3
                        Главное, делая представления, четко осознавать что творишь, чтобы не налепить монстрообразных соединений на джоинах без индексов. А то view будет потом ползать еле-еле
                          +1
                          Очень полезная статья. Почему-то раньше думал, что вьюшки обновляются только при изменении связанных с ними таблиц, а по запросам пользователей отдают кэш… Плюсанул все, что можно, пойду еще сайт поизучаю :)
                            0
                            Начал недавно изучьть Oracle и так столкнулся впервые с вьюшками. Вижу, что в Mysql оно почти так же работает. Спасибо за статью
                              0
                              Следует, однако, помнить, что VIEW работает медленней, чем прямой запрос. Не знаю, насколько это универсально; я тестировал на нескольких тысячах записей с тремя LEFT JOIN. VIEW работал на несколько процентов медленней. Поэтому рекомендую сравнивать скорость выполнения в каждом потенциально критическом случае.
                                +1
                                Респект автору за статью. Лет 7 назад на оракле писал, пользовал тригеры, еще что-то… забыл уже. И не думал, что в мускле есть вьюшки. Спасибо, открыл глаза :) теперь пользовать буду.
                                  +2
                                  В оракле вьюшки можно сказать лучше :)
                                  По поводу производительность перед использованием желательно почитать это

                                  www.mysqlperformanceblog.com/2007/08/12/mysql-view-as-performance-troublemaker/
                                    0
                                    А как определить, какой алгоритм использует мускул (MERGE или TEMPTABLE)?

                                    Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                    Самое читаемое