Westimo Feb 16 2015 at 16:02

Hibernate: ленивая загрузка, наследование и instanceof

4 min

21K

Java*

Comments 35

eld0727 Feb 17 2015 at 07:15

entity = (T) ((HibernateProxy) entity).getHibernateLazyInitializer().getImplementation();

если я правильно все понимаю, то получается что на каждый элемент списка генерируется запрос в базу, что не есть хорошо

Westimo Feb 17 2015 at 08:29

Если я не ошибаюсь, то при автоматической инициализации объектов Hibernate'ом для каждого объекта из списка составляется свой запрос.
В конкретно этом случае — мы можем запросить и целый список объектов отдельным запросом. Но не факт, что мы опять не получим прокси-объекты.

eld0727 Feb 17 2015 at 08:39

Ну вобщем то Hibernate создает прокси список который не содержит объектов, а потом уже идет select по FK и создается список при вызове геттера.
Мне кажется такое вот решение будет дико тормозить на большом количестве объектов.

Westimo Feb 17 2015 at 11:05

На счет прокси-списка все верно. При запросе списка геттером Hibernate заполняет его объектами. Но некоторые из этих объектов могут быть не инициализированными. И при вызове instanceof для одного из них, мы можем столкнуться с proxy-объектом.
Только что проверил создаваемые hibernate'ом запросы при вызове геттера. Выбор идет по PK каждого объекта из ленивого списка. На каждый объект — отдельный запрос.
Для проверки выставлял следующие уровни логгирования:

org.hibernate.SQL=DEBUG
org.hibernate.type.descriptor.sql.BasicBinder=TRACE

eld0727 Feb 17 2015 at 11:13

а откуда же он взял эти PK, если при FetchType.LAZY не генерятся join'ы? у вас какая то магия выходит

Westimo Feb 17 2015 at 11:54

Точно странно. У меня в логах hibernate идет запрос «User», вызываю геттер — появляются запросы телефонов по их PK. А где он эти PK взял не ясно. Отдельного запроса списка PK не было.
Займусь вечером изучением этого вопроса.

Westimo Feb 18 2015 at 03:05

Разобрался в этой теме более подробно. Проверял на рабочем коде, отключил весь описанный в статье код. Алгоритм работы следующий:

вызываем геттер у «User» списка «Phone»
Hibernate выполняет запрос, который включает в себя все поля столбцы базового класса, join'ит всех потомков и выбирает у них по 2 разных столбца, дополнительно в запросе идет проверка к какому классу принадлежит строка
для каждого объекта из списка вызывает запрос с его уже известным PK, к его таблице. В запросе собираются недостающие столбцы объекта

eld0727 Feb 17 2015 at 08:55

И да, использовать LinkedList для временного хранения нынче круто?

Westimo Feb 17 2015 at 11:23

Здесь код представлен для примера. Там многое можно оптимизировать.
Основная нагрузка статьи — вариантов борьбы с описанной проблемой.

kefirfromperm Feb 17 2015 at 11:10

Проблема, конечно, интересная. Решение, конечно, некрасивое. Но меня терзают смутные сомнения, что тип телефона необходимо определять через instanceof. Вообще, логика, построенная на instanceof, попахивает.

Revertis Feb 17 2015 at 11:24

Кроме того, насколько я помню, instanceof довольно медленная операция.

Encircled Feb 17 2015 at 13:25

Вы серьезно? В данном случае, когда генерируются тонны запросов к дб (благодаря Hibernate.initialize в цикле...) bottleneck явно в другом месте

Westimo Feb 17 2015 at 11:38

Ситуации бывают разные. Когда функционал должен быть готов вчера особо не задумываешься по поводу рефакторинга.

Suvitruf Feb 17 2015 at 11:45

По крайней мере, можно заменить на проверку по getClass(), если не надо подклассы чекать.

Westimo Feb 17 2015 at 11:51

В том то и дело, что нужны именно подклассы. То есть мы ожидаем CellPhone или SatellitePhone, а имеем прокси для Phone. И здесь никакой вид проверки не помогает.

konsoletyper Feb 17 2015 at 12:53

А ещё в Hibernate есть такой режим ленивых ассоциаций, как no-proxy (включается аннотацией @LazyOtOne(LazyToOneOption.NO_PROXY). Правда, для их правильной работы требуется включить bytecode instrumentation, но в этом нет ничего страшного. Ещё один недостаток — требуется всюду не забывать указывать эту Hibernate-специфическую аннотацию, но даже этот недостаток можно преодолеть.

Westimo Feb 18 2015 at 03:21

Спасибо за совет. Как будет время обязательно проверю этот способ.

Encircled Feb 17 2015 at 13:33

Пробовали запустить на хотя бы пару тысячах элементов? Тормозить будет жууутко. Вообще, в местах где нужно делать подобного рода проверки, лучше делать join'ы сразу.
Hibernate.initialize в цикле это плохо. Замените хотя бы на инициализацию сразу целого списка (вернее Hibernate умеет делать fetch не более «batch size» элементов)

eld0727 Feb 17 2015 at 15:22

а при чем здесь batch? O_o
Наверное нужно было сказать 'fetch size'

Encircled Feb 17 2015 at 15:31

Нет, именно hibernate.jdbc.batch_size :)

eld0727 Feb 18 2015 at 00:54

batch_size никак не используется для select'ов. Он используется для операций требующих executeUpdate

Encircled Feb 18 2015 at 08:29

docs.jboss.org/hibernate/orm/3.3/reference/en/html/performance.html#performance-fetching-batch

eld0727 Feb 18 2015 at 08:51

песня совершенно о другом

Encircled Feb 18 2015 at 08:56

и о чем же?

eld0727 Feb 18 2015 at 11:22

omfg
тунс

Encircled Feb 18 2015 at 11:42

Хорошо, не hibernate.jdbc.batch_size, а просто batch-size. Суть та же

eld0727 Feb 18 2015 at 15:01

Вы сами то ссылку читали?
Там написано, что если есть какие то объекты в сессии у которых есть Lazy поля, то при выборке этого поля для какого нибудь объекта, могут быть заодно выбрана такие же поля для других объектов в сессии.
Вобщем полное непонимание вопроса выходит у вас…

Encircled Feb 18 2015 at 15:20

Вы попробуйте сначала это в практике, а потом говорите, что у меня «непонимание вопроса»

Encircled Feb 18 2015 at 15:26

Может так понятнее будет: www.mkyong.com/hibernate/hibernate-fetching-strategies-examples/

eld0727 Feb 18 2015 at 15:39

а чем это отличается от того, что я написал? и если ни чем, то как это относится к топику?

Encircled Feb 18 2015 at 15:46

Посмотрите в разделе batch-size на пример «Another example» — это как раз то, что делает автор вызовом unproxy в цикле

Westimo Feb 18 2015 at 03:17

В большинстве случаев, у нас объектов в таких списках меньше сотни.
В случаях когда объектов намного больше, у нас используются запросы по частям (например, по 100 объектов) и следующие части запрашиваются и результаты отправляются клиентам только по требованию.
Отвечая на ваш вопрос: нет, не проверяли.

Throwable Feb 26 2015 at 20:10

Использую Eclipselink вместо Hibernate, он проксирует только на уровне списков. Но в целом проблемы те же: что делать с lazy объектами вне сессии, и как избавиться от N+1 запросов. Connected-архитектура и lazy инициализация — это огромный антипаттерн, который лимитирует возможность использования объектов только внутри сессии, постоянно напрягая БД огромным количеством тупых запросов. И до сих пор создатели JPA не предусмотрели хорошего способа для обхода ситуации — видимо те, кто пишут JSR, ориентируются на сферического коня в вакууме.

Мы делаем так: при вызове сервиса сначала вытаскивается все, что нужно и только то, что нужно одним или несколькими запросами. Для избавления N+1 запросов можно использовать join fetch или batch-fetch. В JPA 2.1 добавили EntityGraphs позволяющие более просто указывать relations, которые надо вытащить при запросе. Плюс есть нестандартные load-groups и fetch-groups. Если поле lazy и не проинициализировано, оно не должно использоваться. Затем service interceptor прогоняет граф через специальный фильтр, который пробегает все поля, обнуляя непроинициализированные прокси и заменяя проинициализированные коллекции на ArrayList и LinkedHashMap. На выходе получается полностью портабельный detached граф объектов. Почему EntityManager.detach() не делает то же самое — для меня загадка.

kefirfromperm Feb 27 2015 at 05:36

Всё-таки, на какую глубину графа надо доставать объекты, ORM-движку трудно судить. В вашей конкретной ситуации, это может быть и элементарно, но в общем, не так уж и очевидно. Видимо поэтому, разработчики ОРМ отдают это на откуп разработчикам приложений. А те уж используют DTO и все такое.

Throwable Mar 2 2015 at 11:56

> Видимо поэтому, разработчики ОРМ отдают это на откуп разработчикам приложений.

В том-то и дело, что не отдают. В JPA нет хорошей возможности сказать что конкретно и как доставать. До JPA 2.1 не было даже стандартного способа указать, какие атрибуты мне нужны, а какие нет. Были vendor-specific query hints, и работали через пень-колоду. А основная N+1 проблема до сих пор не имеет решения: JOIN FETCH присоединяет только одну коллекцию. В EclipseLink есть batch hint, который внезапно не работает для ManyToOne и OneToOne.

Видимо, разработчики JPA надеялись, что у нас будет один большой кеш, где будет лежать 80% данных всей базы, с объектами которого будет работать приложение, потихоньку подгружая недостающие части. Однако, как показывает практика, любая страничка с простой таблицей начисто рушит данный подход.