donjenya 23 июл 2012 в 19:51

GC и большой heap: друзья или враги?

15 мин

28K

Высокая производительность*Java*

+46

Комментарии 28

kekekeks 23 июл 2012 в 20:45

На самом деле время, проводимое в состоянии stop-the-world можно существенно сократить. Например, поиск неиспользуемых объектов вполне можно проводить в fork'нутом процессе, который получил copy-on-write версию всех страниц родительского. Таким образом, пока он ищет, что бы такое удалить, ничего не стопорится. Нашёл — семафорит и передаёт через stdout конкретный список действий.
Почему такой подход до сих пор не используется в не-windows средах мне не особо ясно.

-2

WFrag 23 июл 2012 в 21:14

Непонятно, что такого может сторонний процесс, что не может поток внутри того же процесса. Дополнительные затраты на IPC?

Учитывая, что ищутся как раз-таки живые объекты, а не мертвые, то непонятно, как гарантировать нахождение всех живых обхектов, если не останавливать мутаторов. См. remark phase в CMS, например.

kekekeks 23 июл 2012 в 21:17

Форк даёт гарантированно замороженное состояние всего процесса, т. к. клонирует только файловые дескрипторы и виртуальную память, но не потоки. На выходе получаем этакий снапшот, в котором можно делать что угодно.

WFrag 23 июл 2012 в 21:20

Ну да, только чудес-то не бывает, как только будет запись в страницу, её физическое содержимое придётся копировать. Учитывая, что в итоге всё равно надо делать remark (так как основной процесс-то продолжает плодить объекты), непонятна выгода.

i_told_you_so 23 июл 2012 в 21:36

перед форком нужно довести все треды до memory barrier. Это и есть stop-the-world

Walrus 21 авг 2014 в 14:20

DmitryKoterov 23 июл 2012 в 21:39

Было бы интересно почитать статью про сравнение сборщиков мусора Java с:
— .NET (какой там используется метод и как дела с остановкой мира?),
— PHP 5.3+ (там сборщик комбинированный, основанный и на счетчике ссылок в реальном времени, и на периодической чистке того, где счетчик ссылок спасовал).

StrangeAttractor 24 июл 2012 в 03:24

Было бы интересно и про Google Dalvik (Android) JVM услышать.
Пардрн если сказал глупость, не специаллист по Андроидам, но слышал таки что это тоже вполне себе интересная JVM.

halyavin 23 июл 2012 в 22:00

Остается вопрос почему не внедрят что-нибудь похожее в HotSpot?

Sauron 24 июл 2012 в 01:02

Может Azul запатентовали алгоритм? Я бы не удивился.

StrangeAttractor 24 июл 2012 в 03:31

Может Azul запатентовали алгоритм?

Реализовать тогда в виде какой-нибудь пристройки к OpenJDK и юзать в свободных от софтверных патентов странах как мы сейчас делаем со свободными реализациями проприетарных кодеков типа Lame и x264, не?

donjenya 24 июл 2012 в 09:54

Да, алгоритм Azul C4 запатентован. При большом желании можно найти патент в Интернете.

skywatcher 23 июл 2012 в 22:27

главный вопрос: сколько такая чудо виртуальная машина стоит?

skywatcher 23 июл 2012 в 22:28

ну и чудожелезяка тоже

donjenya 23 июл 2012 в 23:22

По стоимости не знаю, цены выставляю не я. :)

drakmail 24 июл 2012 в 02:11

Говорят, в районе $5-6к: dhartford.blogspot.com/2011/06/hypervisor-vm-and-jvm-java-and-sla-and.html

voronaam 24 июл 2012 в 00:13

Спасибо за статью. Есть тут у нас один монстр-проект, который очень аппетитно кушает память. Переписать его, скорее всего, денег не хватит, а вот железяку купить могут.

malexejev 24 июл 2012 в 02:42

Неплохая статья, большое спасибо автору. Особо интересно узнать, что у нас есть люди использовавшие Azul в боевых инсталляциях.

Что хотелось бы добавить, так это чуть больше системности в изложении. В идеале, когда обзорная часть читается как учебник — тогда читатели любой степени подготовки смогут начать с нужного им места.

Я имею в виду что-то вроде — есть алгоритмы автоматической сборки мусора (copying, M-S, M-C, M-S-C) и есть коллекторы как высокоуровневая установка, применяющая один или несколько алгоритмов к разным областям памяти.
Выбор коллектора определяет
1) разбиение памяти на различные области
2) выбор одного из алгоритмов для каждой области
3) режим работы для каждой области — serial, parallel, mostly concurrent, concurrent
4) алгоритм аллокации памяти под новые объекты (в старом поколении) — линейная аллокация или free lists

Каждый алгоритм состоит из 1 или нескольких фаз (initial mark, mark, sweet, compact и тд и тп), которые могут хорошо или плохо параллелиться (выполняться многими тредами), быть или не быть concurrent (выполняться одновременно с тредами приложения). И вот тут как раз можно сказать про глобальный затык с фазой Compact у всех коллекторов и продолжить про Азул, которые изобрели C4 который единственный умеет делать concurrent compact.

Просто когда все эти вещи разложены по полочкам, становится проще ориентироваться в теме. Я не уверен, что человек без подготовки в GC сможет после прочтения статьи сказать, почему все коллекторы из таблицы используют копирующий сборщик для «Young Generation» или можно ли запустить CMS так, чтобы он не делал STW пауз.

1nd1go 7 сен 2012 в 18:25

Хорошо в стиле учебника об этом можно почитать здесь: blog.ragozin.info/2011/06/understanding-gc-pauses-in-jvm-hotspots.html

_{Я понимаю, что вы, наверное это знаете, просто для истории здесь оставлю ;)}

vanxant 24 июл 2012 в 02:44

Вообще конечно бит NMT — весьма грязный хак, а постоянно падать с исключением процессора некошерно в плане производительности (хотя и позволяет убить stop-the-world фазу, тут компромисс). Но идея хороша.

malexejev 24 июл 2012 в 02:52

И в порядке пиара — в этот четверг вечером в Москве пройдет митап на тему Java GC. Рассказывать будет Алексей Рагозин — мой бывший коллега, большой специалист в области GC и автор одного из GC-патчей для Open JDK.

Ссылка на мероприятие aragozin.timepad.ru/event/29364
Мероприятие не особо формальное, приглашаю приходить всех интересующихся, а автора — прийти и поделиться своим опытом с Azul. Я думаю, это всем будет интересно.

donjenya 24 июл 2012 в 10:39

Спасибо. Очень интересно мероприятие, постараюсь его посетить.

StrangeAttractor 24 июл 2012 в 03:39

Прочитал — возник резонный вопрос: а как на этом Azul C4 cебя поведут свеженькие Scala и Akka. Логичный ответ — надо попробовать. Но на сайте для триала предлагается «Zing JVM». Это оно или таки нет?

donjenya 24 июл 2012 в 10:37

Оно, Azul Zing — это Azul JVM, реализованная в виде виртуальной машины. К сожалению, ничего не могу сказать про Scala и Akka — не было случая, чтобы протестировать Azul для них…

DeltaFlight 24 июл 2012 в 12:44

Почему на первых двух графиках нет G1? Баги багами, но начиная с JRE 7u4 Oracle считает G1 fully supported, то есть более не experimental — www.oracle.com/technetwork/java/javase/7u4-relnotes-1575007.html
И со вторым графиком не совсем понятно — на 2 гигабайтах у C4 паузы в несколько секунд, а на 5 гигах — уже сотые доли секунды. Правда ли это особенность C4? Какова вообще методика теста? Может, исходники есть?

donjenya 24 июл 2012 в 14:56

На первых двух графиках нет G1, потому что тесты проводились в 2011 году, а официальная поддержка G1 началась с выпуска в мае 2012 года Java SE 7 Update 4.
Со вторым графиком — да, это особенность Azul C4, на heap-e большего размера достигается бОльшая эффективность. Там же рассказывается про методику теста. Подробности по ссылке:
Подробности про Azul C4

cheremin 25 июл 2012 в 18:42

Последний график-пример выглядит как-то странно. Паузы в случае с CMS растут и растут. Это была реальная, рабочая система, с реальными рабочими же настройками? Кажется, что в таком режиме реальная система просто не может быть применима. И тогда возникает вопрос, как же система в таком состоянии оказалась, что ее пришлось «спасать» переходом на Azul GC.

Если честно, возникает ощущение какого-то специально подогнанного примера.

А вообще Azul VM очень любопытный проект. Сам факт их существования неплохо подхлестывает прогресс в оптимизации JVM, и за это им мой большой респект

Wolverine 12 апр 2017 в 20:34

Oracle HotSpot CMS
IBM J9 optthruput делает практически то же самое.

optthruput работает все-таки не как CMS, а как ParallelOldGC

optthruput
The «optimize for throughput» (optthruput) policy disables the concurrent mark phase. The application stops during global garbage collection, so long pauses can occur. This configuration is typically used for large-heap applications when high application throughput, rather than short garbage collection pauses, is the main performance goal.

https://www.ibm.com/support/knowledgecenter/SSYKE2_8.0.0/com.ibm.java.lnx.80.doc/diag/appendixes/cmdline/xgcpolicy.html

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

GC и большой heap: друзья или враги?

Комментарии 28

Публикации

Истории