gricom May 26 2014 at 11:59

PHP + Java, или In-memory кластер теперь и для PHP разработчиков

9 min

9.1K

High performance*Open source*PHP*

+15

Comments 11

FractalizeR May 26 2014 at 12:42

Но если кратко, то это кластерное распределенное хранилище объектов по ключам, которое держит все данные в памяти, за счет чего достигается высокая скорость доступа к данным.

Было бы интересно увидеть сравнение с существующими подобными системами. Скажем, с MongoDB. Или есть ключевые отличия по функционалу?

gricom May 26 2014 at 12:50

Mongo хранит JSON (который является строкой), а грид хранит ваши объекты с учетом их типов.
Плюс к этому сам грид хранит данные только в памяти, запись их в постоянное хранилище (БД, файловая система и т.д.) можно настроить самостоятельно, но этим хранилища не являются частью кластера, а Mongo хранит всё на диске и сама решает, какие из имеющихся данных держать в памяти, то есть здесь разная концепция использования.
Правильнее рассматривать гриды как «умный кеш с возможностью обработки данных и записи их в БД», а не как «быстрая БД».

SystemXFiles May 26 2014 at 14:45

Поправочка, MongoDB хранит в BSON данные.

Вот вырезка из офф. документации.

MongoDB stores documents on disk in the BSON serialization format. BSON is a binary representation of JSON documents, though it contains more data types than JSON.

gricom May 26 2014 at 14:51

Действительно, спасибо за поправку. Меня спутало то, что всё хранится в «JSON-style data structures».

eyeless_watcher May 26 2014 at 15:40

А как у этого всего с транзакционностью и всяческим ACID?

gricom May 26 2014 at 16:04

На уровне java кластера транзакционность есть, но на уровень PHP я её еще не пробросил. Более того, как мне кажется без реализованного write-behind транзакционность не сильно нужна, поэтому подумаю над ней в следующем релизе, т.к., судя по результатам опроса, эта фича пока востребованнее всех.

gricom May 29 2014 at 15:29

Оказалось, что незалогиненным пользователям wiki страница была недоступна по умолчанию (даже если репозиторий открыт). Поправил это недоразумение

igor_suhorukov Dec 6 2014 at 10:10

На момент вашей публикации в hazelcast уже была поддержка memcache протокола. С этим in-memory data grid можно работать из любого языка через memcache client

gricom Dec 8 2014 at 12:16

Да, вы правы. Причем такая возможность есть и в Infinispan, на котором и построен Sproot Grid, но:

API memcache беднее, чем у Sproot
Та часть API, которую поддерживает Hazelcast и Infinispan, еще меньше
Завязавшись на memcache я не смогу расширять API Sproot
Memcache поддерживает только строковые ключи, а в Sproot я планирую реализовать поддержку ключей любого типа (хоть пользовательские объекты, хоть коллекции)
Memcache практически не поддерживает пользовательские типы (он просто сериализует их в бинарники, забывая структуру, поэтому Hazelcast хранит не Java объекты, имеющие структуру объектов из доменной модели, а массивы байт)
В следующей версии (выйдет этой зимой) Sproot сможет сам подгружать данные из базы, в случае отсутствия данных в кэше. Будет даже возможность собирать доменный объект по кусочкам из разных БД (или схем БД). Это невозможно без знания структуры объекта
В планах есть и реализация возможности запуска распределенных задач на кластере, для чего опять же необходимо знать структуру объекта

Я думал над разными решениями тех задач, которые перед собой поставил, но ничего другое, кроме генерации кода, специфичного для конкретной доменной модели, не подходит под требования.

igor_suhorukov Dec 9 2014 at 00:33

С сериализованными кешами в jvm проще работать, т.к. легко посчитать занимаемый (key,value) объем, хранить в off heap памяти.
В coherence есть экстракторы и предикаты, в hazelcast распределенные запросы
Для работы с разных языков можно сериализовать данные в thrift, protobuf, json, xml

Дело популяризации распределенных IMDG сейчас в тренде. Желаю вам привлечь веб разработчиков!

gricom Dec 9 2014 at 12:02

Да, я понимаю, что можно работать с сериализованными данными, но надо знать их структуру, а memcache сериализует данные с потерей информации о структуре, поэтому для сериализации и транспорта использую thrift. В Infinispan всё уже естественно будет храниться в сериализованном инфиниспановском виде. В нём же есть и распределенные запросы.

Желаю вам привлечь веб разработчиков!

Спасибо! Надеюсь, что получится.