Группа аналитики персонала НАСА сменила графовую базу данных Neo4j на Memgraph из-за роста расходов.
Старший специалист по данным Дэвид Меза рассказал, что, несмотря на использование Neo4j около десяти лет, команду оттолкнула стоимость решения.
Ранее Меза говорил о преимуществах использования Neo4j для объединения данных из различных корпоративных приложений космического агентства, чтобы выявлять взаимосвязи между знаниями, навыками, способностями, задачами и технологиями, а также профессиями, ролями и обучением.
Теперь он объяснил переход на графическую базу данных в памяти: «Мы смогли использовать тот же инструмент, не переучивая его, потому что проделали большую работу с Neo4j. А затем Memgraph продемонстрировал финансовые выгоды», — сказал он.
НАСА интегрирует Memgraph в свою интеллектуальную систему запросов по человеческому капиталу, чтобы обеспечить более быстрый поиск соответствующей информации для сотрудников. «Его подход на основе графов позволяет нам отслеживать обновления в реальном времени, обеспечивая точные связи между различными документами и источниками данных. Включая Memgraph в наш процесс Retrieval-Augmented Generation, мы повышаем отзывчивость системы и лучше справляемся с извлечением знаний НАСА без обширной ручной координации данных», — сказал Меза.
Memgraph использует тот же язык запросов Cypher, что и Neo4j. Однако он написан на C++ и лучше интегрируется с Python, чем Neo4j, который использует Java для создания приложений.
В разговоре с The Register генеральный директор Memgraph Доминик Томичевич сказал, что Neo4j опирается на сложные структуры b-дерева на диске с кэшированием в памяти. Поскольку диски созданы для последовательного чтения, решение заключалось в дублировании данных для запуска аналитических рабочих нагрузок из формата только для чтения, а затем при необходимости — записи результатов обратно в исходные данные.
«Хотя вы можете делать много вещей с Neo4j, особенно если это пакетные рабочие нагрузки, при необходимости принимать решения в режиме реального времени становится очень дорого перестраивать эти индексы в памяти, дублировать все данные и запускать алгоритмы, а затем записывать данные обратно в исходный граф», — сказал Томичевич.
В Memgraph структуры данных сначала создаются для рабочих нагрузок науки о данных, заявил он. С помощью снимков система в памяти может поддерживать транзакционные рабочие нагрузки, а также аналитику в реальном времени.
На прошлой неделе администрация президента США Дональда Трампа предложила урезать годовой бюджет НАСА на 24% — с $24,8 млрд до $18,8 млрд на фоне усилий по сокращению государственных расходов.