Как стать автором
Обновить

НАСА перешло от использования базы данных Neo4j на решение Memgraph

Время на прочтение2 мин
Количество просмотров2.9K

Группа аналитики персонала НАСА сменила графовую базу данных Neo4j на Memgraph из-за роста расходов.

Старший специалист по данным Дэвид Меза рассказал, что, несмотря на использование Neo4j около десяти лет, команду оттолкнула стоимость решения.

Ранее Меза говорил о преимуществах использования Neo4j для объединения данных из различных корпоративных приложений космического агентства, чтобы выявлять взаимосвязи между знаниями, навыками, способностями, задачами и технологиями, а также профессиями, ролями и обучением.

Теперь он объяснил переход на графическую базу данных в памяти: «Мы смогли использовать тот же инструмент, не переучивая его, потому что проделали большую работу с Neo4j. А затем Memgraph продемонстрировал финансовые выгоды», — сказал он. 

НАСА интегрирует Memgraph в свою интеллектуальную систему запросов по человеческому капиталу, чтобы обеспечить более быстрый поиск соответствующей информации для сотрудников. «Его подход на основе графов позволяет нам отслеживать обновления в реальном времени, обеспечивая точные связи между различными документами и источниками данных. Включая Memgraph в наш процесс Retrieval-Augmented Generation, мы повышаем отзывчивость системы и лучше справляемся с извлечением знаний НАСА без обширной ручной координации данных», — сказал Меза.

Memgraph использует тот же язык запросов Cypher, что и Neo4j. Однако он написан на C++ и лучше интегрируется с Python, чем Neo4j, который использует Java для создания приложений.

В разговоре с The Register генеральный директор Memgraph Доминик Томичевич сказал, что Neo4j опирается на сложные структуры b-дерева на диске с кэшированием в памяти. Поскольку диски созданы для последовательного чтения, решение заключалось в дублировании данных для запуска аналитических рабочих нагрузок из формата только для чтения, а затем при необходимости — записи результатов обратно в исходные данные.

«Хотя вы можете делать много вещей с Neo4j, особенно если это пакетные рабочие нагрузки, при необходимости принимать решения в режиме реального времени становится очень дорого перестраивать эти индексы в памяти, дублировать все данные и запускать алгоритмы, а затем записывать данные обратно в исходный граф», — сказал Томичевич.

В Memgraph структуры данных сначала создаются для рабочих нагрузок науки о данных, заявил он. С помощью снимков система в памяти может поддерживать транзакционные рабочие нагрузки, а также аналитику в реальном времени.

На прошлой неделе администрация президента США Дональда Трампа предложила урезать годовой бюджет НАСА на 24% — с $24,8 млрд до $18,8 млрд на фоне усилий по сокращению государственных расходов.

Теги:
Хабы:
+3
Комментарии4

Другие новости

Работа

Ближайшие события