Ростелеком выводит на российский рынок импортонезависимый freeware-дистрибутив RT.Datalake — специальную сборку одного из компонентов «Платформы управления данными», которая предназначена для организации эффективного хранилища больших данных.
RT.Datalake позволяет хранить и обрабатывать данные любых объемов для решения различных бизнес-задач: от построения отчетности до создания моделей машинного обучения. Ростелеком предоставляет российским компаниям возможность бесплатно построить собственное озеро данных на отечественной, импортонезависимой сборке дистрибутива Hadoop без затрат на лицензионные взносы. Кроме того, за пользователями всегда сохраняется возможность миграции на коммерческую версию, в которой большинство действий автоматизировано с помощью ansible-скриптов и RT.ClusterManager, что упрощает процесс установки и эксплуатации.
Продукт основан на Apache Hadoop, он отвечает высоким требованиям надежности и доступности, а также обладает низкой стоимостью хранения данных. Пользователям freeware-дистрибутива будет доступна сборка и подробная инструкция по ее установке с заданными параметрами и настройками. В состав RT.Datalake входят следующие версии компонентов:
Hadoop 3.0.0;
HBase 2.2.6;
Hive 3.1.1;
Hue 4.10;
Spark 3.0.0;
Zookeeper 3.7.0.
Сергей Носов:
Директор по управлению данными Ростелекома
Платформа управления данными уже сейчас помогает российским компаниям снизить зависимость от иностранных поставщиков программного обеспечения и уменьшить затраты на работу с данными. Из-за ухода западных вендоров из России и необходимости обеспечения технологического суверенитета, мы решили предоставить российским компаниям возможность бесплатного использования наших продуктов с ограниченным функционалом. Сейчас мы даем возможность бесплатно использовать продукт RT.DataLake, а в ближайшее время сделаем доступными еще два продукта в freeware-версии:
• RT.Warehouse — массивно-параллельную СУБД для построения хранилищ данных;
• RT.Streaming — инструмент для эффективного управления процессами изменения, выгрузки и загрузки данных, позволяющий настроить потоковую или пакетную обработку данных из различных источников. .