В дополнение к сервисам Amazon Elastic Compute Cloud (EC2) и Amazon Simple Storage Service (Amazon S3) компания Amazon сообщила об открытии нового сервиса Amazon Elastic MapReduce, который на данный момент пребывает в статусе беты.
Elastic MapReduce — вебсервис, который позволят с легкостью обрабатывать огромные количества разнообразных данных. Сервис основан на совместном использовании EC2 и S3, а также фреймворка Hadoop.
По заверениям Amazon, используя Elastic MapReduce вы с легкостью сможете:
Для того, чтобы использовать Amazon Elastic MapReduce вы должны сперва создать инстанс EC2 на территории США, так как MapReduce еще не поддерживается для EC2 инстансов размещенных в европейских датацентрах Amazon.
Ну и разумеется цена. При использовании MapReduce вы платите за инстанс EC2, количество данных, которое хранится в S3, а также за использование технологии MapReduce.
При использовании Standard Amazon EC2 Instances:
Для High CPU EC2 Instances соответственно:
Похоже, что Amazon первая начала предоставлять коммерческие услуги MapReduce с использованием Hadoop. Чтобы говорить об эффективности подобного решения стоит подождать тестов и рабочих проектов на основе Elastic MapReduce.
Для желающих получить дополнительные подробности: aws.amazon.com/elasticmapreduce
Elastic MapReduce — вебсервис, который позволят с легкостью обрабатывать огромные количества разнообразных данных. Сервис основан на совместном использовании EC2 и S3, а также фреймворка Hadoop.
По заверениям Amazon, используя Elastic MapReduce вы с легкостью сможете:
- Разрабатывать приложения для обработки большого массива данных на любом удобном для вас языке: Java, Ruby, Perl, Python, PHP, R, or C++.
- Загружать данные и приложения по их обработке в Amazon S3. Надежность, масштабируемость, легкость в использовании — это все он, Amazon S3.
- Стартовать через AWS Management Console так называемый MapReduce «job flow». Вы просто напросто выбираете нужный инстанс Amazon EC2, далее выбираете путь к данным и приложению по их обработке, которые находятся на Amazon S3, нажимаете кнопку «Создать Job Flow» и MapReduce начнет свою работу.
- Мониторить статус job flow посредством AWS Management Console, коммандной строки или же специального API. После окончания работы результат помещается в Amazon S3.
Для того, чтобы использовать Amazon Elastic MapReduce вы должны сперва создать инстанс EC2 на территории США, так как MapReduce еще не поддерживается для EC2 инстансов размещенных в европейских датацентрах Amazon.
Ну и разумеется цена. При использовании MapReduce вы платите за инстанс EC2, количество данных, которое хранится в S3, а также за использование технологии MapReduce.
При использовании Standard Amazon EC2 Instances:
- Small $0.015 час
- Large $0.06 час
- Extra Large $0.12 час
Для High CPU EC2 Instances соответственно:
- Medium $0.03 час
- Extra Large $0.12 час
Похоже, что Amazon первая начала предоставлять коммерческие услуги MapReduce с использованием Hadoop. Чтобы говорить об эффективности подобного решения стоит подождать тестов и рабочих проектов на основе Elastic MapReduce.
Для желающих получить дополнительные подробности: aws.amazon.com/elasticmapreduce