我想以语法方式将作业的输出从EMR集群复制到Amazon S3.
如何在Java代码中使用S3DistCp进行相同操作.
解决方法:
hadoop ToolRunner可以运行此程序..由于S3DistCP扩展了Tool
下面是用法示例:
import org.apache.commons.logging.Log; import org.apache.commons.logging.LogFactory; import org.apache.hadoop.util.ToolRunner; import com.amazon.external.elasticmapreduce.s3distcp.S3DistCp public class CustomS3DistCP{ private static final Log log = LogFactory.getLog(CustomS3DistCP.class); public static void main(String[] args) throws Exception { log.info("Running with args: " + args); System.exit(ToolRunner.run(new S3DistCp(), args)); }
您必须在类路径中有s3distcp jar
您可以从Shell脚本调用此程序.
希望有帮助!
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。