当前位置: 首页 > news >正文

贷款网站怎么做的网上商城怎么做推广

贷款网站怎么做的,网上商城怎么做推广,网站推广方案200字,wordpress搜索框下拉一、Partitioner概述 Map阶段总共五个步骤#xff0c;2就是一个分区操作 哪个key到哪个Reducer的分配过程#xff0c;是由Partitioner规定的。 二、Hadoop内置Partitioner MapReduce的使用者通常会指定Reduce任务和Reduce任务输出文件的数量#xff08;R#xff09;。 用…一、Partitioner概述 Map阶段总共五个步骤2就是一个分区操作 哪个key到哪个Reducer的分配过程是由Partitioner规定的。 二、Hadoop内置Partitioner MapReduce的使用者通常会指定Reduce任务和Reduce任务输出文件的数量R。 用户在中间key上使用分区函数来对数据进行分区之后在输入到后续任务执行进程。一个默认的分区函数式使用hash方法比如常见的hash(key) mod R进行分区。hash方法能够产生非常平衡的分区。 Hadoop中自带了一个默认的分区类HashPartitioner 它继承了Partitioner类提供了一个getPartition的方法 /** Partition keys by their {link Object#hashCode()}. */ public class HashPartitionerK, V extends PartitionerK, V {/** Use {link Object#hashCode()} to partition. */public int getPartition(K key, V value,int numReduceTasks) {return  (key.hashCode() Integer.MAX_VALUE) % numReduceTasks;}} 将key均匀布在Reduce Tasks上 (key.hashCode() Integer.MAX_VALUE) % numReduceTasks;  如果Key为Text的话Text的hashcode方法跟String的基本一致都是采用的Horner公式计算得到一个int整数。但是如果string太大的话这个int整数值可能会溢出变成负数所以和整数的上限值Integer.MAX_VALUE即0111111111111111进行与运算然后再对reduce任务个数取余这样就可以让key均匀分布在reduce上  三、自定制Partitioner 一般我们都会使用默认的分区函数HashPartitioner 自定义数据类型处理手机上网日志 在第二列上并不是所有的数据都是手机号84138413并不是一个手机号任务就是在统计手机流量时将手机号码和非手机号输出到不同的文件中 自定义MKPartitioner public static class MKPartitioner extends PartitionerText, KpiWritable {Overridepublic int getPartition(Text key, KpiWritable value, int numPartitions) {// 实现不同的长度不同的号码分配到不同的reduce task中int numLength key.toString().length();if (numLength 11) return 0;else   return 1; }} 设置为打包运行设置Partitioner为MKPartitioner设置ReducerTask的个数为2 注意分区的例子必须要设置为打成jar包运行 public int run(String[] args) throws Exception {// 定义一个作业Job job new Job(getConf(), MyJob);// 分区需要设置为打包运行job.setJarByClass(MyJob.class);// 设置输入目录FileInputFormat.setInputPaths(job, new Path(INPUT_PATH));// 设置自定义Mapper类job.setMapperClass(MyMapper.class);// 指定k2,v2的类型job.setMapOutputKeyClass(Text.class);job.setMapOutputValueClass(KpiWritable.class);// 设置Partitionerjob.setPartitionerClass(NKPartitioner.class);job.setNumReduceTasks(2);// 设置自定义Reducer类job.setReducerClass(MyReducer.class);// 指定k3,v3的类型job.setOutputKeyClass(Text.class);job.setOutputKeyClass(KpiWritable.class);// 设置输出目录FileOutputFormat.setOutputPath(job, new Path(OUTPUT_PATH));// 提交作业System.exit(job.waitForCompletion(true) ? 0 : 1);return 0;} 打成jar包并在Hadoop中运行 通过Idea导出jar包通过FTP上传到Linux中可以使用各种FTP工具通过Hadoop Shell执行jar包中的程序 通过Web接口验证Partitioner的运行 通过访问http://hadoop01:50030 查看 是否有2个Reduce任务Reduce输出结果是否一致 小结 分区Partitioner主要作用在于以下两点  根据业务需要产生多个输出文件多个reduce任务并发运行提高整体job的运行效率
http://www.yutouwan.com/news/459786/

相关文章:

  • 在因特网上建设网站可选择的方案品牌网站建设h合肥
  • 和目网站qq开放平台
  • 做哪些网站好深圳百度竞价托管公司
  • 山东禹城市建设局网站网站全背景做多大
  • 贵州省建设厅实名认证网站安徽省青年企业家协会通报
  • 网站开发工具与技术百度网站地图制作
  • 正规营销型网站培训中心宝安网站建设多少钱
  • 榆林建设网站苏州建设网站公司
  • 网站开发与系统开发给人做logo的网站
  • 视频工厂网站建设富阳设计网站
  • 厦门制作网站企业手机网站APP网络推广商城网站
  • 中国网站设计师wordpress企业
  • 山东住房和建设厅网站首页html网页制作代码大全示范
  • 建设厅网站如何查询企业信息网长春求推荐好的网站优化推广
  • 织梦做单页面网站网站建设与运营第二次在线作业
  • 新城区网站建设网络技术是什么
  • 创建网站无法播放视频网站全站搜索代码
  • 关于旅游的网站建设目的惠州网站建设效果
  • 做调查问卷网站设计招聘网站
  • 为了同学都能访问网站如何做wordpress建手机站教程
  • 网站开发需要用到什么技术wordpress meta_key
  • h5免费制作网站模板犀浦网站建设
  • 南宁做网站建设网页升级紧急通知页面
  • 英语网站online织梦门户网站
  • 东莞做网站还赚钱吗百度云网盘资源搜索引擎入口
  • 如何做网站网站代理八戒设计网
  • 自适应型网站建设报价h5如何做多页面网站
  • 网站后台管理模板psd广州网络运营课程培训班
  • 建设网站需要的资质证书网站制作自己接单
  • 做考勤的网站品牌网站建设只詢大蝌蚪