当前位置: 首页 > news >正文

旅游最好的网站建设江门外贸网站建设

旅游最好的网站建设,江门外贸网站建设,wordpress 全站密码,厦门百度代理1. 多路径输入 FileInputFormat是所有使用文件作为其数据源的 InputFormat 实现的基类#xff0c;它的主要作用是指出作业的输入文件位置。因为作业的输入被设定为一组路径#xff0c; 这对指定作业输入提供了很强的灵活性。FileInputFormat 提供了四种静态方法来设定 Job 的… 1. 多路径输入 FileInputFormat是所有使用文件作为其数据源的 InputFormat 实现的基类它的主要作用是指出作业的输入文件位置。因为作业的输入被设定为一组路径 这对指定作业输入提供了很强的灵活性。FileInputFormat 提供了四种静态方法来设定 Job 的输入路径 public static void addInputPath(Job job,Path path);public static void addInputPaths(Job job,String commaSeparatedPaths);public static void setInputPaths(Job job,Path... inputPaths);public static void setInputPaths(Job job,String commaSeparatedPaths); 1.1 addInputPath 使用FileInputFormat.addInputPath方法只能指定一个路径。如果想使用该方法实现多路径输入需要多次调用来加载不同的路径 FileInputFormat.addInputPath(job, new Path(result/search/train/pv_log/2016-04-27/));FileInputFormat.addInputPath(job, new Path(result/search/train/pv_log/2016-04-28/));FileInputFormat.addInputPath(job, new Path(result/search/train/pv_log/2016-04-29/));1.2 addInputPaths 使用FileInputFormat.addInputPaths方法可以指定多个路径。如果想使用该方法实现多路径输入只需调用一次即可多个路径字符串之间用逗号分隔开 FileInputFormat.addInputPaths(job, result/search/train/pv_log/2016-04-27/,result/search/train/pv_log/2016-04-28/,result/search/train/pv_log/2016-04-29/); 1.3 setInputPaths setInputPaths()方法一次设定完整的路径列表替换前面调用中在 Job 上所设置的所有路径覆盖 FileInputFormat.setInputPaths(job, result/search/train/pv_log/2016-04-27/,result/search/train/pv_log/2016-04-28/,result/search/train/pv_log/2016-04-29/); 2. 多个输入 虽然一个MapReduce作业的输入可能包含多个输入文件但所有的文件都由同一个InputFormat和同一个Mapper来处理例如上面多路径输入。然而数据格式往往会随着时间而改变或者有些数据源会提供相同的数据但是格式不同因此我们必须用不同的mapper来处理不同的数据。 这些问题可以用MultipleInputs类来解决它允许为每条输入路径指定InputFormat 和 Mapper。MultipleInputs提供了两种用于多个输入的方法 public static void addInputPath(Job job, Path path,Class? extends InputFormat inputFormatClass);public static void addInputPath(Job job, Path path,Class? extends InputFormat inputFormatClass,Class? extends Mapper mapperClass);下面两个方法的的区别在于针对不同输入路径文件是否可以指定不同Mapper进行处理。 前者不需要指定Mapper所以所有文件都通过一个Mapper进行处理 MultipleInputs.addInputPath(job, new Path(result/search/train/pv_log/2016-11-29/), TextInputFormat.class);  MultipleInputs.addInputPath(job, new Path(result/search/train/pv_log/2016-11-29/), TextInputFormat.class);  后者可以针对不同输入路径指定不同的Mapper故可以指定不同Mapper处理不同类型的文件 MultipleInputs.addInputPath(job, new Path(result/search/train/pv_log/2016-11-29/), TextInputFormat.class,  TrainOrderMap.class);  MultipleInputs.addInputPath(job, new Path(result/search/flight/log/day20161129), TextInputFormat.class,  FlightOrderMap.class);  这段代码取代了FileInputFormat.addInputPath() 和 job.setMapperClass() 的常规调用。由于火车票和机票订单数据都是文本文件所以对两者使用TextInputFormat的数据类型。但这两个数据源的行格式不同所以我们使用两个不一样的Mapper。TrainOrderMapper 读取火车票订单的输入数据并计算订单信息FlightOrderMapper 读取飞机票订单的输入数据并计算订单信息。重要的是两个Mapper 输出类型一样因此reducer看到聚合后的map输出并不知道这些输入是由不同的Mapper产生的。
http://www.sadfv.cn/news/81524/

相关文章:

  • 网站建设10个基本步骤wordpress免费教育插件
  • 单页营销型网站建设网站功能建设描述书
  • 做网站赚广告费好做吗手机网游排行榜2022前十名最新
  • 重庆网站建设公司招聘长春仿站定制模板建站
  • 做网站通过什么赚钱哪些网站做英语比较好
  • 做宠物网站心得微信客户端登录入口
  • 营销网站制作方法智慧团建注册登录入口官网手机版
  • 云图书馆平台网站建设网络建设与运维
  • 中山网站建设文化案例怎么制作公司宣传图片
  • 营销型网站建设工资怎么查询企业信息
  • 唐河网站制作如何把一个静态网站
  • 西安有什么好玩的地方嘉兴优化网站价格
  • asp门户网站源码商城网站项目工作的流程
  • 做网站学生作业免费网站推广方式
  • 山东天成水利建设 网站网站支付链接怎么做的
  • 2018年深圳建设网站公司网站推广工具 刷链接
  • 中国建设银行南京分行网站首页网站大学报名官网入口
  • 哈尔滨网站建设 博客网站建设分金手指专业十九
  • 自己网站做第三方支付西安营销推广
  • 什么网站可以做电影投资网站建设 技术方案模板
  • 做网站诈钱家装公司哪家好
  • 做网站的素材包含哪些wordpress 主题 开源
  • 做网站哪里便宜上海网址导航
  • 做网站时怎样分割开发定制手游游戏
  • 网站建设合同交印花税200平米简约办公室装修
  • 广西建设厅官网站什么是网站建设从哪些方面建设网站
  • 自助服务器网站建设怎么在网上做公司网站
  • 北京师范大学学风建设专题网站山西做网站多少钱
  • 网站外包怎么做怎样做网站推广啊
  • 电商网站如何设计内容我的网站搜索不到了