当前位置: 首页 > news >正文

外贸网站建设需大资讯wordpress主题

外贸网站建设需,大资讯wordpress主题,懒人凳子网站建设策划书,做外贸哪个网站比较好一、目的 在离线数仓中#xff0c;需要用Flume去采集Kafka中的数据#xff0c;然后写入HDFS中。 由于每种数据类型的频率、数据大小、数据规模不同#xff0c;因此每种数据的采集需要不同的Flume配置文件。玩了几天Flume#xff0c;感觉Flume的使用难点就是配置文件 二、…一、目的 在离线数仓中需要用Flume去采集Kafka中的数据然后写入HDFS中。 由于每种数据类型的频率、数据大小、数据规模不同因此每种数据的采集需要不同的Flume配置文件。玩了几天Flume感觉Flume的使用难点就是配置文件 二、使用场景 静态排队数据是数据频率为1s的数据类型代表数据量很大、频率很高因此搞定了静态排队数据的采集就搞定了这一类高频率数据的实时采集问题 1台雷达每日的静态排队数据规模是25MB10台雷达的数据规模则是250MB 三、静态排队数据的配置文件 ## agent a1 a1.sources s1 a1.channels c1 a1.sinks k1 ## configure source s1 a1.sources.s1.type org.apache.flume.source.kafka.KafkaSource a1.sources.s1.kafka.bootstrap.servers 192.168.0.27:9092 a1.sources.s1.kafka.topics topic_b_queue a1.sources.s1.kafka.consumer.group.id queue_group a1.sources.s1.kafka.consumer.auto.offset.reset latest a1.sources.s1.batchSize 1000 ## configure channel c1 ## a1.channels.c1.type memory ## a1.channels.c1.capacity 10000 ## a1.channels.c1.transactionCapacity 1000 a1.channels.c1.type file a1.channels.c1.checkpointDir /home/data/flumeData/checkpoint/queue a1.channels.c1.dataDirs /home/data/flumeData/flumedata/queue ## configure sink k1 a1.sinks.k1.type hdfs a1.sinks.k1.hdfs.path hdfs://hurys23:8020/user/hive/warehouse/hurys_dc_ods.db/ods_queue/day%Y-%m-%d/ a1.sinks.k1.hdfs.filePrefix queue a1.sinks.k1.hdfs.fileSuffix .loga1.sinks.k1.hdfs.round true a1.sinks.k1.hdfs.roundValue 10 a1.sinks.k1.hdfs.roundUnit second a1.sinks.k1.hdfs.rollSize 10240000 a1.sinks.k1.hdfs.rollCount 0 a1.sinks.k1.hdfs.rollInterval 0 a1.sinks.k1.hdfs.idleTimeout 60 a1.sinks.k1.hdfs.minBlockReplicas 1 ## Bind the source and sink to the channel a1.sources.s1.channels c1 a1.sinks.k1.channel c1 四、Flume写入HDFS结果 Flume根据时间戳按照ODS层表的分区将数据写入对应HDFS文件 五、ODS表刷新分区后查验数据 一刷新表分区 MSCK REPAIR TABLE ods_queue; 二查看表数据 select * from ods_queue; 六、注意点 一配置文件中的重点是红色标记的几点 a1.sinks.k1.hdfs.round true a1.sinks.k1.hdfs.roundValue 10 a1.sinks.k1.hdfs.roundUnit second a1.sinks.k1.hdfs.rollSize 10240000 a1.sinks.k1.hdfs.rollCount 0 a1.sinks.k1.hdfs.rollInterval 0 a1.sinks.k1.hdfs.idleTimeout 60 a1.sinks.k1.hdfs.minBlockReplicas 1 二这几个重点参数的含义 序号Flume参数参数含义1round是否启用时间上的”舍弃”如果启用则会影响除了%t的其他所有时间表达式                                       默认值false2roundValue多少时间单位创建一个新的文件夹3roundUnit重新定义时间单位4rollSize当临时文件达到该大小(单位:bytes)时,滚动成目标文件;默认值:1024byte            如果设置成0,则表示不根据临时文件大小来滚动文件5rollCount当events数据达到该数量时候,将临时文件滚动成目标文件;默认值:10               如果设置成0,则表示不根据events数据来滚动文件6rollInterval多久将临时文件滚动成最终目标文件,单位:秒;默认值:30s                    如果设置成0,则表示不根据时间来滚动文件;7idleTimeout当目前被打开的临时文件在该参数指定的时间秒内,没有任何数据写入,则将该临时文件关闭并重命名成目标文件;            默认值:08minBlockReplicas写入HDFS文件块的最小副本数一般配置成1才能正确滚动文件 更多Flume配置文件参数含义请看鄙人另一篇博客 一百九十一、Flume——Flume配置文件各参数含义持续完善中 http://t.csdnimg.cn/o5XbGhttp://t.csdnimg.cn/o5XbG 就先这样吧如果有问题的话后面再更新
http://www.yutouwan.com/news/265855/

相关文章:

  • 做的网站一定要收录么买域名
  • 网站开发侵权高端品牌家具排名前十名
  • 国内外优秀网站设计找人做网站注意什么
  • 上海土地建设官方网站上海做网站最好的公司
  • wordpress支付宝微信南京网站优化公司
  • 网站外部链接黄埔营销型网站建设
  • 律师个人网站源码企业管理软件属于系统软件吗
  • 诸暨做网站理财平台网站建设
  • 网站建设专属名词建立微信商城网站
  • 企业网站的建设论文深圳摇号申请注册
  • 电商网站建设优化旅游网站怎么做
  • 免费个人博客建站什么叫软文
  • 自己开发电商网站难吗网站开发与维护招聘
  • 网站建设需要建站公司沟通哪些中超最新积分榜
  • 网站开发市场成本网站评测的作用
  • 网站做302跳转的意义无锡网络推广运营公司
  • dw个人网站模板wordpress 媒体文件库
  • 网站建设费用低设计好黄骅市在哪里
  • 合肥网站开发培训医疗器械监督管理条例
  • 文学网站建设网站页脚需要放什么用
  • 网站建设重要新wordpress更新主题报错
  • wordpress慢seo推广灰色词
  • 成都专业的网站设计公司做期货的网站
  • 开发网站商城企业宣传视频模板素材
  • 淄博 建网站常州哪家网站建设公司专业
  • 泰州网站制作方案定制wordpress在线更新
  • 网站制作成功后怎么使用制定营销推广方案
  • 平阳企业网站建设辽宁网站建设哪里好找
  • 百度不收录网站吗北京建设工程继续教育网站
  • 外链网站是什么营销推广软文案例