当前位置: 首页 > news >正文

自然资源网站官网做网站空间费用是什么意思

自然资源网站官网,做网站空间费用是什么意思,wordpress问答主题,兰州做网站es5188一#xff0c;大数据处理之数据抽取 1#xff0c;什么是数据抽取 在大数据领域中#xff0c;数据抽取是指从原始数据源中提取所需的数据子集或特定数据项的过程#xff0c; 数据抽取是数据预处理的重要步骤#xff0c;它为后续的数据分析和建模提供了基础。 2#xff…一大数据处理之数据抽取 1什么是数据抽取 在大数据领域中数据抽取是指从原始数据源中提取所需的数据子集或特定数据项的过程 数据抽取是数据预处理的重要步骤它为后续的数据分析和建模提供了基础。 2为什么要进行数据抽取 1大数据量中频繁的大批量查询需要很大的计算资源和时间会影响数据库的性能从而影响应用业务逻辑的执行 2业务与数据分离可以在不影响业务的前提下更好的实现数据处理、数据分析进而产出数据报表 二阿里大数据平台dataworks实现数据抽取 1数据抽取方式 1抽取方式-全量抽取在数据量不大时可以选中按照类似创建时间字段进行每次全量抽取实现简单 2抽取方式-增量抽取大数据量中全量抽取效率过低应选择按照类似修改时间字段进行每次增量抽取 2数据抽取工具阿里dataworks 1dataworks简单介绍 阿里云产品文档地址https://help.aliyun.com/zh/dataworks/product-overview/ DataWorks基于MaxCompute、Hologres、EMR、AnalyticDB、CDP等大数据引擎为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台。 2dataworks使用流程图 dataworks使用总体流程 数据开发流程 数据集成流程 3数据地图 搜索需要使用的源数据表——申请表权限 4数据开发DataStudio 新建一个数据处理的业务流程 新建数据处理sql文件编写数据处理sql业务流程下MaxCompute——数据开发——新建节点——ODPS SQL——编写数据处理汇集的查询sql并调试通过 新建数据处理后的中间层表业务流程下MaxCompute——表——新建表 配置往数据处理后的中间层表同步的ODPS SQL的调度配置重点为调度时间配置调度依赖配置 注意若所依赖的数据源表和数据处理后的中间层表不在同一工作空间下则无法绑定依赖关系则需观察数据源表的数据生成时间手动设置ODPS SQL的调度时间延后 新建数据集成任务数据集成——新建节点——离线同步——选择数据来源数据处理建立的ads层临时表 ——选择数据去向——调度配置配置时间属性等参数 4ODPS SQL的开发规范常用sql函数 1sql语句全部大写格式化操作 2sql参考https://help.aliyun.com/zh/maxcompute/user-guide/sql-3/ 日期与时间函数https://help.aliyun.com/zh/maxcompute/user-guide/date-functions 字符串函数https://help.aliyun.com/zh/maxcompute/user-guide/string-functions 聚合函数https://help.aliyun.com/zh/maxcompute/user-guide/aggregate-functions 三ADB数据库的应用——数据抽取后的应用 1ADB数据库注意点 1adb表可以插入可以带条件删除不支持修改命令不支持清空表表命令不支持delete全量删除 2adb表支持主键冲突——即主键冲突时不会多次插入数据 3AnalyticDB MySQL版集群默认编码格式为utf-8相当于MySQL中的utf8mb4编码暂不支持其他编码格式。 4AnalyticDB MySQL版不支持unsigned约束指定当前列的数值为非负数。 2建表注意事项 1AnalyticDB MySQL版的表分为分区表和维度表。 分区表又称普通表用于存储业务数据的度量值。AnalyticDB MySQL版根据分布键将数据打散在各个数据节点上。每个节点再根据分区键将数据文件拆分为不同的文件。 如果业务明确有增量数据导入需求创建分区表时可以同时指定分布键和分区键来实现数据的增量同步 维度表维度表是业务特性描述的集合每个节点冗余一份。通常数据量小变化频率低。 2主键中必须包含分布键和分区键建议将分区键和分布键放在组合主键的前部 3在普通表中定义表的分布键DISTRIBUTED BY HASH(column_name,…)按照column_name的HASH值进行分片。 AnalyticDB MySQL版支持将多个字段作为分布键。 AnalyticDB MySQL版不支持修改分布键。 4PARTITION BY VALUE(column_name)表示使用column_name的值来做分区 5updateType表数据更新方式 realtime实时更新只支持实时写入数据。 batch批量更新只支持批量离线导入数据。不带此参数时默认为批量更新。 3常规聚合函数 4窗口函数 窗口函数是基于查询结果的行数据进行计算的函数运行在 HAVING 子句之后 ORDER BY 子句之前。触发一个窗口函数需要特殊的关键字 OVER子句来指定窗口。 一个窗口包含三个组成部分 分区规范用于将输入行分裂到不同的分区中与 GROUP BY 子句的分裂过程相似。 排序规范用于决定输入数据行在窗口函数中执行的顺序。 窗口框架用于指定一个滑动窗口的数据以给窗口函数指定需要处理的行数据。如果这个框架没有指定则默认是 RANGE UNBOUNDED PRECEDING 与 RANGE BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW 相同默认框架包含当前分区中所有从开始到目前行所有数据。cume_dist() → bigint 返回一组数值中每个值的累计分布。结果返回的是按照窗口分区下窗口排序后的数据集下 当前行前面包括当前行数据的行数。因此排序中任何关联值均会计算成相同的分布值。dense_rank() → bigint 返回一组数值中每个数值的排名。这个函数与 rank() 相似但该函数关联值不会产生顺序上的空隙。ntile(n) → bigint 将每个窗口分区的数据分裂到 n 个桶中桶号从 1 到最大 n 桶号值最多间隔是 1。 如果窗口分区中的数据行数不能均匀的分到每一个桶中则剩余值将每一个桶分一个从第一个桶开始。percent_rank() → bigint 返回数据集中每个数据的排名百分比。结果是根据 (r - 1) / (n - 1) 计算的 其中 r 是由 rank() 计算 的当前行排名 n 是当前窗口分区内总的行数。rank() → bigint 返回数据集中每个值的排名。排名值是根据当前行之前的行数加1不包含当前行 因此排序的关联值可能产生顺序上的空隙。 rank() 排名会对每个窗口分区进行计算。row_number() → bigint 根据行在窗口分区内的顺序为每行数据返回一个唯一的顺序的行号从1开始。值函数 first_value(x) → [与输入类型相同] 返回窗口内的第一个值。last_value(x) → [与输入类型相同] 返回窗口内的最后一个值。nth_value(x, offset) → [与输入类型相同] 返回窗口内指定偏移的值。偏移量从 1 开始。如果偏移量是null或者大于窗口内值的个数返回null。 如果偏移量为0或者负数则会报错。lead(x[, offset[, default_value]]) → [与输入类型相同] 返回窗口内当前行往后偏移 offset 的值。偏移量可以是标量表达式起始值是0即当前数据行默认是1 。 如果偏移量的值是 null 或者大于窗口长度则返回 default_value如果没有指定偏移量则会返回 null 。lag(x[, offset[, default_value]]) → [与输入类型相同] 返回窗口内当前行往前偏移 offset 的值。偏移量可以是标量表达式起始值是0即当前数据行默认是1 。 如果偏移量的值是null或者大于窗口长度则返回 default_value如果没有指定偏移量则返回 null 。
http://www.sadfv.cn/news/430741/

相关文章:

  • 只用html5做网站榆次小学网站建设
  • 制作网站的公司电话号码网站建设好后有些什么资料
  • 一个阿里云怎么做两个网站吗企业邮箱在哪里登陆
  • 设计公司网站详情网站开发策略
  • 全网最低价查询网站招远网站建设
  • vs2019怎么创建网站wordpress多个用户发表文章
  • 如何做跨境购物网站光谷网站推广
  • php ajax网站开发佛山企业如何建网站
  • 西安做网站费用网站颜色搭配
  • 青岛网站有限公司海南的网站建设公司哪家好
  • 深圳市宝安区做网站建设的企业网站开发如何共用菜单栏
  • 将网页加入可信站点北京seo诊断
  • 青岛建网站合肥网站制作前3名的
  • 济源网站建设的公司西部数码域名网站模板
  • 城阳网站建设哪家好那个网站推作者
  • 广州住房公积金建设银行预约网站桂林人论坛app
  • 建设银行首页 网站免费网络营销
  • 去哪里可以做网站个人简历模板电子版可填写
  • 大丰网站制作wordpress换背景
  • 如何替换网站上的动画搜索引擎有哪些平台
  • 网站编辑工作内容怎么写站长工具seo综合查询源码
  • 网站开发qq头像个人主页介绍文案
  • 免费网站模板htmlhtml基本结构框架代码
  • 微站是什么WordPress说说心情
  • 手机怎么搭建网站低代码app开发平台
  • 如何用python 做网站网站收录申请
  • 在哪一个网站上做劳务合同备案网站前台模板免费下载
  • 空间商网站ip被攻击后换ipwordpress登录400错误
  • 做一个公司网站需要多少钱酷炫的网站
  • 网站项目需求erp软件实施