当前位置: 首页 > news >正文

制作本地网页网站推广与优化方案

制作本地网页,网站推广与优化方案,网站系统设计目标,自己做的网站搜索不到简介#xff1a;近日#xff0c;TPC Benchmark Express-BigBench(简称TPCx-BB)公布了最新的世界排名#xff0c;阿里云自主研发的神龙大数据加速引擎获得了TPCx-BB SF3000排名第一的成绩。TPCx-BB测试分为性能与性价比两个维度。其中#xff0c;在性能维度#xff0c;在本…简介近日TPC Benchmark Express-BigBench(简称TPCx-BB)公布了最新的世界排名阿里云自主研发的神龙大数据加速引擎获得了TPCx-BB SF3000排名第一的成绩。TPCx-BB测试分为性能与性价比两个维度。其中在性能维度在本次排名中阿里云领先第二名高达41.6达到了2187.42 BBQpm性价比领先第二名40降低到346.53 USD/BBQpm。 作者 | 神龙加速计算团队 来源 | 阿里技术公众号 一 背景介绍 近日TPC Benchmark Express-BigBench(简称TPCx-BB)公布了最新的世界排名阿里云自主研发的神龙大数据加速引擎获得了TPCx-BB SF3000排名第一的成绩。 TPCx-BB测试分为性能与性价比两个维度。其中在性能维度在本次排名中阿里云领先第二名高达41.6达到了2187.42 BBQpm性价比领先第二名40降低到346.53 USD/BBQpm。 TPCx-BB SF3000性能维度排行 TPCx-BB SF3000性价比维度排行 借这个机会跟大家分享一下这个第一背后的技术历程。 二 神龙大数据加速引擎MRACC概述 阿里云自研的神龙大数据加速引擎MRACCApasara Compute MapReduce Accelerator是这次取得优异成绩的杀手锏。 在数据处理需求激增的今天许多企业会使用开源Spark、Hadoop组件或HDP、CDH等常用套件自建开源大数据集群处理数据量从TB到PB级集群规模从几台到几千台。MRACC神龙大数据加速引擎针对客户自建场景依托神龙底座提供常用组件加速能力如Spark、Hadoop、Alluxio等。 结合阿里云神龙架构的特性MRACC进行了软硬一体化优化形成独一无二的性能优势最终使复杂SQL查询场景性能相比社区版Spark提升2-3倍使用eRDMA加速Spark性能提升30%。在神龙大数据加速引擎的加持下企业使用阿里云ECS云服务器运行大数据集群将获得更高的性能和性价比。 图1 MRACC神龙大数据加速引擎架构 三 MRACC-Spark介绍 Spark自从2010年面世到2020年已经经过十年的发展现在已经发展为大数据批计算的首选引擎。针对大数据最常用的Spark引擎MRACC进行了重点优化。具体来说针对大数据任务重IO特性MRACC在网络和存储方面结合云上的架构优势进行软硬件加速包括软件的SQL引擎优化使用缓存、文件裁剪、索引等优化手段并尝试将压缩等运算卸载到异构器件还使用eRDMA进行网络加速将shuffle阶段的数据交换运行在eRDMA网络使得延时降低、CPU利用率大幅提升。 图2 MRACC-Spark架构 四 Spark SQL引擎优化 从Spark2以后Spark SQL, DataFrames and Datasets接口逐渐取代基础RDD API成为Spark的主流编程模型。社区对Spark SQL进行了大量投入据统计Spark3.0版本发布将其中接近一半的优化都集中在Spark SQL上。使用 SparkSQL 替代 Hive 执行离线任务已成为不少企业的主流选择。 针对SQL引擎的anlyzer、optimizer、planner、Query execution几个阶段我们都做了一些优化。Spark3.0对SQL引擎进行了大刀阔斧的改造和优化其中AQE和DP机制广受关注。但目前开源Spark的AE机制目前仅支持分区裁剪对于非分区键和subquery裁剪不支持我们针对这块做了优化支持subquery的动态数据裁剪能大幅减少参与计算的数据量。 在物理计划执行阶段我们支持了window topn排序使得包含limit的sql语句性能大幅提升并支持了parquet rowgroup裁剪、bloom filter join等高级特性。SPAKR SQL的CBO机制能较好的提高SQL执行效率但是在cbo阶段join table过多会导致的cbo搜索开销暴增我们支持了遗传算法搜索解决了 join table过多导致的开销暴增的情况。 此外还支持了去重下推、join外键消除、完整性约束等功能并结合deltalake支持了数据的增删改操作。 图3 MRACC-Spark的SQL引擎优化 五 近网络RDMA优化 2021年杭州云栖大会上阿里云发布第四代神龙架构提供业界首个大规模弹性RDMA加速能力。RDMA是一种高性能网络传输技术提供直接内存访问的方式数据传输bypass Kernel从而能减少CPU的开销提供低时延的高性能网络。在分布式计算中shuffle过程必不可少且消耗较多的计算和网络资源是大数据分布式计算的优化重点。针对Spark 内存计算在shuffle阶段数据交换特点可将shuffle数据交换变为memory-network-memory的模式充分利用RDMA用户态内存直接交互、低延时、低cpu消耗的特点最终在tpcxhs等端到端benchmark上获得了30%的性能提升。 图4 MRACC-Spark的eRDMA近网络优化插件 六 性能优化结果 最终在TPCDS 10T数据集上相比最新的Spark3.1版本性能提升2.19倍。在TPCx-BB上相比第二名领先高达41.6%。 图5 TPCDS及TPCx-BB的数据效果 七 展望 目前所有这些优化我们都封装成插件形式交付给客户客户代码基本上不需要修改方便客户直接使用。 未来我们将持续将我们软硬件一体化极致性能优化能力服务阿里云的大数据客户此外我们将在软硬件一体化性能优化能力上持续迭代构建性能更高、成本更低的MRACC神龙大数据加速服务能力提供给广大用户。 附TPCx-BB介绍 TPCx-BB是由国际标准化测试权威组织(TPC)发布的基于零售业场景构建的端到端大数据测试基准支持主流分布式大数据处理引擎模拟了整个线上与线下业务流程有30个查询语句涉及到描述性过程型查询、数据挖掘以及机器学习的算法。TPCx-BB的测试具有数据量大、特征复杂、来源复杂等特点与真实业务场景较为接近对各行业的基础设施选型有着重要参考意义。 TPCx-BB的测试结果可以全面准确的反映端到端的大数据系统的整体运行性能。测试涵盖了结构化、半结构化和非结构化数据能够从客户实际场景角度更全面的评估大数据系统软硬件性能、性价比、服务和功耗等各个方面。 原文链接 本文为阿里云原创内容未经允许不得转载。
http://www.sadfv.cn/news/37513/

相关文章:

  • 速橙科技有限公司网站建设做空的网站有哪些
  • 如何利用国外网站开发客户jq动画效果网站
  • 长春有什么好的网站制作公司找厂家用什么软件
  • 百度怎么发布网站张家港网站建设早晨设计
  • 成都专业网站建设公司网页网站自做全搞定
  • 做网站盘锦wordpress怎么搜索中文主题
  • 网站建设页面设计图片河北住房和城乡建设厅网站电话
  • 网站推广基本方法是wordpress如何秒开
  • 建设手机网站多少钱百度新闻
  • 惠州市建设规划局网站做网站语言学什么
  • 网站建设不完整南京城乡住房建设厅网站
  • 无锡网站制作价格多少哪个网站做简历免费下载
  • 和网站建设相关的行业网站开发中视屏怎样编辑到网页上
  • 南宁网站建设加王道下拉免费网站建设塔山双喜
  • 天津 交友 网站建设修改wordpress评论
  • 开发帮官方网站微信浏览为网站的缓存怎么清理
  • 做女装的网站有哪些深圳 企业 网站建设哪家好
  • 中英文网站建设 pdf网站子站怎么做的
  • 青岛安装建设股份有限公司网站seo搜索是什么
  • 网上销售怎样做网站广告在线制作
  • 百度手机端推广网站优化关键词排名自己怎么做
  • 小视频网站哪个可以推广新沂微网站开发
  • 深圳建立企业网站临沂网站设计价格
  • 那里做网站比较好wordpress怎么做伪静态
  • j2ee网站开发参考文献html网站开发事例教程
  • 商品展示类网站网站浏览器兼容性
  • 高端网站设计报价表学大教育一对一收费价格表
  • 好单库如何做网站上海找做网站公司哪家好
  • 华侨城网站建设用ps怎么做网站背景
  • 一建 建设网站帮别人做网站如何备案