当前位置: 首页 > news >正文

渗透网站后台数据截图完整网站开发需要多久

渗透网站后台数据截图,完整网站开发需要多久,中国十大装修公司排名,福州市城乡建设局网站1 引言 AVS标准Ⅲ采用的8x8整数变换在获得较H#xff0e;264更高的压缩率和主观图像质量的同时#xff0c;增加了算法的实现复杂性和时间开销。本文重点研究AVS编解码器的整数变换模块#xff0c;针对不同的算法实现模式#xff0c;在原有Visual C6#xff0e;0整数变换模…1 引言 AVS标准Ⅲ采用的8x8整数变换在获得较H264更高的压缩率和主观图像质量的同时增加了算法的实现复杂性和时间开销。本文重点研究AVS编解码器的整数变换模块针对不同的算法实现模式在原有Visual C60整数变换模块基础上分别应用MMXSSE2和加强了乘法操作的SSE2内联汇编指令技术优化整数变换的关键算法实验结果表明性能最优的SSE优化算法将单次整数变换的平均时延减少到05。ms以内其编码速度比Visual C60整数变换模块提高了63倍实现了高速率的AVS整数变换具有较大的实用价值。 2 AVS整数变换及蝶形算法 由于AVS正变换、反变换的基本原理近似本文仅以正变换的分析与优化为例来详细说明。AVS对残差矩阵X的二维整数正变换定义为 式中T8为变换矩阵如图1所示。AVS整数变换的变换系数存在对称性仅用加法和移位就可实现消除了逆变换的不匹配容易使用基8蝶形算法快速实现。图2所示为水平变换XT8的一维8点快速蝶形算法。显然采用两个近似的C语言代码段就可实现由X到H的变换过程。依此设计的Visual C6O整数变换模块的算法清晰简单容易更改数据长度代码冗余少但由于C程序不针对硬件编程其较低的编解码速度不能满足HDTV实时性要求。 3 整数变换的优化设计 31 AVS整数变换的算法模式 利用矩阵乘法的结合律公式(1)可以改写为 从而AVS整数变换的算法模式可分为4类 1)水平变换一垂直变换先水平变换H′XT8再垂直变换 2)水平变换一转置一水平变换一转置计算次序为 3)垂直变换一水平变换计算次序为 4)垂直变换一转置一垂直变换一转置计算次序为 无论采用上述哪种算法模式为获得高质量主观图像效果并避免数据溢出第一次变换前残差块X的每个元素均要由8位整型数据扩展为16位第二次变换结果H的每个元素均要扩展为32位。为兼顾较高的图像压缩效率最终输出结果需紧缩为16位的整型数据。 整数变换是典型的以计算为主的编码过程2-3为改进数字视频系统的实时性需在Visual C60基础上使用内联汇编采用Intel单指令多数据并行加速技术(SIMD)作面向硬件的程序流程和代码级优化4。 32基于MMX的优化 根据上面的分析垂直变换比水平变换的汇编实现复杂很多且转置过程中要并行处理多列数据此时MMx指令集使用的64位寄存器遇到每次只能并行处理4个16位元素和2个32位元素的性能瓶颈适合选择水平变换一垂直变换的算法模式 1)水平变换H′XT8各矩阵元素均为16位每次循环分两步处理残差矩阵X的一行元素组合运算后得到矩阵H′相应行的元素8次循环后计算得到矩阵H′。 2)垂直变换每次取矩阵H′的两列向量的前两个元素扩展为32位数据后作组合运算再将结果紧缩为16位数据此过程分4次循环计算得到矩阵H。 图3为基于MMX的整数变换汇编优化的算法流程。程序中多次使用混排指令pshufw节省了大量movq和punpckhdq指令的时间开销。 33基于SSE2的优化 SSE2是基于128位寄存器的指令集并行处理能力强大水平变换和矩阵转置比基于MMX的优化更易实现采用水平变换一转置一水平变换一转置模式能仅以两次转置过程的延时为代价减少垂直变换的代码和时间开销。具体实现步骤 1)第一次水平变换H′XT8各矩阵元素占一个字每次变换一个行向量 2)第一次矩阵转置得到H′ 3)第二次水平变换JH′TT8矩阵各元素占一个双字每次取矩阵H′各列的前4个元素并扩展为32位数据作一系列组合运算即每次对4个行向量水平变换变换后结果紧缩为16位数据只需2次循环就能变换完H′T的全部元素得到矩阵J 4)第二次矩阵转置采用与第一次矩阵转置相同的代码段得到HJT。 根据图4所示的算法流程编写的优化程序可使用大量相同的代码段实现第一次水平变换而第二次水平变换仅用2次循环实现2次转置由相同的混排程序实现可见整个优化程序减少了循环调用和运算复杂度。 34侧重使用SSE2乘法指令的优化 研究表明垂直变换是汇编代码开销最高、时间消耗最大的环节。根据增强乘法功能SSE2指令集能在多媒体处理中大量减少乘加运算的特点图2和基于MMx的整数变换汇编程序中大量不可替换的乘加步骤可由侧重使用SSE2乘法指令进行优化。 假定矩阵 直接计算垂直变换 得到 观察公式(4)容易发现一个元素hij需由H′的行向量与TT8的列向量共2个向量、16个元素计算得出求H的任意一个行向量都须要8次重复调用H的同一个行向量且分别调用矩阵TT8的8个列向量各一次。显然乘加运算太多和寄存器资源有限使得这样的直接垂直变换编码的代码和冗余和时间开销代价非常大。 如果利用寄存器特性公式(4)对日的行向量计算可由图5所示快速算法求出。图中每个方框代表一个128位的寄存器空间每个寄存器存储8个16位数据左右两边每对寄存器相同位置的数据对应相乘后结果相加即得到所求矩阵H的行向量。这一算法大大减少了求和次数而且乘积与求和可以循环运算提高了寄存器的利用率。 4 优化效果 笔者分别使用MMxSSE2并侧重使用SSE2乘法指令内联汇编按照上文提出的优化算法在P418 GHz。512 Mbyte内存环境下进行了实验仿真结果如表1所示。 仿真实验数据说明基于SSE2的优化算法其单次AVS整数变换平均延时最短降低到了05 ms以内其编码速度是C程序的63倍和基于MMX优化算法编码速度的17倍适合高端硬件实现并获得较高的性价比基于MMX的优化算法延时稍长但适于低端硬件实现获得较高的性价比侧重使用SSE2乘法指令的优化算法的编码速度较基于MMX的优化算法优势不大这是因为大量乘法指令的执行产生了超出算法分析的计算延时。 5 小结 AVS整数变换的延时对数字电视系统的实时性有着重要的影响。笔者针对AVS整数变换的不同实现模式进行了研究结合MMXSSE2和侧重使用乘法的SSE2等指令集的特性在Visual C60实现整数变换模块的基础上使用内联汇编对整数变换模块进行了优化。实验结果表明基于SSE2的整数变换优化算法的性能最优单次变换的平均时延减至05 ms以内实现了高速率的AVS整数变换适合高端硬件实现并获得较高的性价比基于MMX的优化算法适合低端硬件实现获得较高的性价比而侧重使用SSE2乘法指令的优化算法也具有进一步研究的价值。
http://www.sadfv.cn/news/162187/

相关文章:

  • 网站开发技术三大件注销建设工程规划许可证在哪个网站
  • 丹徒网站建设包括哪些网站404页面怎么做
  • 慈溪网站建设公司浦东新区网站优化公司
  • app官方网站镇安县住房和城乡建设部网站
  • 网站建设进项填那个服务网站建设开发费会计分录
  • 端午节网站制作萧县哪有做网站的
  • 备案网站地址咸宁网站建设解决方案
  • 推广网站的方法有哪些北京免费网站建设
  • 集团网站建设哪家更好住房和城乡建设部网站现行规范
  • 有没有专门做化妆品小样的网站番禺核酸检测点免费
  • 合肥公司网站搭建服务商上海中学有哪些
  • 万网个人网站备案查询wordpress数据收集表单
  • 华为云网站定制优化外包顾问
  • 网站给假冒伪劣产品做推广长沙门户网站有哪些
  • 深圳网站建设多少钱济南网站开发薪酬
  • asp.net 创建网站网站开发与调试实验报告
  • 用html5做的简单的网站深圳建设集团怎么样
  • 哪些免费的网站可以做企业宣传不是用于制作网页的软件
  • 有哪些做软件的网站凡科做网站友情链接怎么做
  • 哪个是网站建设里面的服务器可以放几个网站
  • 网站建设攵金手指科杰壹陆怎么恢复网站数据库文件位置
  • 三桥做网站在中国做外国网站怎么收钱
  • 好的企业网站设计方案网站怎么做是满屏
  • 科技网站 石家庄基于android的app开发步骤
  • 新网站建设平台wordpress 文章 字体
  • 行业网站运营策划方案免费网站
  • 易语言做自动登陆网站教程推广优化网站排名
  • 网站建站工具j2ee 网站开发
  • 代做外国空间网站响应式网页设计最方便快速
  • 现在做个网站大概多少钱wordpress评论采集插件