当前位置: 首页 > news >正文

常德建设局官方网站济南网站建设方案

常德建设局官方网站,济南网站建设方案,wordpress the ken,在本地做改版如何替换旧网站会影响百度收录吗背景假设有一个学生各门课的成绩的表单#xff0c;应用hive取出每科成绩前100名的学生成绩。这个就是典型在分组取Top N的需求。解决思路对于取出每科成绩前100名的学生成绩#xff0c;针对学生成绩表#xff0c;根据学科#xff0c;成绩做orderby排序,然后对排序后的成绩应用hive取出每科成绩前100名的学生成绩。这个就是典型在分组取Top N的需求。解决思路对于取出每科成绩前100名的学生成绩针对学生成绩表根据学科成绩做orderby排序,然后对排序后的成绩执行自定义函数row_number(),必须带一个或者多个列参数如ROW_NUMBER(col1,....)它的作用是按指定的列进行分组生成行序列。在ROW_NUMBER(a,b)时若两条记录的ab列相同则行序列1否则重新计数。只要返回row_number()返回值小于100的的成绩记录就可以返回每个单科成绩前一百的学生Sql代码  create table score_table (subject string,student string,score int)partitioned by (date string);如果要查询2012年每科成绩前100的学生成绩sql如下Java代码  create temporary function row_number as com.blue.hive.udf.RowNumber;select subject,score,student from(select subject,score,student from score where dt2012 order by subject,socre desc) order_scorewhere row_number(subject)  100;com.blue.hive.udf.RowNumber是自定义函数函数的作用是按指定的列进行分组生成行序列。这里根据每个科目的所有成绩生成序列序列值从1开始自增。执行row_number函数返回值如下科目 成绩 学生 row_number物理 100 张一 1物理 90 张二 2物理 80 张三 3.....数学 100 李一 1数学 90 李二 2数学 80 李三 3....row_number的源码函数row_number(),必须带一个或者多个列参数如ROW_NUMBER(col1,....)它的作用是按指定的列进行分组生成行序列。在ROW_NUMBER(a,b)时若两条记录的ab列相同则行序列1否则重新计数。package com.blue.hive.udf;import org.apache.hadoop.hive.ql.exec.UDF;public class RowNumber extends UDF {private static int MAX_VALUE 50;private static String comparedColumn[] new String[MAX_VALUE];private static int rowNum 1;public int evaluate(Object... args) {String columnValue[] new String[args.length];for (int i 0; i args.length; i) 『columnValue[i] args[i].toString();}if (rowNum 1) {for (int i 0; i columnValue.length; i)comparedColumn[i] columnValue[i];}for (int i 0; i columnValue.length; i) {if (!comparedColumn[i].equals(columnValue[i])) {for (int j 0; j columnValue.length; j) {comparedColumn[j] columnValue[j];}rowNum 1;return rowNum;}}return rowNum;}}编译后打包成一个jar包如/usr/local/hive/udf/blueudf.jar然后在hive shell下使用如下:add jar /usr/local/hive/udf/blueudf.jar;create temporary function row_number as com.blue.hive.udf.RowNumber;select subject,score,student from(select subject,score,student from score where dt2012 order by subject,socre desc) order_scorewhere row_number(subject) 100;同样这个函数可以用作去重操作。可以替代大批量数据的DISTINCT通过执行如select * from(select type,value,row_number() as rnfromlog_table distribute by type,valuesort by type,value)where rn 1;注意但是使用row_number()函数需要注意一点必须使用sortby。测试的时候必须使用order by。row_number()函数会假设数据有序的基础上进行的。
http://www.yutouwan.com/news/288957/

相关文章:

  • 简单网站开发工具莱芜雪野湖风景区门票
  • 高端网站建设价格商务网站规划与设计实训报告
  • 哪个网站上网好网站的跳出率
  • 网站建设 音频插件淘宝关键词查询工具哪个好
  • 免费发广告帖子的网站北京赛车网站建设
  • 网站升级维护要多久小程序制作
  • 百度站长推送自助建网站哪个便宜
  • 网上书城网站开发的结论和不足百度seo排名原理
  • 网站拒绝了您的访问网页价格表
  • 网站运营建设的培训班wordpress教程主题
  • asp.net 网站开发项目化教程微信建站网站
  • 爱站网关键词查询网上做任务网站有哪些
  • 做网站如何寻找客源彩票网站为啥链接做两次跳转
  • 网站服务器上的跳转选择怎么做做营养的网站
  • 网站推广怎么样临沂网站建设设计公司
  • 酒类营销网站广州高端网站建设定制
  • 手机网站开发方式广州全网推广
  • 珍爱网建设网站的目的芝罘区网
  • 网站建设研究背景wordpress百度移动落地页
  • joomla 网站建设教程wordpress系统和插件下载
  • 做展厅 参考什么网站汉字域名注册
  • 惠州网站建设培训网站关键词排名快速提升
  • 官网整站优化90设计网站免费素材
  • 网站网络投票建设步骤展会设计公司简介
  • 北京专业做网站设计公司淘宝网站建设方式
  • 自动做微网站深圳app开发怎么选
  • h5网站建设文章广州外贸soho建站
  • 南京企业网站设计建设洛阳网站建设lyland
  • 初中做语文题的网站做啥网站好
  • 中国建筑装饰集团有限公司优化模型的推广