Power Query获取分组TOPN数据

B站影视 内地电影 2025-05-24 22:11 2

摘要:大家好,继续给大家来分享一下Power Query的数据清洗技巧。今天的技巧是去获取分组数据的前安名,就TOPN。就像大家现在屏幕上看到这个数据,一会要把这个数据基于地区,就是这些大区去做数据分组。分组完之后想提取每个大区的总价值的前五名,当然也可以是前两名、

Power Query获取分组TOPN数据。

大家好,继续给大家来分享一下Power Query的数据清洗技巧。今天的技巧是去获取分组数据的前安名,就TOPN。就像大家现在屏幕上看到这个数据,一会要把这个数据基于地区,就是这些大区去做数据分组。分组完之后想提取每个大区的总价值的前五名,当然也可以是前两名、前一名、前五名、前十名,自己定义看需求。

就是这么一个分组提取数据的需求,一起来看一下它的实现过程。

·首先把数据导入帕克瑞编辑器,数据菜单、表格和区域。

·数据进来之后现在要对数据做分总,找到主页,然后分组依据。分组依据里面要拿地区来做分组依据。

·新的列名管它叫做奥迪特,因为不做集合,就是把数据按照不同的大区做一个归类,分成不同的组而已,所以新的列名叫奥迪特。

·这里边可以叫所有行,这个操作就是每一个大区的所属的所有数据聚在一起,就这样一个要求,点确定。这样就得到了每个大区的单独的表,比如华东区,这个就是华东的所有的数据,东北区就是东北的所有数据。

·在这个基础之上再加一个列,资金链里面要去对数据进行排序,这个管它叫做TOPN and data,就是新的列名。

·先管它叫TOPN and data,然后公式,先把公式输完,首先要去做销售的排序,这样才能够取前几名。

·用table,然后第一个参数是table,在table的表里就是第二类all data,因为这里边是table,所以把all data给它。

·然后是排名的要求标准,这里面按什么排?是按照这个,看一下这里边是按照总价值去拍,就这点总价值去拍。

·所以在这个地方先来一个大括号,然后双引号,把总价值这一列给它,因为总价值这一列不在当前可见的表里,当前可见表只有两列,一列是地区,一列是奥迪,它是在里边这个列表里面,所以这个地方要手工输入它,叫总价值。

·总价值然后要降序牌,因为要取套牌要去降序牌,所以要得深,看一下来叫order descending,要取order descending,然后把它做一个闭合。

·这样来看一下排序的过程,排序的结果,把这个,公式给大家放大一下大家看一眼,table的sort,然后是sort,data这一列,data这一列都是表,所以这就是做排序的目标。排序依据就是总价值这一列,然后是降序排这样的意思。

确定之后来看一下数据,数据之后再看总价值就已经开始排序了,看到没有,这是二零一八幺七幺五幺四幺三,下边这个表,东北区这个表也是一样,幺八幺七幺六幺六幺四幺三,对吧?排完序之后其实就可以非常方便的来取出这个值来了。

再回到刚才的编辑的界面,在函数外边再套一层,再套一层就是来取套盆的值,比如取top五,所以这个地方就是用table first n函数,把刚才做的上一步的函数给它套上,套上之后作为table first n第一个参数就是一张表,在这个表里要取几行?要取五行,first n就是前五行的意思,所以就套了一层,放大一下看一下。

所以在刚才排序的基础之上外边套了一层套,table点first n,然后把刚才的排序的过程放在first n的第一个参数,第二个参数就取前五行,也就是前五名,当然这个地方就可以自己自由定义了,前一名、前二名甚至前十名都可以了,这样就完成所需要做的提取的任务。

点确定,现在数据就看每个区就只剩了前五行,看到没有,每个区就只剩了前五行,所以这个时候就可以把all data删掉,把all data删除,然后在只剩了前五行的表里边去做扩展,点一下扩展,扩展里面就可以来选,比如有地区了,客户id要不要?客户群里想要哪些就要哪些地区,当然是不要了。

其他的数据比如都想留制都可以,然后把原始列名做前缀勾掉,其他的列想留哪些列就留哪些列就勾上,不想留就勾掉,但是地区就不需要了,因为地区第一列就是地区了。

现在确定展开之后,所以就看到现在的具体的数据,华东是五条,东北是五条,华南五条,华中五条,西北五条,西南五条,看到没有?这个就是最终的数据,总价值这是排序,一二三四五,然后又开始排,一二三四五,总价这样拍,这样就可以动态的去始终是动态的渠道,销售额或者是总价值排名前n。数据来供我们去做进一步的分析。

这个技巧给大家分享到这。

来源:数据分析精选

相关推荐