网络营销是不是网络推广,无忧seo,遵义本地网,网站设计毕业设计论文分组与聚合通常是分析数据的一种方式#xff0c;通常与一些统计函数一起使用#xff0c;查看数据的分组情况想一想其实刚才的交叉表与透视表也有分组的功能#xff0c;所以算是分组的一种形式#xff0c;只不过他们主要是计算次数或者计算比例#xff01;#xff01;看其…分组与聚合通常是分析数据的一种方式通常与一些统计函数一起使用查看数据的分组情况想一想其实刚才的交叉表与透视表也有分组的功能所以算是分组的一种形式只不过他们主要是计算次数或者计算比例看其中的效果4.10.1 什么是分组与聚合4.10.2 分组与聚合APIDataFrame.groupby(key, as_indexFalse)key:分组的列数据可以多个案例:不同颜色的不同笔的价格数据col pd.DataFrame({color: [white,red,green,red,green], object: [pen,pencil,pencil,ashtray,pen],price1:[5.56,4.20,1.30,0.56,2.75],price2:[4.75,4.12,1.60,0.75,3.15]})color object price1 price2
0 white pen 5.56 4.75
1 red pencil 4.20 4.12
2 green pencil 1.30 1.60
3 red ashtray 0.56 0.75
4 green pen 2.75 3.15
进行分组对颜色分组price进行聚合# 分组求平均值
col.groupby([color])[price1].mean()
col[price1].groupby(col[color]).mean()color
green 2.025
red 2.380
white 5.560
Name: price1, dtype: float64# 分组数据的结构不变
col.groupby([color], as_indexFalse)[price1].mean()color price1
0 green 2.025
1 red 2.380
2 white 5.560
4.10.3 星巴克零售店铺数据案例现在我们有一组关于全球星巴克店铺的统计数据如果我想知道美国的星巴克数量和中国的哪个多或者我想知道中国每个省份星巴克的数量的情况那么应该怎么办数据来源Starbucks Locations Worldwide1 数据获取从文件中读取星巴克店铺数据# 导入星巴克店的数据
starbucks pd.read_csv(directory.csv)
2 进行分组聚合# 按照国家分组求出每个国家的星巴克零售店数量
count starbucks.groupby([Country]).count()
画图显示结果count[Brand].plot(kindbar, figsize(20, 8))
plt.show()
假设我们加入省市一起进行分组# 设置多个索引set_index()
starbucks.groupby([Country, State/Province]).count()
仔细观察这个结构与我们前面讲的哪个结构类似与前面的MultiIndex结构类似