在统计局网站上如何做图表,网站开发和设计人员的岗位要求,给你一个网站你怎么做,小型企业网络建设方案目录
1.缺失数据处理
1.1 DataFrame自身产生的缺失数据
1.2 缺失数据判断和统计
1.3 缺失数据清理
2. 多源数据操作
2.1 合并函数#xff1a;merge()
2.2 连接函数#xff1a;join() 2.3 指定方向合并#xff1a;concat()
3. 数据分组和聚合运算
3.1 groupby()方…目录
1.缺失数据处理
1.1 DataFrame自身产生的缺失数据
1.2 缺失数据判断和统计
1.3 缺失数据清理
2. 多源数据操作
2.1 合并函数merge()
2.2 连接函数join() 2.3 指定方向合并concat()
3. 数据分组和聚合运算
3.1 groupby()方法
3.2 聚合aggregate()方法
3.2.1 一般聚合使用
3.2.2 分组聚合 1.缺失数据处理
1.1 DataFrame自身产生的缺失数据 通过调整列名reindex 并增加带缺失值的‘four’列。
M2M1.reindex(columns[two,one,three,four]) 1.2 缺失数据判断和统计
1.3 缺失数据清理
1常量替代 2通过fillna()方法替代 3丢弃带缺失值的行或者列 (4) 用repalce(方法替换缺失值
replace(to_replaceNone,valueNone)用value指定的新值替换to_replace指定的原值。 2. 多源数据操作
2.1 合并函数merge()
merge(left, right, how‘inner’, onNone, left_onNone, right_onNone, left_indexFalse, right_indexFalse, sortFalse, suffixes(’_x’, ‘_y’), copyTrue, indicatorFalse, validateNone) 2.2 连接函数join()
通过索引或者指定的列连接两个DataFrame
DataFrame.join(other, onNone, how’left’, lsuffix”, rsuffix”, sortFalse)
参数说明 other:【DataFrame或者带有名字的Series或者DataFrame的list】如果传递的是Series那么其name属性应当是一个集合并且该集合将会作为结果DataFrame的列名 on:【列名称或者列名称的list/tuple或者类似形状的数组】连接的列默认使用索引连接 how:【{‘left’, ‘right’, ‘outer’, ‘inner’}, default:‘left’】连接的方式默认为左连接 lsuffix:【string】左DataFrame中重复列的后缀 rsuffix:【string】右DataFrame中重复列的后缀 sort:【boolean, default False】按照字典顺序对结果在连接键上排序。如果为False连接键的顺序取决于连接类型关键字。 实例
现有first与other两个DataFrame对象。 2.3 指定方向合并concat()
通过指定axis方向进行多数据源合并。
pd.concat()函数可以沿着指定的轴将多个dataframe或者series拼接到一起这一点和另一个常用的pd.merge()函数不同pd.merge()函数只能实现两个表的拼接。
pd.concat( objs, axis0, joinouter, join_axesNone, ignore_indexFalse, keysNone, levelsNone, namesNone, verify_integrityFalse, sortNone, copyTrue,) 参数含义
objsSeriesDataFrame或Panel对象的序列或映射。如果传递了dict则排序的键将用作键参数除非它被传递在这种情况下将选择值见下文。任何无对象将被静默删除除非它们都是无在这种情况下将引发一个ValueError。axis指定合并方向默认值为0为竖向合并。1为横向合并。join{innerouter}默认为“outer”。如何处理其他轴上的索引。outer为联合和inner为交集。ignore_indexbooleandefault False。如果为True请不要使用并置轴上的索引值。结果轴将被标记为0...n-1。如果要连接其中并置轴没有有意义的索引信息的对象这将非常有用。注意其他轴上的索引值在连接中仍然受到尊重。join_axesIndex对象列表。用于其他n-1轴的特定索引而不是执行内部/外部设置逻辑。keys序列默认值无。使用传递的键作为最外层构建层次索引。如果为多索引应该使用元组。levels序列列表默认值无。用于构建MultiIndex的特定级别唯一值。否则它们将从键推断。nameslistdefault无。结果层次索引中的级别的名称。verify_integritybooleandefault False。检查新连接的轴是否包含重复项。这相对于实际的数据串联可能是非常昂贵的。copybooleandefault True。如果为False请勿不必要地复制数据。
(4条消息) pandas的连接函数concat()函数_concat pandas_zzpdbk的博客-CSDN博客 3. 数据分组和聚合运算
3.1 groupby()方法
(8条消息) groupby函数详解_.groupby_Vergil_Zsh的博客-CSDN博客
DataFrame.groupby(byNone, axis0, levelNone, as_indexTrue, group_keysTrue, squeezeFalse, observedFalse, **kwargs) 例子 对School信息按照学校行索引进行分组然后统计体育、美术、舞蹈的人数。 如下按性别 通过如上对比可见是通过level来确定统计标准。 3.2 聚合aggregate()方法
aggregate(func,axis0,*arg,**kwargs)
func指定用于集合运算的函数具体类型包括自定义函数名字符串函数名列表函数名等。
3.2.1 一般聚合使用
1内置函数聚合运算 2自定义函数聚合运算 3多统计函数聚合运算 3.2.2 分组聚合