当前位置: 首页 > news >正文

优惠网站建设做电影网站用什么虚拟主机

优惠网站建设,做电影网站用什么虚拟主机,上海网站设计团队,企业网站seo优日常用Python做数据分析最常用到的就是查询筛选了#xff0c;按各种条件、各种维度以及组合挑出我们想要的数据#xff0c;以方便我们分析挖掘。 东哥总结了日常查询和筛选常用的种骚操作#xff0c;供各位学习参考。本文采用sklearn的boston数据举例介绍。 from sklearn …日常用Python做数据分析最常用到的就是查询筛选了按各种条件、各种维度以及组合挑出我们想要的数据以方便我们分析挖掘。 东哥总结了日常查询和筛选常用的种骚操作供各位学习参考。本文采用sklearn的boston数据举例介绍。 from sklearn import datasets import pandas as pdboston datasets.load_boston() df pd.DataFrame(boston.data, columnsboston.feature_names)1. [] 第一种是最快捷方便的直接在dataframe的[]中写筛选的条件或者组合条件。比如下面想要筛选出大于NOX这变量平均值的所有数据然后按NOX降序排序。 df[df[NOX]df[NOX].mean()].sort_values(byNOX,ascendingFalse).head()当然也可以使用组合条件条件之间使用逻辑符号 |等。比如下面这个例子除了上面条件外再加上且条件CHAS为1注意逻辑符号分开的条件要用()隔开。 df[(df[NOX]df[NOX].mean()) (df[CHAS] 1)].sort_values(byNOX,ascendingFalse).head()2. loc/iloc 除[]之外loc/iloc应该是最常用的两种查询方法了。loc按标签值列名和行索引取值访问iloc按数字索引访问均支持单值访问或切片查询。除了可以像[]按条件筛选数据以外loc还可以指定返回的列变量从行和列两个维度筛选。 比如下面这个例子按条件筛选出数据并筛选出指定变量然后赋值。 df.loc[(df[NOX]df[NOX].mean()),[CHAS]] 23. isin 上面我们筛选条件 !都是个范围但很多时候是需要锁定某些具体的值的这时候就需要isin了。比如我们要限定NOX取值只能为0.538,0.713,0.437中时。 df.loc[df[NOX].isin([0.538,0.713,0.437]),:].sample(5)当然也可以做取反操作在筛选条件前加~符号即可。 df.loc[~df[NOX].isin([0.538,0.713,0.437]),:].sample(5)4. str.contains 上面的举例都是数值大小比较的筛选条件除数值以外当然也有字符串的查询需求。pandas里实现字符串的模糊筛选可以用.str.contains()来实现有点像在SQL语句里用的是like。 下面利用titanic的数据举例筛选出人名中包含Mrs或者Lily的数据|或逻辑符号在引号内。 train.loc[train[Name].str.contains(Mrs|Lily),:].head().str.contains()中还可以设置正则化筛选逻辑。 caseTrue使用case指定区分大小写naTrue就表示把有NAN的转换为布尔值Trueflagsre.IGNORECASE标志传递到re模块例如re.IGNORECASEregexTrueregex 如果为True则假定第一个字符串是正则表达式否则还是字符串 5. where/mask 在SQL里我们知道where的功能是要把满足条件的筛选出来。pandas中where也是筛选但用法稍有不同。 where接受的条件需要是布尔类型的如果不满足匹配条件就被赋值为默认的NaN或其他指定值。举例如下将Sex为male当作筛选条件cond就是一列布尔型的Series非male的值就都被赋值为默认的NaN空值了。 cond train[Sex] male train[Sex].where(cond, inplaceTrue) train.head()也可以用other赋给指定值。 cond train[Sex] male train[Sex].where(cond, otherFEMALE, inplaceTrue)甚至还可以写组合条件。 train[quality] traincond1 train[Sex] male cond2 train[Age] 25train[quality].where(cond1 cond2, other低质量男性, inplaceTrue)mask和where是一对操作与where正好反过来。 train[quality].mask(cond1 cond2, other低质量男性, inplaceTrue)6. query 这是一种非常优雅的筛选数据方式。所有的筛选操作都在之内完成。 # 常用方式 train[train.Age 25] # query方式 train.query(Age 25)上面的两种方式效果上是一样的。再比如复杂点的加入上面的str.contains用法的组合条件注意条件里有时两边要用包住。 train.query(Name.str.contains(William) Age 25)在query里还可以通过来设定变量。 name William train.query(Name.str.contains(name))7. filter filter是另外一个独特的筛选功能。filter不筛选具体数据而是筛选特定的行或列。它支持三种筛选方式 items固定列名regex正则表达式like以及模糊查询axis控制是行index或列columns的查询 下面举例介绍下。 train.filter(items[Age, Sex])train.filter(regexS, axis1) # 列名包含S的train.filter(like2, axis0) # 索引中有2的train.filter(regex^2, axis0).filter(likeS, axis1)8. any/all any方法意思是如果至少有一个值为True结果便为Trueall需要所有值为True结果才为True比如下面这样。 train[Cabin].all()Falsetrain[Cabin].any()Trueany和all一般是需要和其它操作配合使用的比如查看每列的空值情况。 train.isnull().any(axis0)再比如查看含有空值的行数。 train.isnull().any(axis1).sum()708e any和all一般是需要和其它操作配合使用的比如查看每列的空值情况。 train.isnull().any(axis0) [外链图片转存中...(img-QYyk6pc2-1694485667807)]再比如查看含有空值的行数。 train.isnull().any(axis1).sum() 708
http://www.sadfv.cn/news/241746/

相关文章:

  • 年底 网站备案成都龙泉工程建设有限公司网站
  • 网站建设背景和目标高端品牌女装连衣裙
  • alexa全球网站排名三亚网红打卡景点
  • 用C语言做网站登录界面app外包平台的服务水平
  • 建com网站中国建材建设网站
  • 做网站网页维护 手机App 开发上海高端做网站
  • 设计品质网站建设做销售在哪个网站找客户
  • 电子商城网站开发 pdf网站建设需要交文化建设税吗
  • 网站建设有关图片在线做章网站
  • 沈阳高端网站定制开发学生html美食静态网页代码
  • 建设网站的页面设计wordpress分类目录最简化404
  • 网站开发外包公司合同成都城乡建设网站
  • 开源html5 网站模板企业网站需要注意什么
  • dede 两个网站图片路径网站设计需要那些模块
  • 哪里可以买链接网站网站注册完域名如何建站
  • 如何设计公司官网站大家称赞的网站建设
  • 建设一个购物网站多少钱滨海县网站建设
  • 上海网站营销seo方案程建网
  • 如何在个人电脑用源码做网站网站优化就是seo
  • 地方信息网站怎么做网站开发中定义路由的作用
  • 河北网站建设案例采集文章留在网站
  • 计算机应用技术网站建设图片做旧网站
  • 网站建设幻灯片背景图片素材网站规划与开发设计
  • 常德找工作网站广东网站设计公司电话
  • 域名网站有哪些dw制作班级网站
  • 西安网站制作公司哪建站公司网站社区
  • 宝安做网站公司科技感强的网站
  • 新手学做网站代码网站建设公司谁管
  • 浙江省邮电工程建设有限公司网站管理咨询公司简介模板
  • 网站栏目内容和功能阿里云网站建设如何