当前位置: 首页 > news >正文

东莞设计网站服务的公司达内前端

东莞设计网站服务的公司,达内前端,怎么接广告推广,用dw做网站的步骤1. ExcelWriter 很多时候dataframe里面有中文#xff0c;如果直接输出到csv里#xff0c;中文将显示乱码。而Excel就不一样了#xff0c;ExcelWriter是pandas的一个类#xff0c;可以使dataframe数据框直接输出到excel文件#xff0c;并可以指定sheets名称。 df1 pd.Da…1. ExcelWriter 很多时候dataframe里面有中文如果直接输出到csv里中文将显示乱码。而Excel就不一样了ExcelWriter是pandas的一个类可以使dataframe数据框直接输出到excel文件并可以指定sheets名称。 df1 pd.DataFrame([[AAA, BBB]], columns[Spam, Egg]) df2 pd.DataFrame([[ABC, XYZ]], columns[Foo, Bar]) with ExcelWriter(path_to_file.xlsx) as writer:df1.to_excel(writer, sheet_nameSheet1)df2.to_excel(writer, sheet_nameSheet2) 如果有时间变量输出时还可以date_format指定时间的格式。另外它还可以通过mode设置输出到已有的excel文件中非常灵活。 with ExcelWriter(path_to_file.xlsx, modea, engineopenpyxl) as writer:df.to_excel(writer, sheet_nameSheet3) 2. pipe pipe管道函数可以将多个自定义函数装进同一个操作里让整个代码更简洁更紧凑。 比如我们在做数据清洗的时候往往代码会很乱有去重、去异常值、编码转换等等。如果使用pipe将是这样子的。 diamonds sns.load_dataset(diamonds)df_preped (diamonds.pipe(drop_duplicates).pipe(remove_outliers, [price, carat, depth]).pipe(encode_categoricals, [cut, color, clarity])) 3. factorize factorize这个函数类似sklearn中LabelEncoder可以实现同样的功能。 # Mind the [0] at the end diamonds[cut_enc] pd.factorize(diamonds[cut])[0] diamonds[cut_enc].sample(5)52103 2 39813 0 31843 0 10675 0 6634 0 Name: cut_enc, dtype: int64 区别是factorize返回一个二值元组编码的列和唯一分类值的列表。 codes, unique pd.factorize(diamonds[cut], sortTrue) codes[:10] array([0, 1, 3, 1, 3, 2, 2, 2, 4, 2], dtypeint64) unique [Ideal, Premium, Very Good, Good, Fair] 4. explode explode爆炸功能可以将array-like的值比如列表炸开转换成多行。 data pd.Series([1, 6, 7, [46, 56, 49], 45, [15, 10, 12]]).to_frame(dirty)data.explode(dirty, ignore_indexTrue) 5. squeeze 很多时候我们用.loc筛选想返回一个值但返回的却是个series。其实只要使用.squeeze()即可完美解决。比如 # 没使用squeeze subset diamonds.loc[diamonds.index 1, [price]] # 使用squeeze subset.squeeze(columns) 可以看到压缩完结果已经是int64的格式了而不再是series。 6. between dataframe的筛选方法有很多常见的loc、isin等等但其实还有个及其简洁的方法专门筛选数值范围的就是between用法很简单。 diamonds[diamonds[price].between(3500, 3700, inclusiveneither)].sample(5) 7. T 这是所有的dataframe都有的一个简单属性实现转置功能。它在显示describe时可以很好的搭配。 boston.describe().T.head(10) 8. pandas styler pandas也可以像excel一样设置表格的可视化条件格式而且只需要一行代码即可可能需要一丢丢的前端HTML和CSS基础知识。 diabetes.describe().T.drop(count, axis1).style.highlight_max(colordarkred)9. Pandas options pandas里提供了很多宏设置选项被分为下面5大类。 dir(pd.options) [compute, display, io, mode, plotting] 一般情况下使用display会多一点比如最大、最小显示行数画图方法显示精度等等。 pd.options.display.max_columns None pd.options.display.precision 5 10. convert_dtypes 经常使用pandas的都知道pandas对于经常会将变量类型直接变成object导致后续无法正常操作。这种情况可以用convert_dtypes进行批量的转换它会自动推断数据原来的类型并实现转换。 sample pd.read_csv(data/station_day.csv,usecols[StationId, CO, O3, AQI_Bucket], ) sample.dtypesStationId object CO float64 O3 float64 AQI_Bucket object dtype: object sample.convert_dtypes().dtypesStationId string CO float64 O3 float64 AQI_Bucket string dtype: object 11. select_dtypes 在需要筛选变量类型的时候可以直接用selec _dtypes通过include和exclude筛选和排除变量的类型。 # 选择数值型的变量 diamonds.select_dtypes(includenp.number).head() # 排除数值型的变量 diamonds.select_dtypes(excludenp.number).head() 12. mask mask可以在自定义条件下快速替换单元值在很多三方库的源码中经常见到。比如下面我们想让age为50-60以外的单元为空只需要在con和ohter写好自定义的条件即可。 ages pd.Series([55, 52, 50, 66, 57, 59, 49, 60]).to_frame(ages)ages.mask(cond~ages[ages].between(50, 60), othernp.nan) 13. 列轴的min、max 虽然大家都知道min和max的功能但应用在列上的应该不多见。这对函数其实还可以这么用 index [Diamonds, Titanic, Iris, Heart Disease, Loan Default] libraries [XGBoost, CatBoost, LightGBM, Sklearn GB]df pd.DataFrame({lib: np.random.uniform(90, 100, 5) for lib in libraries}, indexindex ) df df.max(axis1)Diamonds 99.52684 Titanic 99.63650 Iris 99.10989 Heart Disease 99.31627 Loan Default 97.96728 dtype: float64 14. nlargest、nsmallest 有时我们不仅想要列的最小值/最大值还想看变量的前 N 个或 ~(top N) 个值。这时nlargest和nsmallest就派上用场了。 diamonds.nlargest(5, price) 15. idmax、idxmin 我们用列轴使用max或min时pandas 会返回最大/最小的值。但我现在不需要具体的值了我需要这个最大值的位置。因为很多时候要锁定位置之后对整个行进行操作比如单提出来或者删除等所以这种需求还是很常见的。 使用idxmax和idxmin即可解决。 diamonds.price.idxmax() 27749 diamonds.carat.idxmin() 14 16. value_counts 在数据探索的时候value_counts是使用很频繁的函数它默认是不统计空值的但空值往往也是我们很关心的。如果想统计空值可以将参数dropna设置为False。 ames_housing pd.read_csv(data/train.csv) ames_housing[FireplaceQu].value_counts(dropnaFalse, normalizeTrue)NaN 0.47260 Gd 0.26027 TA 0.21438 Fa 0.02260 Ex 0.01644 Po 0.01370 Name: FireplaceQu, dtype: float64 17. clip 异常值检测是数据分析中常见的操作。使用clip函数可以很容易地找到变量范围之外的异常值并替换它们。 age.clip(50, 60) 18. at_time、between_time 在有时间粒度比较细的时候这两个函数超级有用。因为它们可以进行更细化的操作比如筛选某个时点或者某个范围时间等可以细化到小时分钟。 data.at_time(15:00) from datetime import datetimedata.between_time(09:45, 12:00) 19. hasnans pandas提供了一种快速方法hasnans来检查给定series是否包含空值。 series pd.Series([2, 4, 6, sadf, np.nan]) series.hasnans True 该方法只适用于series的结构。 20. GroupBy.nth 此功能仅适用于GroupBy对象。具体来说分组后nth返回每组的第n行 diamonds.groupby(cut).nth(5)
http://www.sadfv.cn/news/103324/

相关文章:

  • 旅游网站建设的摘要化工企业网站模板 aspx
  • 网站建设报告书范文用什么做网站更快捷方便
  • 石家庄做网站网络公司wordpress下载tar.gz
  • 网站登录系统做网站公司在丹麦
  • 网站建设与管理 教材seo教学培训
  • 揭阳 网站建设网站备案和域名解析
  • seo爱站网天津全包圆装修公司电话
  • 新兴县建设局网站网站空间怎么使用
  • 网页与网站设计什么是抖动wordpress移动端标签
  • 四川建设工程网站滕州 网站 建设
  • 网站编程电子书广州编程课程培训机构排名
  • 长沙房地产网站建设濮阳武志勇
  • 吉林网站建设吉林中国企业网控股有限公司
  • 怎么样才能搜索到自己做的网站做网站要学什么c语言
  • 网站赚钱的方式做网络推广的方法
  • 网站建设需求分析报告功能温州公司建设网站制作
  • 境外电商网站建设百度关键词收录排名
  • 电子产品商务网站模板上海的广告公司有哪些
  • 网站建站网站怎么样汕头建设银行各支行电话
  • 网站建设网络推广方案ppt购买天猫店铺去哪个平台
  • 做公司网站要多少钱九江网站建设九江
  • 襄阳市建设厅官方网站如何自学广告设计
  • 查大学专业网站合肥建设网官方网站
  • 网站建设的题目推荐一个做淘客网站
  • 学校网站建设需要注意什么青海网站建设推广
  • 贵阳seo网站推广优化网页制作三剑客软件
  • 公司网站创建网站建设ftp软件
  • 怎样把网站做的高大上网页站点
  • 微信营销工具seo关键词优化要多少钱
  • 怎么做网站的seo排名知乎哪个网站做农产品