视频1 视频21 视频41 视频61 视频文章1 视频文章21 视频文章41 视频文章61 推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37 推荐39 推荐41 推荐43 推荐45 推荐47 推荐49 关键词1 关键词101 关键词201 关键词301 关键词401 关键词501 关键词601 关键词701 关键词801 关键词901 关键词1001 关键词1101 关键词1201 关键词1301 关键词1401 关键词1501 关键词1601 关键词1701 关键词1801 关键词1901 视频扩展1 视频扩展6 视频扩展11 视频扩展16 文章1 文章201 文章401 文章601 文章801 文章1001 资讯1 资讯501 资讯1001 资讯1501 标签1 标签501 标签1001 关键词1 关键词501 关键词1001 关键词1501 专题2001
Python的pandas中常用函数的总结
2020-11-27 14:11:32 责编:小采
文档
 本篇文章给大家带来的内容是关于Python的pandas中常用函数的总结,有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。

pandas是python中的 一个数据处理库,同样在使用的时候我们要先输入import pandas as pd引入。

1.df = pd.read_csv("文件路径"):这是读取csv文件的方法,如果要读取excel或其他文档,都有相应的read函数。

2.df.dtypes:如果在文件中有字符型数据返回的是object。

3.df.head(n):将前n行数据显示出来,如果不传入参数则显示前5行数据。

4.df.tail(n):将后n行数据显示出来,如果不传入参数则显示后5行数据。

5.df.columns:以列表的形式显示数据表的列名。

6.df.shape:以元组的形式显示表中数据的行数和列数。

7.df.loc[n]:返回索引值为n的行。

8.df.loc[m][n]:返回索引值为m行n列的数据。

9.df.loc[m:n]:返回索引值为m到n的行。

10.df.loc[[m,n,k]]:返回索引值分别为m,n,k的行。

11.df["str"]:返回列名为str的这一列。

12.df.columns.tolist():将列名做成列表。

13.df["str"]*df["str"]:两列维度相同,则两列的对应位置相乘。

14.df.sort_values("str",inplace=True,ascending=False):将str一列按照降序排列,且得到的数据替换原数据。inplace表示是否用排序后的数据替代原数据,默认为False,也就是不替换。ascending表示排序的顺序,默认为True,也就是按照升序排列。

15.judge = pd.isnull(df["str"]):返回bool型值,str这一列的数据是空值返回True,不是空值返回False。

16.a["judge"]:返回judge为True,也就是缺失的数据,这时再调用len()函数即可求得缺失数据的个数。

17.df.pivot_table(index="a",values="b",aggfunc=np.mean):这是一个很重要的函数,将b求平均值,按照a的类别进行分类,第三个参数默认为求平均值。

18.df.loc[n,"str"]:定位到第n行,列名为str处的数据。

19.sort_res.reset_index(drop=True):将排序后的数据的编号也重新排列,drop指是否丢弃原数据。运行后的结果与14的图对比可以发现,编号已经重新排列了。

20.df.apply():这是在pandas中的自定义函数的使用方法,括号中传入函数名。

下载本文
显示全文
专题