One - One Code All

Blog Content

python中pandas之drop_duplicates去除重复项

Python 统计学-科学计算   2011-07-16 09:05:27

方法
DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)

参数
这个drop_duplicate方法是对DataFrame格式的数据,去除特定列下面的重复行。返回DataFrame格式的数据。

subset : column label or sequence of labels, optional
用来指定特定的列,默认所有列

keep : {‘first’, ‘last’, False}, default ‘first’
删除重复项并保留第一次出现的项

inplace : boolean, default False
是直接在原来数据上修改还是保留一个副本


上一篇:python将dict字典转化为dataframe数据框
下一篇:pandas的to_csv()使用方法

The minute you think of giving up, think of the reason why you held on so long.