Python Pandas 数据框高效删除数据:方法、技巧与性能优化360


在Python数据分析中,Pandas库是不可或缺的一部分。Pandas的数据框(DataFrame)提供了强大的数据处理能力,但经常需要进行数据清理和预处理,其中删除数据是常见且重要的步骤。本文将深入探讨Python Pandas中删除DataFrame数据的各种方法,包括按行、按列、按条件删除,并着重讲解如何提高删除数据的效率,避免一些常见的陷阱。

一、按索引删除数据

这是最直接的删除方法,通过指定行索引或列索引来删除数据。可以使用drop()函数实现。
删除行:


import pandas as pd
data = {'col1': [1, 2, 3, 4, 5], 'col2': [6, 7, 8, 9, 10]}
df = (data)
# 删除索引为2的行
df = (index=2)
print(df)
# 删除多行,使用列表指定索引
df = (index=[0, 3])
print(df)


删除列:


import pandas as pd
data = {'col1': [1, 2, 3, 4, 5], 'col2': [6, 7, 8, 9, 10], 'col3':[11,12,13,14,15]}
df = (data)
# 删除名为'col2'的列
df = (columns=['col2'])
print(df)
# 删除多列,使用列表指定列名
df = (columns=['col1', 'col3'])
print(df)

注意:drop()函数默认不会修改原始DataFrame,而是返回一个新的DataFrame。如果要修改原始DataFrame,需要使用inplace=True参数。
(index=2, inplace=True)


二、按条件删除数据

这是更灵活的删除方式,根据指定的条件选择需要删除的行。可以使用布尔索引或query()函数。
布尔索引:


import pandas as pd
data = {'col1': [1, 2, 3, 4, 5], 'col2': [6, 7, 8, 9, 10]}
df = (data)
# 删除col1中值大于2的行
df = df[df['col1'] = 8) | (df['col1']

2025-05-25


上一篇:Python中的频响函数:原理、实现与应用

下一篇:Python数据雷达图绘制指南:从基础到高级应用