Python Pandas 数据框高效删除数据：方法、技巧与性能优化360

在Python数据分析中，Pandas库是不可或缺的一部分。Pandas的数据框(DataFrame)提供了强大的数据处理能力，但经常需要进行数据清理和预处理，其中删除数据是常见且重要的步骤。本文将深入探讨Python Pandas中删除DataFrame数据的各种方法，包括按行、按列、按条件删除，并着重讲解如何提高删除数据的效率，避免一些常见的陷阱。

一、按索引删除数据

这是最直接的删除方法，通过指定行索引或列索引来删除数据。可以使用drop()函数实现。
删除行：

import pandas as pd
data = {'col1': [1, 2, 3, 4, 5], 'col2': [6, 7, 8, 9, 10]}
df = (data)
# 删除索引为2的行
df = (index=2)
print(df)
# 删除多行，使用列表指定索引
df = (index=[0, 3])
print(df)

删除列：

import pandas as pd
data = {'col1': [1, 2, 3, 4, 5], 'col2': [6, 7, 8, 9, 10], 'col3':[11,12,13,14,15]}
df = (data)
# 删除名为'col2'的列
df = (columns=['col2'])
print(df)
# 删除多列，使用列表指定列名
df = (columns=['col1', 'col3'])
print(df)

注意：drop()函数默认不会修改原始DataFrame，而是返回一个新的DataFrame。如果要修改原始DataFrame，需要使用inplace=True参数。
(index=2, inplace=True)

二、按条件删除数据

这是更灵活的删除方式，根据指定的条件选择需要删除的行。可以使用布尔索引或query()函数。
布尔索引：

import pandas as pd
data = {'col1': [1, 2, 3, 4, 5], 'col2': [6, 7, 8, 9, 10]}
df = (data)
# 删除col1中值大于2的行
df = df[df['col1'] = 8) | (df['col1']

2025-05-25

上一篇：Python中的频响函数：原理、实现与应用

下一篇：Python数据雷达图绘制指南：从基础到高级应用