Python高效处理Excel文件：读取、写入及数据操作287

Python凭借其强大的库和简洁的语法，成为处理Excel文件(xls, xlsx)的理想选择。本文将深入探讨如何使用Python高效地读取、写入和操作现有的Excel文件，涵盖常用的库和技巧，并提供实际案例，帮助你快速掌握Python在Excel数据处理方面的应用。

最常用的两个库是openpyxl和xlrd/xlwt。openpyxl能够读取和写入xlsx文件（Excel 2007及以后版本），而xlrd和xlwt主要用于处理xls文件（Excel 97-2003版本）。虽然xlrd和xlwt已经不再维护，但对于旧版Excel文件的处理仍然适用。对于新的项目，强烈建议使用openpyxl，因为它支持更多功能，并且具有更好的性能和维护。

安装必要的库

在开始之前，需要先安装必要的库。使用pip命令即可轻松安装：```bash
pip install openpyxl
# 对于xls文件，需要安装xlrd和xlwt
pip install xlrd xlwt
```

读取Excel文件

使用openpyxl读取Excel文件非常简单。以下代码演示了如何读取一个Excel文件并打印出所有单元格的值：```python
from openpyxl import load_workbook
def read_excel(filepath):
"""读取Excel文件并打印所有单元格的值"""
try:
workbook = load_workbook(filepath, data_only=True) # data_only=True 读取公式的结果, 而不是公式本身
sheet = # 获取活跃的工作表
for row in sheet.iter_rows():
for cell in row:
print(, end="\t")
print()
except FileNotFoundError:
print(f"Error: File not found at {filepath}")
except Exception as e:
print(f"An error occurred: {e}")
# 使用示例
filepath = "" # 替换为你的Excel文件路径
read_excel(filepath)
```

data_only=True参数非常重要，它确保读取的是单元格的计算结果，而不是公式本身。如果没有这个参数，你可能会看到公式而不是实际的值。

写入Excel文件

openpyxl同样简化了写入Excel文件的过程。以下代码演示了如何创建一个新的Excel文件并写入数据：```python
from openpyxl import Workbook
def write_excel(filepath, data):
"""创建并写入Excel文件"""
workbook = Workbook()
sheet =
for row in data:
(row)
(filepath)
# 使用示例
data = [
["Name", "Age", "City"],
["Alice", 25, "New York"],
["Bob", 30, "London"],
["Charlie", 28, "Paris"]
]
filepath = ""
write_excel(filepath, data)
```

更高级的操作：数据筛选和处理

除了基本的读写操作，openpyxl还支持更高级的操作，例如：
访问特定单元格：使用sheet['A1'].value访问A1单元格的值。
访问特定行或列：使用sheet[row]访问指定行，使用迭代所有列。
数据筛选：通过遍历单元格并设置条件来筛选数据。
数据处理：在读取数据后，可以使用Python强大的数据处理能力（例如pandas库）进行更复杂的分析和转换。
样式设置：可以设置单元格的字体、颜色、对齐方式等。

以下是一个使用pandas库进行数据处理的例子：```python
import pandas as pd
from openpyxl import load_workbook
filepath = ""
df = pd.read_excel(filepath)
# 数据处理示例：计算平均年龄
average_age = df['Age'].mean()
print(f"Average age: {average_age}")
# 数据筛选示例：筛选年龄大于28的人
filtered_df = df[df['Age'] > 28]
print(filtered_df)
# 将处理后的数据写入新的Excel文件
filtered_df.to_excel("", index=False)
```

这个例子展示了如何使用pandas读取Excel文件，计算平均年龄，筛选年龄大于28的人，并将结果写入新的Excel文件。pandas库提供了丰富的函数，可以进行各种数据操作，例如数据清洗、数据转换、数据分析等。

总而言之，Python结合openpyxl和pandas等库，可以高效地处理各种Excel文件。熟练掌握这些库和技巧，可以极大地提高你的数据处理效率，节省大量的时间和精力。记住根据你的需求选择合适的库，并注意处理潜在的错误。

2025-06-03

上一篇：Python N-gram模型详解及代码实现

下一篇：Python RNN 代码实例：从基础到进阶应用