Python 从 CSV 文件中导入数据98


CSV(逗号分隔值)文件是一种存储数据的简单而流行的文件格式。它广泛用于数据交换,因为它是人类和机器可读的。在 Python 中,我们可以使用便捷的库轻松地从 CSV 文件中导入数据。

使用 Pandas 导入 CSV 文件

Pandas 是用于数据操纵和分析的强大 Python 库。它提供了 read_csv() 函数来导入 CSV 文件。该函数接受文件路径并返回一个 DataFrame 对象,该对象表示 CSV 文件中的数据。```
import pandas as pd
# 从 CSV 文件读取数据
data = pd.read_csv('')
# 输出 DataFrame 的前 5 行
print(())
```

设置文件选项

我们可以使用 read_csv() 函数的各种参数来配置文件的读取方式。例如,我们可以指定分隔符、编码和缺失值处理:```
data = pd.read_csv('', sep=';', encoding='utf-8', na_values=['NA'])
```

预处理数据

在从 CSV 文件导入数据后,我们可能需要对其进行预处理以使其更适合我们的目的。这可以包括删除重复项、处理缺失值以及将字符串转换为数字。```
# 删除重复项
data = data.drop_duplicates()
# 填充缺失值
(0, inplace=True)
# 将字符串转换为数字
data['age'] = pd.to_numeric(data['age'])
```

更多选项

read_csv() 函数还提供了其他高级选项,例如从多个文件导入数据、跳过不必要的数据行、设置类型推断以及自定义解析器。有关更详细的信息,请参阅 Pandas 文档。

使用 NumPy 导入 CSV 文件

NumPy 是 Python 中用于科学计算的另一个库。它提供了 genfromtxt() 函数来导入 CSV 文件,该文件返回一个包含数据值的数组。```
import numpy as np
# 从 CSV 文件读取数据
data = ('', delimiter=',')
# 输出数组的前 5 行
print(data[:5])
```

Python 提供了灵活而强大的工具,可以轻松高效地从 CSV 文件中导入数据。无论是使用 Pandas 还是 NumPy,我们都可以充分利用其高级选项来预处理数据并满足我们的特定需求。通过利用这些库,我们可以轻松地将 CSV 文件中的数据集成到我们的 Python 程序和分析中。

2024-10-16


上一篇:Python 中截取指定字符串的全面指南

下一篇:将 Python 列表转换为字符串