逻辑回归在 Python 中的实战指南82

逻辑回归是一种强大的机器学习算法，广泛用于二分类问题。它将特征输入映射到概率值，从而预测给定输入属于某一特定类的可能性。本指南将逐步指导你使用 Python 中的 scikit-learn 库实现逻辑回归。

安装 scikit-learn

要开始使用逻辑回归，首先需要安装 scikit-learn 库。你可以使用 pip 安装命令：```
pip install scikit-learn
```

导入库

现在，导入必要的 scikit-learn 模块和 Numpy：```python
import numpy as np
from sklearn.linear_model import LogisticRegression
```

加载数据集

要训练逻辑回归模型，你需要一个数据集。你可以使用 scikit-learn 提供的示例数据集，例如鸢尾花数据集：```python
from import load_iris
iris = load_iris()
X =
y =
```

特征缩放

在训练模型之前，通常建议对特征进行缩放，以确保它们具有相似的尺度。这可以提高训练效率。```python
from import StandardScaler
scaler = StandardScaler()
X = scaler.fit_transform(X)
```

划分训练和测试集

现在，将数据集划分为训练集和测试集。训练集用于训练模型，测试集用于评估模型的性能。```python
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=42)
```

训练模型

使用 LogisticRegression 类创建逻辑回归模型。你可以指定正则化参数 C 来控制模型的复杂性。```python
model = LogisticRegression(C=1)
(X_train, y_train)
```

评估模型

使用测试集评估模型的准确性。你可以使用 scikit-learn 的 accuracy_score 函数计算分类准确率。```python
from import accuracy_score
y_pred = (X_test)
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)
```

超参数调整

你可以通过调整正则化参数 C 来优化模型性能。较小的 C 值会导致更复杂的模型，而较大的 C 值会导致更简单的模型。可以通过网格搜索来找到最佳 C 值。```python
from sklearn.model_selection import GridSearchCV
param_grid = {'C': [0.1, 1, 10]}
grid_search = GridSearchCV(LogisticRegression(), param_grid, cv=5)
(X_train, y_train)
print("Best parameters:", grid_search.best_params_)
```

预测新数据

一旦训练了模型，你就可以使用 predict 方法对新数据进行预测。```python
new_data = ([[5.1, 3.5, 1.4, 0.2]])
y_pred = (new_data)
print("Predicted class:", y_pred)
```

本指南演示了在 Python 中使用 scikit-learn 库实现逻辑回归的逐步过程。通过遵循这些步骤，你可以构建一个逻辑回归模型，对其进行评估并对其超参数进行优化。逻辑回归是一个强大的二分类算法，可以用于广泛的机器学习应用中。

2024-10-14

上一篇：Python 函数拟合：理解和实施指南

下一篇：Python 经典代码：提升您编程技能的 10 个示例