逻辑回归在 Python 中的实战指南82



逻辑回归是一种强大的机器学习算法,广泛用于二分类问题。它将特征输入映射到概率值,从而预测给定输入属于某一特定类的可能性。本指南将逐步指导你使用 Python 中的 scikit-learn 库实现逻辑回归。

安装 scikit-learn

要开始使用逻辑回归,首先需要安装 scikit-learn 库。你可以使用 pip 安装命令:```
pip install scikit-learn
```

导入库

现在,导入必要的 scikit-learn 模块和 Numpy:```python
import numpy as np
from sklearn.linear_model import LogisticRegression
```

加载数据集

要训练逻辑回归模型,你需要一个数据集。你可以使用 scikit-learn 提供的示例数据集,例如鸢尾花数据集:```python
from import load_iris
iris = load_iris()
X =
y =
```

特征缩放

在训练模型之前,通常建议对特征进行缩放,以确保它们具有相似的尺度。这可以提高训练效率。```python
from import StandardScaler
scaler = StandardScaler()
X = scaler.fit_transform(X)
```

划分训练和测试集

现在,将数据集划分为训练集和测试集。训练集用于训练模型,测试集用于评估模型的性能。```python
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=42)
```

训练模型

使用 LogisticRegression 类创建逻辑回归模型。你可以指定正则化参数 C 来控制模型的复杂性。```python
model = LogisticRegression(C=1)
(X_train, y_train)
```

评估模型

使用测试集评估模型的准确性。你可以使用 scikit-learn 的 accuracy_score 函数计算分类准确率。```python
from import accuracy_score
y_pred = (X_test)
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)
```

超参数调整

你可以通过调整正则化参数 C 来优化模型性能。较小的 C 值会导致更复杂的模型,而较大的 C 值会导致更简单的模型。可以通过网格搜索来找到最佳 C 值。```python
from sklearn.model_selection import GridSearchCV
param_grid = {'C': [0.1, 1, 10]}
grid_search = GridSearchCV(LogisticRegression(), param_grid, cv=5)
(X_train, y_train)
print("Best parameters:", grid_search.best_params_)
```

预测新数据

一旦训练了模型,你就可以使用 predict 方法对新数据进行预测。```python
new_data = ([[5.1, 3.5, 1.4, 0.2]])
y_pred = (new_data)
print("Predicted class:", y_pred)
```

本指南演示了在 Python 中使用 scikit-learn 库实现逻辑回归的逐步过程。通过遵循这些步骤,你可以构建一个逻辑回归模型,对其进行评估并对其超参数进行优化。逻辑回归是一个强大的二分类算法,可以用于广泛的机器学习应用中。

2024-10-14


上一篇:Python 函数拟合:理解和实施指南

下一篇:Python 经典代码:提升您编程技能的 10 个示例