Python正则表达式详解：字符串匹配、查找与替换42

Python 的正则表达式模块 re 提供了强大的文本处理能力，允许我们使用正则表达式来匹配、查找和替换字符串中的特定模式。正则表达式是一种强大的工具，可以用于各种文本处理任务，从简单的字符串查找替换到复杂的文本解析和数据提取。本文将深入探讨 Python 中正则表达式的使用方法，并通过丰富的示例代码帮助你掌握这一核心技能。

1. 导入 re 模块

在使用 Python 正则表达式之前，需要先导入 re 模块：import re

2. 正则表达式语法基础

正则表达式使用特殊字符和元字符来定义匹配模式。以下是一些常用的元字符：
.: 匹配任意单个字符（除了换行符）。
^: 匹配字符串的开头。
$: 匹配字符串的结尾。
*: 匹配前一个字符零次或多次。
+: 匹配前一个字符一次或多次。
?: 匹配前一个字符零次或一次。
{n}: 匹配前一个字符 n 次。
{n,}: 匹配前一个字符至少 n 次。
{n,m}: 匹配前一个字符 n 到 m 次。
[]: 匹配括号内任意一个字符。
[^...]: 匹配不在括号内的任意字符。
\d: 匹配数字 [0-9]。
\D: 匹配非数字。
\s: 匹配空白字符 (空格、制表符、换行符等)。
\S: 匹配非空白字符。
\w: 匹配单词字符 [a-zA-Z0-9_]。
\W: 匹配非单词字符。
|: 或操作，匹配多个表达式中的任意一个。
(): 分组，将多个字符组合成一个单元。

3. 常用正则表达式函数

re 模块提供了多个函数来操作正则表达式：
(pattern, string): 从字符串开头匹配。
(pattern, string): 在字符串中搜索匹配。
(pattern, string): 查找所有匹配项并返回列表。
(pattern, string): 查找所有匹配项并返回迭代器。
(pattern, repl, string): 替换匹配项。
(pattern, string): 根据匹配项分割字符串。
(pattern): 编译正则表达式，提高效率。

4. 示例代码

以下是一些示例代码，展示了如何使用这些函数：import re
text = "My phone number is 123-456-7890 and email is test@"
# 匹配电话号码
phone_pattern = r"\d{3}-\d{3}-\d{4}"
match = (phone_pattern, text)
if match:
print("Phone number:", (0))
# 查找所有数字
numbers = (r"\d+", text)
print("Numbers:", numbers)
# 替换邮箱地址
new_text = (r"\w+@\w+\.\w+", "your_email@", text)
print("New text:", new_text)
# 分割字符串
parts = (r" and ", text)
print("Parts:", parts)
# 编译正则表达式
pattern = (r"\w+")
matches = (text)
print("Matches:", matches)

5. 更高级的用法：分组和命名分组

使用圆括号 () 可以创建分组，捕获匹配的子字符串。命名分组使用 (?P...) 的语法，可以方便地访问匹配结果。import re
text = "My name is John Doe, and I am 30 years old."
pattern = r"(?P\w+\s\w+), and I am (?P\d+) years old\."
match = (pattern, text)
if match:
print("Name:", ("name"))
print("Age:", ("age"))

6. 处理特殊字符

在正则表达式中，一些字符具有特殊含义，如果需要匹配这些字符本身，需要使用反斜杠 \ 进行转义。例如，匹配点号 `.` 需要使用 `\.`。

7. 贪婪匹配与非贪婪匹配

默认情况下，正则表达式是贪婪匹配的，即匹配尽可能多的字符。可以使用 ? 来实现非贪婪匹配。import re
text = "

Subtitle

"
# 贪婪匹配
greedy_match = (r"

", text)
print("Greedy match:", greedy_match) # Output: ['

Subtitle

']
# 非贪婪匹配
non_greedy_match = (r"

.*?

", text)
print("Non-greedy match:", non_greedy_match) # Output: ['

Subtitle