家豪教學網 python 正規化表示式

正規化表達式（Regular Expressions，簡稱 regex 或 regexp）是一種強大的搜尋和匹配字符串的工具。正規化表達式通常用於檢索、替換、拆分字符串，以及匹配特定的模式。使用時必須 import re，以下是一些正規化表達式的基本規則和元字符：

普通字符：
.（句點）：
^：
$：
*：
+：
?：
{n}：
{n,}：
{n,m}：
[]：
[^]：
|：
`()：
\：

這只是正規化表達式的一些基本元字符和規則。正規化表達式還有更多高級的功能和概念，例如非貪婪匹配、反向引用等。如果需要深入了解，建議查閱正規化表達式的相關資源或教程。

範例說明：
import re

. 匹配任意字符（除了換行符 \n）。

& 匹配字符串的開頭。

$ 匹配字符串的結尾。

* 匹配前一個字符零次或多次。

+ 匹配前一個字符一次或多次。

? 匹配前一個字符零次或一次。

{n} 匹配前一個字符恰好 n 次。

{m,n} 匹配前一個字符至少 m 次，最多 n 次。

[] 字符集，匹配方括號中的任意一個字符。

[^] 否定字符集，匹配除了方括號中的任意一個字符之外的字符。

| 或，匹配左右兩邊的任意一個模式。

() 分組，將模式分組，形成子模式。

\ 轉義字符，用於匹配一些特殊字符，例如 \. 匹配實際的句點。

非貪婪匹配（Non-Greedy Matching）：
在正規表達式中，一般的匹配模式是貪婪的，即它會匹配盡可能多的字符。但有時我們可能希望匹配盡可能少的字符，這時就需要使用非貪婪匹配。在正規表達式中，非貪婪匹配使用 ? 修飾符。

範例：
使用貪婪匹配的表達式：
import re
pattern_greedy = re.compile(r'<.*>')
match_greedy = pattern_greedy.search("<tag1>content1</tag1><tag2>content2</tag2>")
print(match_greedy.group()) # Output: <tag1>content1</tag1><tag2>content2</tag2>，如此得到整個字串

使用非貪婪匹配的表達式：
import re
pattern_non_greedy = re.compile(r'<.*?>')
match_non_greedy = pattern_non_greedy.search("<tag1>content1</tag1><tag2>content2</tag2>")
print(match_non_greedy.group()) # Output: <tag1>，只得到 <tag1>

反向引用（Backreference）：
反向引用是指在正規表達式中使用先前匹配的結果來進行進一步的匹配。在正規表達式中，使用圓括號 () 括起來的部分表示一個分組，這些分組可以在後面的表達式中被引用。

範例：
import re
pattern_backreference = re.compile(r'(\w+) is \1')
match_backreference = pattern_backreference.search("word is word, python is python, regex is regex")
print(match_backreference.group()) # Output: word is word