上一章中的Xpath函数,特别适用于在XML或HTML文档中定位和选择节点。如果要在更常见的文本中查找、匹配和提取字符串中符合特定模式的文本,我们可以使用正则表达式。正则表达式本质是一种特殊的文本模式,由一系列字符和元字符组成,用于描述和匹配文本中的模式,基于该模式可以灵活地查询和编辑文本。本章主要内容如下:
· 初识正则表达式
· 正则表达式进阶
· 使用正则表达式解析HTML网页
· 使用ChatGPT辅助编写正则表达式 72xEzxjY+H7FRmXs51k1enmk81YFMAWvauG3xjPpKSP9UV2j9SSYk0uMYwn+aVhr