如何使用 XPath 表达式过滤子标签并提取文本内容?

ID:20318 / 打印

如何使用 xpath 表达式过滤子标签并提取文本内容?

过滤子标签中的特定标签获取文本内容

问题描述:

如何使用 xpath 表达式从包含多个子标签的标签中提取文本内容,同时排除特定子标签?

尝试过的解决方法:

已尝试使用以下 xpath 表达式,但均无法解决问题:

  • xpath('//p/*[@name != "a"]')
  • xpath('//p/[@name != "a"]')
  • xpath('//p/*[@name != "a"]')

样本内容:

<div>   <p>     <a>123</a>     这是要获取的文本   </p> </div>

目标:

需要获取 div 中 p 标签的文本内容,但需要过滤掉 a 标签。

解决方法:

问题已解决,正确的 xpath 表达式为:

li.xpath('p')[0].xpath('string(.)')
上一篇: 如何使用 XPath 从 HTML 文档中提取标签文本并过滤掉特定子标签?
下一篇: Python 类中链式调用为何导致 ID 改变?

作者:admin @ 24资源网   2025-01-14

本站所有软件、源码、文章均有网友提供,如有侵权联系308410122@qq.com

与本文相关文章

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。