系统城装机大师 - 固镇县祥瑞电脑科技销售部宣传站!

当前位置:首页 > 脚本中心 > python > 详细页面

Python3 xml.etree.ElementTree支持的XPath语法详解

时间:2020-03-06来源:电脑系统城作者:电脑系统城

xml.etree.ElementTree可以通过支持的有限的XPath表达式来定位元素。

语法

ElementTree支持的语法如下:

 

语法 说明
tag 查找所有具有指定名称tag的子元素。例如:country表示所有名为country的元素,country/rank表示所有名为country的元素下名为rank的元素。
* 查找所有元素。如:*/rank表示所有名为rank的孙子元素。
. 选择当前元素。在xpath表达式开头使用,表示相对路径。
// 选择当前元素下所有级别的所有子元素。xpath不能以“//”开头。
.. 选择父元素。如果视图达到起始元素的祖先,则返回None(或空列表)。起始元素为调用find(或findall)的元素。
[@attrib] 选择具有指定属性attrib的所有子元素。
[@attrib='value'] 选择指定属性attrib具有指定值value的元素,该值不能包含引号。
[tag] 选择所有具有名为tag的子元素的元素。
[.='text'] Python3.7+,选择元素(或其子元素)完整文本内容为指定的值text的元素。
[tag='text'] 选择元素(或其子元素)名为tag,完整文本内容为指定的值text的元素。
[position] 选择位于给定位置的所有元素,position可以是以1为起始的整数、表达式last()或相对于最后一个位置的位置(如:last()-1)

 

方括号表达式前面必须有标签名、星号或者其他方括号表达式。position前必须有一个标签名。

简单示例


 
  1. #!/usr/bin/python
  2. # -*- coding:utf-8 -*-
  3. import os
  4. import xml.etree.cElementTree as ET
  5. xml_string="""<?xml version="1.0"?>
  6. <data>
  7. <country name="Liechtenstein">
  8. <rank updated="yes">2</rank>
  9. <year>2008</year>
  10. <gdppc>141100</gdppc>
  11. <neighbor name="Austria" direction="E"/>
  12. <neighbor name="Switzerland" direction="W"/>
  13. </country>
  14. <country name="Singapore">
  15. <rank updated="yes">5</rank>
  16. <year>2011</year>
  17. <gdppc>59900</gdppc>
  18. <neighbor name="Malaysia" direction="N"/>
  19. </country>
  20. <country name="Panama">
  21. <rank updated="yes">69</rank>
  22. <year>2011</year>
  23. <gdppc>2011</gdppc>
  24. <neighbor name="Costa Rica" direction="W"/>
  25. <neighbor name="Colombia" direction="E"/>
  26. </country>
  27. <country name="Washington">
  28. <rank updated="yes">55</rank>
  29. <gdppc>13600</gdppc>
  30. </country>
  31. </data>
  32. """
  33. root=ET.fromstring(xml_string)
  34. #查找data下所有名为country的元素
  35. for country in root.findall("country"):
  36. print("name:"+country.get("name"))
  37. #查找country下所有名为year的元素
  38. year=country.find("./year")
  39. if year:
  40. print("year:"+year.text)
  41. #查找名为neighbor的孙子元素
  42. for neighbor in root.findall("*/neighbor"):
  43. print("neighbor:"+neighbor.get("name"))
  44. #查找country下的所有子元素
  45. for ele in root.findall("country//"):
  46. print(ele.tag)
  47. #查找当前元素的父元素,结果为空
  48. print(root.findall(".."))
  49. #查找与名为rank的孙子元素同级的名为gdppc的元素
  50. for gdppc in root.findall("*/rank/../gdppc"):
  51. print("gdppc:"+gdppc.text)
  52. #查找data下所有具有name属性的子元素
  53. for country in root.findall("*[@name]"):
  54. print(country.get("name"))
  55. #查找neighbor下所有具有name属性的子元素
  56. for neighbor in root.findall("country/*[@name]"):
  57. print(neighbor.get("name"))
  58. #查找country下name属性值为Malaysia的子元素
  59. print("direction:"+root.find("country/*[@name='Malaysia']").get("direction"))
  60. #查找root下所有包含名为year的子元素的元素
  61. for country in root.findall("*[year]"):
  62. print("name:"+country.get("name"))
  63. #查找元素(或其子元素)文本内容为2011的元素(Python3.7+)
  64. #print(len(root.findall("*[.='2011']")))
  65. #查找元素(或其子元素)名为gdppc,文本内容为2011的元素
  66. for ele in root.findall("*[gdppc='2011']"):
  67. print(ele.get("name"))
  68. #查找第二个country元素
  69. print(root.find("country[2]").get("name"))

补充知识:python lxml etree xpath定位

etree全称:ElementTree 元素树

用法:


 
  1. import requests
  2. from lxml import etree
  3. response = requests.get('html')
  4. res = etree.HTML(response.text) #利用 etree.HTML 初始化网页内容
  5. resp = res.xpath('//span[@class="green"]/text()')

以上这篇Python3 xml.etree.ElementTree支持的XPath语法详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们。

分享到:

相关信息

系统教程栏目

栏目热门教程

人气教程排行

站长推荐

热门系统下载