当前位置：首页 > 脚本中心 > python > 详细页面

python 截取XML中bndbox的坐标中的图像,另存为jpg的实例

时间：2020-03-10来源：电脑系统城作者：电脑系统城

文件目录

Annotations中是XML文件。

JPEGImages中是对应的JPG文件

XML文件

python 截取XML中bndbox的坐标中的图像,另存为jpg的实例

要截取bndbox坐标中的内容。

python代码

补充知识：python读取XML中bndbox和object name的方法

直接贴代码了，封装为了函数，直接调用即可。其中有几个点需要注意。

1、bndbox下面有4个子对象，因此不能直接使用firstChild来找到内容，需要从该对象里面继续寻找标签为xmin等这样的对象，注意要加[0]才正确，有问题的可以直接调试，然后看变量的结构，根据变量的结构来调用某一对象。

2、将空格' '替换为'_'，方便命名。但是使用str.replace(' ', '_')不会直接改变str的内容，返回的字符串是改变后的，因此需要变量保存。

import xml.dom.minidom as xmldom
def get_bndboxfromxml(imageNum, xmlfilebasepath):
# 读取xml文件
bndbox = [0, 0, 0, 0]
xmlfilepath = xmlfilebasepath + "\%06d" % imageNum+'.xml'
# print(xmlfilepath)
domobj = xmldom.parse(xmlfilepath)
elementobj = domobj.documentElement
sub_element_obj = elementobj.getElementsByTagName('bndbox')
if sub_element_obj is not None:
bndbox[0] = int(sub_element_obj[0].getElementsByTagName('xmin')[0].firstChild.data)
bndbox[1] = int(sub_element_obj[0].getElementsByTagName('ymin')[0].firstChild.data)
bndbox[2] = int(sub_element_obj[0].getElementsByTagName('xmax')[0].firstChild.data)
bndbox[3] = int(sub_element_obj[0].getElementsByTagName('ymax')[0].firstChild.data)
return bndbox
def get_bndboxnamefromxml(imageNum, xmlfilebasepath):
bndbox = [0, 0, 0, 0]
xmlfilepath = xmlfilebasepath + "\%06d" % imageNum + '.xml'
domobj = xmldom.parse(xmlfilepath)
elementobj = domobj.documentElement
sub_element_obj = elementobj.getElementsByTagName('name')
name = sub_element_obj[0].firstChild.data.replace(' ', '_')
return name