JAVA操作XML文档主要有四种方式,分别是DOM、SAX、JDOM和DOM4J,DOM和SAX是官方提供的,而JDOM和DOM4J则是引用第三方库的,其中用的最多的是DOM4J方式。
运行效率和内存使用方面最优的是SAX,但是由于SAX是基于事件的方式,所以SAX无法在编写XML的过程中对已编写内容进行修改,但对于不用进行频繁修改的需求,还是应该选择使用SAX。
下面基于这四种方式来读取XML文件。
第一,以DOM的方式实现。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
package xmls;
import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;
import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import java.io.File;
import java.io.IOException;
/**
* Created by lenovo on 2017-6-3.
*/
public class DOMReadDemo {
public static void main(String[] args){
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
try{
DocumentBuilder db = dbf.newDocumentBuilder();
Document document = db.parse("src/xmls/DOM.xml");
NodeList booklist = document.getElementsByTagName("book");
for(int i = 0; i < booklist.getLength(); i++){
System.out.println("--------第" + (i+1) + "本书----------");
Element ele = (Element) booklist.item(i);
NodeList childNodes= ele.getChildNodes();
for(int j = 0; j < childNodes.getLength(); j++){
Node n = childNodes.item(j);
if(n.getNodeName() != "#text"){
System.out.println(n.getNodeName() + ":" + n.getTextContent());
}
}
System.out.println("---------------------------------");
}
}catch (ParserConfigurationException e){
e.printStackTrace();
}catch (IOException e){
e.printStackTrace();
}catch (SAXException e){
e.printStackTrace();
}
}
}
第二,以SAX的方式实现。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
package xmls;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
/**
* Created by lenovo on 2017-6-1.
*/
public class xmlTest2 {
public static void main(String[] args){
SAXParserFactory spf = SAXParserFactory.newInstance();
try{
SAXParser sp = spf.newSAXParser();
SAXParserHandler handler = new SAXParserHandler();
sp.parse("src\\xmls\\book.xml", handler);
}catch (Exception e){
e.printStackTrace();
}
}
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
package xmls;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
/**
* Created by lenovo on 2017-6-1.
*/
public class SAXParserHandler extends DefaultHandler {
@Override
public void startDocument() throws SAXException {
super.startDocument();
System.out.println("SAX解析开始");
}
@Override
public void endDocument() throws SAXException {
super.endDocument();
System.out.println("SAX解析结束");
}
@Override
public void startElement(String s, String s1, String s2, Attributes attributes) throws SAXException {
super.startElement(s, s1, s2, attributes);
System.out.println(s2);
for(int i = 0; i < attributes.getLength(); i++){
String name = attributes.getQName(i);
String value = attributes.getValue(name);
System.out.println("属性值:" + name + "=" + value);
}
}
@Override
public void endElement(String s, String s1, String s2) throws SAXException {
super.endElement(s, s1, s2);
if(s2.equals("book")){
System.out.println("-----------------------");
}
}
@Override
public void characters(char[] ch, int start, int length) throws SAXException {
super.characters(ch, start, length);
String value = new String(ch, start, length);
if(value.trim().equals("")){
return;
}
System.out.println(value);
}
}
Java 解析xml中参数解释-localName和qName
https://blog.csdn.net/django100/article/details/12707317
订阅专栏
1. xml中的localName和QName
xmlns:sina="http://www.sina.com" xmlns:baidu="http://www.baidu.com">
Namespace(空间名称,命名空间)
引入的原因是为了避免混淆。例如上面的这个XML文档,sina和baidu都有blog属性,定义了两个namespace,就像sax官网说的,用namespace是为了实现更多的扩展功能,作为基本应用,很多时候都用不到它:
sina的namespace: http://www.sina.com
baidu的namespace:http://www.baidu.com
xmlns:sina="http://www.sina.com"
xmlns:baidu="http://www.baidu.com">
namespace的值可以任意,但是注意不要重复。一般默认的格式都是以url来作为namespace,比如 xmlns:android="http://schemas.android.com/apk/res/android。
Prefix(前缀)
sina:blog中 sina 就是前缀。
LocalName(本地名称)
sina:blog 中 blog就是localName。
QName(Qualified Name)
sina:blog就是QName,相当于前缀+":"+LocalName。
uri(不是url哈)
例如sina:blog的uri就是前缀sina的namespace,即"http://www.sina.com"。
2.sax解析localName与qName
sax simple API for XML,现在有两个版本,sax和sax2。
sax不支持LocalName、QName和uri。对于属性sina:blog="blog.sina.com",sax解析的结果是LocalName=QName="sina:blog",uri="",value="blog.sina.com"。
sax2支持LocalName、QName、uri。对于属性sina:blog="blog.sina.com",sax2解析的结果是LocalName="blog",QName="sina:blog",uri="",value="blog.sina.com"。
_______________________________________________________________________________________________________________________________________________________________________
测试:
TestSax.java
package com.siqi.xml;
import java.io.File;
import java.io.FileReader;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import org.xml.sax.InputSource;
import org.xml.sax.XMLReader;
import org.xml.sax.helpers.XMLReaderFactory;
public class TestSax {
public static void main(String... args) {
try {
//Sax2解析XML文档
System.out.println("parse xml file use sax2");
SaxParseHandler sax2Handler = new SaxParseHandler();
XMLReader xmlReader = XMLReaderFactory.createXMLReader();
xmlReader.setContentHandler(sax2Handler);
xmlReader.setErrorHandler(sax2Handler);
FileReader fileReader = new FileReader("./src/sample.xml");
xmlReader.parse(new InputSource(fileReader));
//sax1解析XML文档
System.out.println("parse xml file use sax");
SaxParseHandler saxHandler = new SaxParseHandler();
SAXParser parser = SAXParserFactory.newInstance().newSAXParser();
File file = new File("./src/sample.xml");
parser.parse(file, saxHandler);
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}__________________________________________________________________________________________________________________________________________________________________________
SaxParseHandler.java
package com.siqi.xml;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;
/**
* 要用sax解析,需要实现一个ParseHandler
* @author siqi
*
*/
public class SaxParseHandler extends DefaultHandler{
/**
* 重写了DefaultHandler中的startElement函数,每解析到
* 一个元素(element)的时候都会触发这个函数,并且将这个element
* 的属性attributes和值value当作参数传进来。除了startElement,
* 还有startDocument,endDOucment,endElement,要根据需要
* 重写这些函数。
*/
@Override
public void startElement(String uri, String localName, String qName,
Attributes attributes) throws SAXException {
//打印element的基本信息,qName
System.out.println("Element qName : "+qName);
System.out.println("Element localName: "+localName);
System.out.println("Element uri : "+uri);
//打印element的所有属性attributes
for(int i=0; i System.out.println(""); System.out.println(" attribute qName : "+attributes.getQName(i)); System.out.println(" attribute localName: "+attributes.getLocalName(i)); System.out.println(" attribute value : "+attributes.getValue(i)); System.out.println(" attribute uri : "+attributes.getURI(i)); } System.out.println(""); super.startElement(uri, localName, qName, attributes); } } sample.xml的内容最上面那个xml 执行结果: parse xml file use sax2 Element qName : websites Element localName: websites Element uri : Element qName : sina:website Element localName: website Element uri : http://www.sina.com attribute qName : sina:blog attribute localName: blog attribute value : blog.sina.com attribute uri : http://www.sina.com Element qName : baidu:website Element localName: website Element uri : http://www.baidu.com attribute qName : baidu:blog attribute localName: blog attribute value : hi.baidu.com attribute uri : http://www.baidu.com parse xml file use sax Element qName : websites Element localName: Element uri : attribute qName : xmlns:sina attribute localName: xmlns:sina attribute value : http://www.sina.com attribute uri : attribute qName : xmlns:baidu attribute localName: xmlns:baidu attribute value : http://www.baidu.com attribute uri : Element qName : sina:website Element localName: Element uri : attribute qName : sina:blog attribute localName: sina:blog attribute value : blog.sina.com attribute uri : Element qName : baidu:website Element localName: Element uri : attribute qName : baidu:blog attribute localName: baidu:blog attribute value : hi.baidu.com attribute uri : 对于sax2,正确的解析出了qName,LocalName和uri。sax不能识别出前缀和uri,qName=localName。 第三,以JDOM的方式实现。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 package xmls; import org.jdom2.Attribute; import org.jdom2.Document; import org.jdom2.Element; import org.jdom2.JDOMException; import org.jdom2.input.JDOMParseException; import org.jdom2.input.SAXBuilder; import java.io.*; import java.util.List; /** * Created by lenovo on 2017-6-2. */ public class JDOMTest { public static void main(String[] args){ SAXBuilder saxBuilder = new SAXBuilder(); InputStream in; try{ in = new FileInputStream(new File("src\\xmls\\book.xml")); Document document = saxBuilder.build(in); Element rootElement = document.getRootElement(); List for(Element book: bookList){ System.out.println("第" + (bookList.indexOf(book)+1) + "本书!"); List for(Attribute attr: attrs){ System.out.println(attr.getName() + "=" + attr.getValue()); } for(Element item: book.getChildren()){ System.out.println(item.getName() + ":" + item.getValue()); } System.out.println("------------------------------------"); } }catch (FileNotFoundException e){ e.printStackTrace(); }catch (JDOMException e){ e.printStackTrace(); }catch (IOException e){ e.printStackTrace(); } } } 第四,以DOM4J的方式实现。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 package xmls; import org.dom4j.*; import org.dom4j.io.OutputFormat; import org.dom4j.io.SAXReader; import org.dom4j.io.XMLWriter; import java.io.File; import java.io.FileOutputStream; import java.io.IOException; import java.util.Iterator; import java.util.List; /** * Created by lenovo on 2017-6-2. */ public class DOM4JTest { public void parseXML(){ SAXReader saxReader = new SAXReader(); try{ Document document = saxReader.read(new File("src\\xmls\\book.xml")); Element rootElement = document.getRootElement(); Iterator it = rootElement.elementIterator(); while (it.hasNext()){ Element book = (Element)it.next(); List for(Attribute attr: attrs){ System.out.println("属性名:" + attr.getName() + "---- 属性值:" + attr.getValue() ); } Iterator cit = book.elementIterator(); while (cit.hasNext()){ Element child = (Element) cit.next(); System.out.println("子节点:" + child.getName()); } } }catch (DocumentException e){ e.printStackTrace(); } } public static void main(String[] args){ DOM4JTest dom4JTest = new DOM4JTest(); dom4JTest.parseXML(); } } 以上这篇java读取XML文件的四种方法总结(必看篇)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。