java读取XML文件的四种方法总结(必看篇)

java读取XML文件的四种方法总结(必看篇)

JAVA操作XML文档主要有四种方式,分别是DOM、SAX、JDOM和DOM4J,DOM和SAX是官方提供的,而JDOM和DOM4J则是引用第三方库的,其中用的最多的是DOM4J方式。

运行效率和内存使用方面最优的是SAX,但是由于SAX是基于事件的方式,所以SAX无法在编写XML的过程中对已编写内容进行修改,但对于不用进行频繁修改的需求,还是应该选择使用SAX。

下面基于这四种方式来读取XML文件。

第一,以DOM的方式实现。

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

package xmls;

import org.w3c.dom.Document;

import org.w3c.dom.Element;

import org.w3c.dom.Node;

import org.w3c.dom.NodeList;

import org.xml.sax.SAXException;

import javax.xml.parsers.DocumentBuilder;

import javax.xml.parsers.DocumentBuilderFactory;

import javax.xml.parsers.ParserConfigurationException;

import java.io.File;

import java.io.IOException;

/**

* Created by lenovo on 2017-6-3.

*/

public class DOMReadDemo {

public static void main(String[] args){

DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();

try{

DocumentBuilder db = dbf.newDocumentBuilder();

Document document = db.parse("src/xmls/DOM.xml");

NodeList booklist = document.getElementsByTagName("book");

for(int i = 0; i < booklist.getLength(); i++){

System.out.println("--------第" + (i+1) + "本书----------");

Element ele = (Element) booklist.item(i);

NodeList childNodes= ele.getChildNodes();

for(int j = 0; j < childNodes.getLength(); j++){

Node n = childNodes.item(j);

if(n.getNodeName() != "#text"){

System.out.println(n.getNodeName() + ":" + n.getTextContent());

}

}

System.out.println("---------------------------------");

}

}catch (ParserConfigurationException e){

e.printStackTrace();

}catch (IOException e){

e.printStackTrace();

}catch (SAXException e){

e.printStackTrace();

}

}

}

第二,以SAX的方式实现。

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

package xmls;

import javax.xml.parsers.SAXParser;

import javax.xml.parsers.SAXParserFactory;

/**

* Created by lenovo on 2017-6-1.

*/

public class xmlTest2 {

public static void main(String[] args){

SAXParserFactory spf = SAXParserFactory.newInstance();

try{

SAXParser sp = spf.newSAXParser();

SAXParserHandler handler = new SAXParserHandler();

sp.parse("src\\xmls\\book.xml", handler);

}catch (Exception e){

e.printStackTrace();

}

}

}

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

package xmls;

import org.xml.sax.Attributes;

import org.xml.sax.SAXException;

import org.xml.sax.helpers.DefaultHandler;

/**

* Created by lenovo on 2017-6-1.

*/

public class SAXParserHandler extends DefaultHandler {

@Override

public void startDocument() throws SAXException {

super.startDocument();

System.out.println("SAX解析开始");

}

@Override

public void endDocument() throws SAXException {

super.endDocument();

System.out.println("SAX解析结束");

}

@Override

public void startElement(String s, String s1, String s2, Attributes attributes) throws SAXException {

super.startElement(s, s1, s2, attributes);

System.out.println(s2);

for(int i = 0; i < attributes.getLength(); i++){

String name = attributes.getQName(i);

String value = attributes.getValue(name);

System.out.println("属性值:" + name + "=" + value);

}

}

@Override

public void endElement(String s, String s1, String s2) throws SAXException {

super.endElement(s, s1, s2);

if(s2.equals("book")){

System.out.println("-----------------------");

}

}

@Override

public void characters(char[] ch, int start, int length) throws SAXException {

super.characters(ch, start, length);

String value = new String(ch, start, length);

if(value.trim().equals("")){

return;

}

System.out.println(value);

}

}

Java 解析xml中参数解释-localName和qName

https://blog.csdn.net/django100/article/details/12707317

订阅专栏

1. xml中的localName和QName

xmlns:sina="http://www.sina.com"

xmlns:baidu="http://www.baidu.com">

新浪

百度

Namespace(空间名称,命名空间)

引入的原因是为了避免混淆。例如上面的这个XML文档,sina和baidu都有blog属性,定义了两个namespace,就像sax官网说的,用namespace是为了实现更多的扩展功能,作为基本应用,很多时候都用不到它:

sina的namespace: http://www.sina.com

baidu的namespace:http://www.baidu.com

xmlns:sina="http://www.sina.com"

xmlns:baidu="http://www.baidu.com">

namespace的值可以任意,但是注意不要重复。一般默认的格式都是以url来作为namespace,比如 xmlns:android="http://schemas.android.com/apk/res/android。

Prefix(前缀)

sina:blog中 sina 就是前缀。

LocalName(本地名称)

sina:blog 中 blog就是localName。

QName(Qualified Name)

sina:blog就是QName,相当于前缀+":"+LocalName。

uri(不是url哈)

例如sina:blog的uri就是前缀sina的namespace,即"http://www.sina.com"。

2.sax解析localName与qName

sax simple API for XML,现在有两个版本,sax和sax2。

sax不支持LocalName、QName和uri。对于属性sina:blog="blog.sina.com",sax解析的结果是LocalName=QName="sina:blog",uri="",value="blog.sina.com"。

sax2支持LocalName、QName、uri。对于属性sina:blog="blog.sina.com",sax2解析的结果是LocalName="blog",QName="sina:blog",uri="",value="blog.sina.com"。

_______________________________________________________________________________________________________________________________________________________________________

测试:

TestSax.java

package com.siqi.xml;

import java.io.File;

import java.io.FileReader;

import javax.xml.parsers.SAXParser;

import javax.xml.parsers.SAXParserFactory;

import org.xml.sax.InputSource;

import org.xml.sax.XMLReader;

import org.xml.sax.helpers.XMLReaderFactory;

public class TestSax {

public static void main(String... args) {

try {

//Sax2解析XML文档

System.out.println("parse xml file use sax2");

SaxParseHandler sax2Handler = new SaxParseHandler();

XMLReader xmlReader = XMLReaderFactory.createXMLReader();

xmlReader.setContentHandler(sax2Handler);

xmlReader.setErrorHandler(sax2Handler);

FileReader fileReader = new FileReader("./src/sample.xml");

xmlReader.parse(new InputSource(fileReader));

//sax1解析XML文档

System.out.println("parse xml file use sax");

SaxParseHandler saxHandler = new SaxParseHandler();

SAXParser parser = SAXParserFactory.newInstance().newSAXParser();

File file = new File("./src/sample.xml");

parser.parse(file, saxHandler);

} catch (Exception e) {

// TODO Auto-generated catch block

e.printStackTrace();

}

}

}__________________________________________________________________________________________________________________________________________________________________________

SaxParseHandler.java

package com.siqi.xml;

import org.xml.sax.Attributes;

import org.xml.sax.SAXException;

import org.xml.sax.helpers.DefaultHandler;

/**

* 要用sax解析,需要实现一个ParseHandler

* @author siqi

*

*/

public class SaxParseHandler extends DefaultHandler{

/**

* 重写了DefaultHandler中的startElement函数,每解析到

* 一个元素(element)的时候都会触发这个函数,并且将这个element

* 的属性attributes和值value当作参数传进来。除了startElement,

* 还有startDocument,endDOucment,endElement,要根据需要

* 重写这些函数。

*/

@Override

public void startElement(String uri, String localName, String qName,

Attributes attributes) throws SAXException {

//打印element的基本信息,qName

System.out.println("Element qName : "+qName);

System.out.println("Element localName: "+localName);

System.out.println("Element uri : "+uri);

//打印element的所有属性attributes

for(int i=0; i

System.out.println("");

System.out.println(" attribute qName : "+attributes.getQName(i));

System.out.println(" attribute localName: "+attributes.getLocalName(i));

System.out.println(" attribute value : "+attributes.getValue(i));

System.out.println(" attribute uri : "+attributes.getURI(i));

}

System.out.println("");

super.startElement(uri, localName, qName, attributes);

}

}

sample.xml的内容最上面那个xml

执行结果:

parse xml file use sax2

Element qName : websites

Element localName: websites

Element uri :

Element qName : sina:website

Element localName: website

Element uri : http://www.sina.com

attribute qName : sina:blog

attribute localName: blog

attribute value : blog.sina.com

attribute uri : http://www.sina.com

Element qName : baidu:website

Element localName: website

Element uri : http://www.baidu.com

attribute qName : baidu:blog

attribute localName: blog

attribute value : hi.baidu.com

attribute uri : http://www.baidu.com

parse xml file use sax

Element qName : websites

Element localName:

Element uri :

attribute qName : xmlns:sina

attribute localName: xmlns:sina

attribute value : http://www.sina.com

attribute uri :

attribute qName : xmlns:baidu

attribute localName: xmlns:baidu

attribute value : http://www.baidu.com

attribute uri :

Element qName : sina:website

Element localName:

Element uri :

attribute qName : sina:blog

attribute localName: sina:blog

attribute value : blog.sina.com

attribute uri :

Element qName : baidu:website

Element localName:

Element uri :

attribute qName : baidu:blog

attribute localName: baidu:blog

attribute value : hi.baidu.com

attribute uri :

对于sax2,正确的解析出了qName,LocalName和uri。sax不能识别出前缀和uri,qName=localName。

第三,以JDOM的方式实现。

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

package xmls;

import org.jdom2.Attribute;

import org.jdom2.Document;

import org.jdom2.Element;

import org.jdom2.JDOMException;

import org.jdom2.input.JDOMParseException;

import org.jdom2.input.SAXBuilder;

import java.io.*;

import java.util.List;

/**

* Created by lenovo on 2017-6-2.

*/

public class JDOMTest {

public static void main(String[] args){

SAXBuilder saxBuilder = new SAXBuilder();

InputStream in;

try{

in = new FileInputStream(new File("src\\xmls\\book.xml"));

Document document = saxBuilder.build(in);

Element rootElement = document.getRootElement();

List bookList = rootElement.getChildren();

for(Element book: bookList){

System.out.println("第" + (bookList.indexOf(book)+1) + "本书!");

List attrs = book.getAttributes();

for(Attribute attr: attrs){

System.out.println(attr.getName() + "=" + attr.getValue());

}

for(Element item: book.getChildren()){

System.out.println(item.getName() + ":" + item.getValue());

}

System.out.println("------------------------------------");

}

}catch (FileNotFoundException e){

e.printStackTrace();

}catch (JDOMException e){

e.printStackTrace();

}catch (IOException e){

e.printStackTrace();

}

}

}

第四,以DOM4J的方式实现。

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

package xmls;

import org.dom4j.*;

import org.dom4j.io.OutputFormat;

import org.dom4j.io.SAXReader;

import org.dom4j.io.XMLWriter;

import java.io.File;

import java.io.FileOutputStream;

import java.io.IOException;

import java.util.Iterator;

import java.util.List;

/**

* Created by lenovo on 2017-6-2.

*/

public class DOM4JTest {

public void parseXML(){

SAXReader saxReader = new SAXReader();

try{

Document document = saxReader.read(new File("src\\xmls\\book.xml"));

Element rootElement = document.getRootElement();

Iterator it = rootElement.elementIterator();

while (it.hasNext()){

Element book = (Element)it.next();

List attrs = book.attributes();

for(Attribute attr: attrs){

System.out.println("属性名:" + attr.getName() + "---- 属性值:" + attr.getValue() );

}

Iterator cit = book.elementIterator();

while (cit.hasNext()){

Element child = (Element) cit.next();

System.out.println("子节点:" + child.getName());

}

}

}catch (DocumentException e){

e.printStackTrace();

}

}

public static void main(String[] args){

DOM4JTest dom4JTest = new DOM4JTest();

dom4JTest.parseXML();

}

}

以上这篇java读取XML文件的四种方法总结(必看篇)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。