这是用Java进行XML解析的最佳库

如何解决这是用Java进行XML解析的最佳库

实际上,Java支持4种开箱即用地解析XML的方法

DOM解析器/构建器:整个XML结构都已加载到内存中,你可以使用众所周知的DOM方法进行处理。DOM还允许你使用Xslt转换来写文档。例:

public static void parse() throws ParserConfigurationException, IOException, SAXException {
    DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
    factory.setValidating(true);
    factory.setIgnoringElementContentWhitespace(true);
    DocumentBuilder builder = factory.newDocumentBuilder();
    File file = new File("test.xml");
    Document doc = builder.parse(file);
    // Do something with the document here.
}

SAX Parser:仅读取XML文档。Sax解析器贯穿文档并调用用户的回调方法。存在用于文档的开始/结束,元素等的方法。它们是在org.xml.sax.ContentHandler中定义的,并且有一个空的帮助程序类DefaultHandler。

public static void parse() throws ParserConfigurationException, SAXException {
    SAXParserFactory factory = SAXParserFactory.newInstance();
    factory.setValidating(true);
    SAXParser saxParser = factory.newSAXParser();
    File file = new File("test.xml");
    saxParser.parse(file, new ElementHandler());    // specify handler
}

StAx读取器/写入器:与面向数据流的接口一起使用。程序会在准备好时要求下一个元素,就像游标/迭代器一样。你也可以使用它创建文档。阅读文件

public static void parse() throws XMLStreamException, IOException {
    try (FileInputStream fis = new FileInputStream("test.xml")) {
        XMLInputFactory xmlInFact = XMLInputFactory.newInstance();
        XMLStreamReader reader = xmlInFact.createXMLStreamReader(fis);
        while(reader.hasNext()) {
            reader.next(); // do something here
        }
    }
}

撰写文件

public static void parse() throws XMLStreamException, IOException {
    try (FileOutputStream fos = new FileOutputStream("test.xml")){
        XMLOutputFactory xmlOutFact = XMLOutputFactory.newInstance();
        XMLStreamWriter writer = xmlOutFact.createXMLStreamWriter(fos);
        writer.writeStartDocument();
        writer.writeStartElement("test");
        // write stuff
        writer.writeEndElement();
    }
}

JAXB:读取XML文档的最新实现:是v2中Java 6的一部分。这使我们可以序列化文档中的Java对象。你使用一个实现了javax.xml.bind.Unmarshaller的接口的类来阅读文档(你可以从JAXBContext.newInstance中获得一个用于该类的类)。必须使用使用的类来初始化上下文,但是你只需要指定根类,而不必担心静态引用的类。你可以使用注释来指定哪些类应该是元素(@XmlRootElement),哪些字段应该是元素(@XmlElement)或属性(@XmlAttribute,这真是个惊喜!)

public static void parse() throws JAXBException, IOException {
    try (FileInputStream adrFile = new FileInputStream("test")) {
        JAXBContext ctx = JAXBContext.newInstance(RootElementClass.class);
        Unmarshaller um = ctx.createUnmarshaller();
        RootElementClass rootElement = (RootElementClass) um.unmarshal(adrFile);
    }
}

撰写文件

public static void parse(RootElementClass out) throws IOException, JAXBException {
    try (FileOutputStream adrFile = new FileOutputStream("test.xml")) {
        JAXBContext ctx = JAXBContext.newInstance(RootElementClass.class);
        Marshaller ma = ctx.createMarshaller();
        ma.marshal(out, adrFile);
    }
}

从一些旧的演讲幻灯片中无耻地复制了示例;-)

编辑:关于“我应该使用哪个API?”。好吧,这取决于-并非所有API都具有与你看到的功能相同的功能,但是如果你可以控制用于映射XML文档的类,那么JAXB是我个人最喜欢的,非常优雅和简单的解决方案(尽管我没有将其用于非常大的文档,可能会有点复杂)。SAX也非常易于使用,如果你没有充分的理由使用它,那就不要使用DOM-我认为旧的,笨拙的API。我认为没有任何现代的第三方库具有STL所缺少的任何特别有用的功能,并且标准库具有通常的优点,即它们经过了严格的测试,记录和稳定。

解决方法

我正在搜索Java库以解析XML(复杂的配置和数据文件),我用Google搜索了一下,但除了dom4j之外都找不到(似乎他们正在V2上工作)。不喜欢它,其他有关XML的Apache项目似乎处于hibernate状态。我还没有独自评估dom4j,只是想知道-Java是否有其他(良好)开源xml解析库?您对dom4j的体验如何?

在@Voo回答之后,让我再问一个-我应该使用Java的内置类还是诸如dom4j之类的任何第三方库。优点是什么?

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?
Java在半透明框架/面板/组件上重新绘画。
Java“ Class.forName()”和“ Class.forName()。newInstance()”之间有什么区别?
在此环境中不提供编译器。也许是在JRE而不是JDK上运行?
Java用相同的方法在一个类中实现两个接口。哪种接口方法被覆盖?
Java 什么是Runtime.getRuntime()。totalMemory()和freeMemory()?
java.library.path中的java.lang.UnsatisfiedLinkError否*****。dll
JavaFX“位置是必需的。” 即使在同一包装中
Java 导入两个具有相同名称的类。怎么处理?
Java 是否应该在HttpServletResponse.getOutputStream()/。getWriter()上调用.close()?
Java RegEx元字符(。)和普通点?