解决方法
我正在寻找一个与我的任务相关的解决方案,我想将word文件转换为文本文件.
我在一些谷歌搜索后遇到这个问题,根据@TJD的答案,我去了link,从那里我发现了this link.
对于我的要求,因为我需要将文件文件转换为文本文件.我以第二个链接为我的解决方案.
由于docx文件是使用Open XML File格式创建的,因此我在此提到我需要解压缩docx文件,考虑到它的zip.
对于Zip / Unzip,谷歌提供code here.根据wikipedia link解压缩文档目录中的docx文件,根目录中有三个目录和一个xml文件.
对于我的解决方案,我选择文本目录中提到的文件原始内容(我没有进入任何其他目录或文件到目前为止).您的提取路径字段/ doctment.xml下有一个文件,这是您的docx文件内容以xml格式放置的位置.
这个xml文件中有很多可用的标签,我现在不知道这些文本的含义,但是在查看了xml文件后,我发现包含我的文本的标签是w:t.
之后,每件事都像蛋糕.我刚刚使用NSXMLParser,并解析了定位到w:t标签的xml文件中的数据,我得到了我的整个字符串.
注意:一旦我了解其他文件和标签,我将更新我的答案.同样,这个解决方案不能用于doc文件,因为我知道在MSOffice 2007中引入了OpenXMLFile格式,所以我也将更新我的doc文件解决方案的答案.
我知道这是不够的,它不包括创建文件文件等.但我希望这将有助于我们很多.
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。