XML,HTML和XHTML文档的有效内容类型

XML,HTML和XHTML文档的内容类型是什么?

我需要写一个简单的爬虫,只抓取这些类型的文件。

现在http://somedomain.com/index.html可以提供一个JPEG文件,由于mod_rewrite,所以我需要检查内容类型从响应头,并将其与允许的内容类型的列表进行比较。

我在哪里可以得到这样的列表?

HTML:text / html,全停。

XHTML:application / xhtml xml,或者仅当遵循HTML兼容性指南,text / html。参见W3 Media Types Note

XML:text / xml,application / xml(RFC 2376)。

还有许多基于XML的其他媒体类型,例如application / rss xml或image / svg xml。这是一个安全的赌注,任何无法识别但注册结束于xml是基于XML。对于以xml结尾的注册媒体类型,请参阅IANA list

(对于未注册的x类型,所有投注都关闭,但你希望xml将被尊重。)

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


php输出xml格式字符串
J2ME Mobile 3D入门教程系列文章之一
XML轻松学习手册
XML入门的常见问题(一)
XML入门的常见问题(三)
XML轻松学习手册(2)XML概念
xml文件介绍及使用
xml编程(一)-xml语法
XML文件结构和基本语法
第2章 包装类
XML入门的常见问题(二)
Java对象的强、软、弱和虚引用
JS解析XML文件和XML字符串详解
java中枚举的详细使用介绍
了解Xml格式
XML入门的常见问题(四)
深入SQLite多线程的使用总结详解
PlayFramework完整实现一个APP(一)
XML和YAML的使用方法
XML轻松学习总节篇