使用
PHP检测文件的MIME类型是微不足道的 – 只需在Unix机器上使用PEAR的
MIME_Type软件包,PHP的
fileinfo或调用文件-i即可.
这对于二进制文件以及具有某种“魔术字节”的所有其他文件非常有效,通过它们可以轻松地检测到它们.
这对于二进制文件以及具有某种“魔术字节”的所有其他文件非常有效,通过它们可以轻松地检测到它们.
我失败的是检测纯文本文件的正确MIME类型:
> CSS
>差异
> INI(配置)
> Javascript
> rST
> SQL
所有这些都被标识为“text / plain”,这是正确的,但对我来说太不明确了.我需要真正的类型,即使花费一些时间来分析文件内容.
所以我的问题:有哪些解决方案来检测此类纯文本文件的MIME类型?任何图书馆?代码片段?
请注意,我既没有文件名也没有文件扩展名,但我有文件内容.
如果我使用ruby,我可以集成github’s linguist. Ohloh的ohcount是用C编写的,但有一个命令行工具来检测类型:ohcount -d $file
我试过的
ohcount
正确检测xml和php文件,其他所有文件都没有.
阿帕奇蒂卡
检测xml和html,所有其他测试文件只被视为text / plain.
我认为Apache Tika的魔法检测可以帮助你:
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。