每当我看到一个可由其他人共享的问题时,通过一个有趣的解决方案,它通常已经解决了.我认为最好在我深入编码之前停止自己并进行搜索.
情况如下:
您可以将office文档的各个部分复制并粘贴到visual studio HTML编辑器中.问题是,它创建了如下所示的HTML文本:
<tr style="mso-yfti-irow:0;mso-yfti-firstrow:yes"> <td style="border:solid windowtext 1.0pt;mso-border-alt:solid windowtext .5pt; padding:0cm 5.4pt 0cm 5.4pt" valign="top"> <p align="left" class="MsoNormal" style="text-align:left;tab-stops:center 216.0pt right 432.0pt"> <b style="mso-bidi-font-weight:normal"><span lang="EN-US">ID<o:p></o:p></span></b></p> </td> <td style="border:solid windowtext 1.0pt;border-left:none; mso-border-left-alt:solid windowtext .5pt;mso-border-alt:solid windowtext .5pt; padding:0cm 5.4pt 0cm 5.4pt" valign="top">
很适合机器,但这不是人类可读的.
我敢打赌,可以通过查找重复样式并从中创建CSS类来清除它.计算机程序可以很容易地做到这一点.
我可以运行这个程序,然后我会看起来很好看,易于维护的HTML看起来就像我的Word文档.
(是的,我知道我可以编辑我的Word文档,然后将其复制并粘贴到HTML中,或者只是将其保存为HTML文件.但它与事后手动编辑它不一样) .
无论如何,有没有人知道这样做的程序?
(后来编辑)我发现我问的问题是this one的副本.
解决方法
HTML Tidy这样做!它还与常见的文本编辑器(如Notepad或UltraEdit)集成,并提供清理Office Web标记的选项.您需要设置
word-2000
boolean flag to true
此外,杰夫阿特伍德已经发表了关于这个问题的博客,并提出了他自己的C#2.0解决方案in this article.
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。