C#使用正则表达式过滤html标签

发布时间:2019-07-11 发布网站:脚本之家
脚本之家收集整理的这篇文章主要介绍了C#使用正则表达式过滤html标签脚本之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。

在项目中遇到这样一个需求,需要将一段html转换为一般文本返回,万能的正则表达式来了。

正则表达式来拯救你,代码如下:

public static string Html2Text(string htmlStr)
{
if (String.IsNullOrEmpty(htmlStr))
{
return "";
}
string regEx_style = "<style[^>]*?>[\\s\\S]*?<\\/style>"; //定义style的正则表达式 
string regEx_script = "<script[^>]*?>[\\s\\S]*?<\\/script>"; //定义script的正则表达式 
string regEx_html = "<[^>]+>"; //定义HTML标签的正则表达式 
htmlStr = Regex.Replace(htmlStr,regEx_style,"");//删除css
htmlStr = Regex.Replace(htmlStr,regEx_script,"");//删除js
htmlStr = Regex.Replace(htmlStr,regEx_html,"");//删除html标记
htmlStr = Regex.Replace(htmlStr,"\\s*|\t|\r|\n","");//去除tab、空格、空行
htmlStr = htmlStr.Replace(" ","");
htmlStr = htmlStr.Replace(""","");//去除异常的引号" " "
htmlStr = htmlStr.Replace(""","");
return htmlStr.Trim();
}

以上所述是小编给大家介绍的C#使用正则表达式过滤html标签 ,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对编程小技巧网站的支持!

总结

以上是脚本之家为你收集整理的C#使用正则表达式过滤html标签全部内容,希望文章能够帮你解决C#使用正则表达式过滤html标签所遇到的程序开发问题。

如果觉得脚本之家网站内容还不错,欢迎将脚本之家网站推荐给程序员好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:76874919,请注明来意。

脚本之家官方公众号

微信公众号搜索 “ 程序精选 ” ,选择关注!

微信公众号搜索 “ 程序精选 ” ,选择关注!
精选程序员所需精品干货内容!

标签: