原文链接:http://outofmemory.cn/code-snippet/2092/usage-golang-regular-expression-regexp-quchu-HTML-CSS-SCRIPT-code-jin-maintain-page-wenzi
package main import ( "fmt""io/ioutil""net/http""regexp""strings" ) func main(){ resp, err := http.Get("http://www.baidu.com" // resp,err := http.Get("http://www.163.com") if!= nil fmtPrintln"http get error." } defer respBodyClose body ioutilReadAllresp "http read error" src stringbody //将HTML标签全转换成小写 re _ regexpCompile"\\<[\\S\\s]+?\\>" src = reReplaceAllStringFuncsrc stringsToLower//去除STYLE "\\<style[\\S\\s]+?\\</style\\>"ReplaceAllString ""//去除SCRIPT "\\<script[\\S\\s]+?\\</script\\>"//去除所有尖括号内的HTML代码,并换成换行符 "\n"//去除连续的换行符 "\\s{2,}" fmtstringsTrimSpace))}
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。