现在基本所有的编程语言都支持中文,代码里默认是用unicode来处理字符串,所以中文和unicode是等价的,所以正则表达式中匹配中文可以用unicode码来代替
1、如果你想匹配特定的中文,比如 :你好,你可以直接用中文 你好来匹配
比如想匹配 hello你好 中的你好两个中文,可以写成
你好
也可以把你好先转换成unicode码
\u4f60\u597d
上面两种是等价的
2、但是你想匹配出一段文本中的所有中文字符,就只能用unicode码了,因为你无法穷尽所有的中文
[\u4e00-\u9fa5]+
如果报错,把\转义就可以了
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。