如何解决将所有字符[0-9A-Za-z除外]转换为HTML小数实体
我是Python的新手,但是使用PHP已有一段时间了。我正在寻找一种将所有字符([0-9A-Za-z ]
除外)转换为“ HTML小数实体”的方法。我一直在搜索,尚未找到合适的方法。我正在寻找Python中this PHP method的副本。
我找到的最接近的方法是Python中的方法,但它们不排除[0-9A-Za-z ]
:Python3 Convert all characters to HTML Entities和How can I escape *all* characters into their corresponding html entity names and numbers in Python?
就像PHP方法一样,我想要一个可以将除[0-9A-Za-z ]
之外的每个字符(当前和将来)转换为“ HTML十进制实体”并且假定使用UTF-8字符编码的函数。
例如"abcABC123 &%¤#"
将成为"abcABC123 &%¤#"
解决方法
所以我想到了这一点作为选择方法。
import re
def html_entity_encode_all(string):
return ''.join(['&#{0};'.format(ord(char)) if re.search("[^0-9A-Za-z ]",char) else char for char in string])
print(html_entity_encode_all('abcABC123 &%¤#'))
输出:abcABC123 &%¤#
但是,我不知道是否有更好的方法或更快的处理方法。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。