如何解决Python:如何将utf-8代码字符串转换回字符串?
我想这就是你想要的。它不是UTF-8字节字符串(从技术上讲是这样,但这仅是因为ASCII是UTF-8的子集)。
>>> s='\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5'
>>> print s.decode('unicode-escape')
欢迎提交微博搜索使用反馈,请直接
仅供参考,这是UTF-8:
>>> s.decode('unicode-escape').encode('utf8')
’\ xe6 \ xac \ xa2 \ xe8 \ xbf \ x8e \ xe6 \ x8f \ x90 \ xe4 \ xba \ xa4 \ xe5 \ xbe \ xae \ xae \ xe5 \ x8d \ x9a \ xe6 \ x90 \ x90 \ x9c \ xe7 \ xb4 \ xa2 \ xe4 \ xbd \ xbf \ xe7 \ x94 \ xa8 \ xe5 \ x8f \ x8d \ xe9 \ xa6 \ x88 \ xef \ xbc \ x8c \ xe8 \ xaf \ xb7 \ xe7 \ x9b \ xb4 \ xe6 \ x8e \ xa5’
解决方法
我正在使用Python,不幸的是,我的代码需要将代表字符串的utf-8代码的字符串转换为原始字符串,例如:
我从其他代码获得的UTF-8代码字符串:
\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5
我需要将其转换回原始字符串。怎么做?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。