如何在Python3中进行.decode(字符串转义)?

How do I .decode(#39;string-escape#39;) in Python 3?(如何在Python3中进行.decode(字符串转义)?)

本文介绍了如何在Python3中进行.decode(字符串转义)?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我有一些需要取消转义的转义字符串。我想用Python语言完成这项工作。

例如,在Python2.7中,我可以这样做:

>>> "\123omething special".decode('string-escape')
'Something special'
>>> 

如何在Python3中做到这一点?这不起作用:

>>> b"\123omething special".decode('string-escape')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
LookupError: unknown encoding: string-escape
>>> 

我的目标是能够接受这样的字符串:

s00u00p00p00o00r00t00@00p00s00i00l00o00c00.00c00o00m00

并将其转换为:

"support@psiloc.com"

在进行转换后,我将检查我拥有的字符串是以UTF-8还是UTF-16编码的。

推荐答案

如果您希望str-to-str解码,则输入和输出都是unicode:

def string_escape(s, encoding='utf-8'):
    return (s.encode('latin1')         # To bytes, required by 'unicode-escape'
             .decode('unicode-escape') # Perform the actual octal-escaping decode
             .encode('latin1')         # 1:1 mapping back to bytes
             .decode(encoding))        # Decode original encoding

测试:

>>> string_escape('\123omething special')
'Something special'

>>> string_escape(r's00u00p00p00o00r00t00@'
                  r'00p00s00i00l00o00c00.00c00o00m00',
                  'utf-16-le')
'support@psiloc.com'

这篇关于如何在Python3中进行.decode(字符串转义)?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!

本文标题为:如何在Python3中进行.decode(字符串转义)?