Tôi có một số chuỗi thoát mà không cần thoát. Tôi muốn làm điều này bằng Python.làm thế nào để tôi .decode ('string-escape') trong Python3?
Ví dụ, trong python2.7 tôi có thể làm điều này:
>>> "\123omething special".decode('string-escape')
'Something special'
>>>
Làm thế nào để làm điều đó trong Python3? Điều này không làm việc:
>>> b"\123omething special".decode('string-escape')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
LookupError: unknown encoding: string-escape
>>>
Mục tiêu của tôi là trở thành abel để có một chuỗi như thế này:
s\000u\000p\000p\000o\000r\000t\[email protected]\000p\000s\000i\000l\000o\000c\000.\000c\000o\000m\000
Và biến nó thành:
"[email protected]"
Sau khi tôi làm việc chuyển đổi , Tôi sẽ thăm dò xem chuỗi tôi có được mã hóa bằng UTF-8 hay UTF-16.
Hãy thử điều này:. 'Byte ("\ 123omething đặc biệt", "utf-8") giải mã ("unicode_escape") ' –
Bạn có hoàn toàn chắc chắn đó là những thoát và không byte đen? –
Chúng là các byte chữ!Có một dấu gạch chéo ngược, sau đó là 0, sau đó một 0, sau đó một thứ ba 0 ... Tôi có một chương trình đọc một tập tin nhị phân và kết quả đầu ra thông tin như thế này. Nó xuất ra tệp nhị phân thực sự có trong tệp. Đôi khi nội dung của tập tin được mã hóa UTF-8 và nó chỉ đi qua. Nhưng nếu nó không phải là hợp lệ UTF-8 nó được mã hóa theo cách này. – vy32