Tôi gặp sự cố khi lặp qua chuỗi unicode, ký tự theo ký tự, với python.Lặp lại thông qua chuỗi unicode trong Python
print "w: ",word
for c in word:
print "word: ",c
Đây là đầu ra của tôi
w: 文本
word: ?
word: ?
word: ?
word: ?
word: ?
word: ?
đầu ra của tôi mong muốn là:
文
本
Khi tôi sử dụng len (word) tôi nhận được 6. Rõ ràng mỗi nhân vật là 3 khối unicode.
Vì vậy, chuỗi unicode của tôi được lưu trữ thành công trong biến, nhưng tôi không thể lấy các ký tự ra ngoài. Tôi đã thử sử dụng mã hóa ('utf-8'), giải mã ('utf-8) và codec nhưng vẫn không thể nhận được bất kỳ kết quả tốt nào. Điều này có vẻ như là một vấn đề đơn giản nhưng khó chịu cho tôi.
Hy vọng ai đó có thể chỉ cho tôi đúng hướng.
Cảm ơn!
Cảm ơn nhận xét của bạn! Tuy nhiên tôi vẫn nhận được một lỗi "'ascii' codec không thể mã hóa ký tự u '\ u5f02' ở vị trí 0: thứ tự không nằm trong phạm vi (128)". Nó có thể là tập tin của tôi không được đọc là unicode ở nơi đầu tiên? Tôi đang sử dụng dòng mã này để đọc tệp: fileContent = codecs.open ('fileName.txt,' UTF-8 '). Đọc() – charpi
@charpi lỗi gì? –
edited :) Cảm ơn – charpi