Tôi muốn chuyển đổi một số văn bản bao gồm một số dấu chấm câu và các ký hiệu toàn chiều rộng sang văn bản thuần túy của Trung Quốc.Cách lọc tiếng Trung (CHỈ tiếng Trung)
maybe_re = re.compile("xxxxxxxxxxxxxxxxx") #TODO
print "".join(maybe_re.findall("你好,这只是一些中文文本..,.,全角"))
# I want out
你好这只是一些中文文本全角
tks, nhưng python thường xuyên hỗ trợ danh mục unicode? – Dreampuf
@Dreampuf: cụm từ thông dụng? Không xa như tôi biết. Nhưng bạn có thể sử dụng ''' .join (c cho c trong s nếu unicodedata.category (c) .startswith ('L'))' –
cảm ơn bạn! bạn đúng rồi! – Dreampuf