Đây là cách đơn giản nhất để giải thích điều này. Đây là những gì tôi đang sử dụng:Trong Python, làm cách nào để tách một chuỗi và giữ các dấu tách?
re.split('\W', 'foo/bar spam\neggs')
-> ['foo', 'bar', 'spam', 'eggs']
Dưới đây là những gì tôi muốn:
someMethod('\W', 'foo/bar spam\neggs')
-> ['foo', '/', 'bar', ' ', 'spam', '\n', 'eggs']
Lý do là tôi muốn chia một chuỗi thành tokens, vận dụng nó, sau đó đưa nó trở lại với nhau một lần nữa.
những gì hiện '\ W' là viết tắt của? Tôi thất bại trên google nó. – Ooker
Một ký tự _non-word_ [xem tại đây để biết chi tiết] (https://docs.python.org/2/library/re.html#regular-expression-syntax) – Russell