Tôi đang cố gắng đối sánh và xóa tất cả các từ trong danh sách khỏi chuỗi bằng regex được biên dịch nhưng tôi đang cố gắng tránh các lần xuất hiện trong từ.Xóa tất cả các lần xuất hiện của chuỗi trong một chuỗi từ danh sách python
hiện tại:
REMOVE_LIST = ["a", "an", "as", "at", ...]
remove = '|'.join(REMOVE_LIST)
regex = re.compile(r'('+remove+')', flags=re.IGNORECASE)
out = regex.sub("", text)
Trong: "Các cáo nâu nhanh chóng nhảy qua một con kiến"
Out: "con cáo nâu nhanh chóng nhảy qua t"
mong đợi: "con cáo màu nâu nhanh chóng nhảy qua"
Tôi đã thử thay đổi chuỗi để biên dịch thành những nội dung sau nhưng không có kết quả:
regex = re.compile(r'\b('+remove+')\b', flags=re.IGNORECASE)
Bất kỳ đề xuất nào hoặc tôi thiếu điều gì đó rõ ràng rõ ràng?
lẽ 'ant' là một phần của bạn xóa danh sách? –